• 冲突的处理方法


    • 处理冲突的方法

    常用处理冲突的思路:

    换个位置:开放地址法

    同一个位置的冲突对象组织在一起:链地址法

    • 开放定址法(Open Addressing)

    一旦产生了冲突(该地址已有其他元素),就按某种规则去寻找另一空地址。

    开放定址法

    若发生了第i次冲突,试探的下一个地址将增加di,基本公式是:

    hi(key) = (h(key)+dj) mod TableSize (1≤i<TableSize)

    dj决定了不同的解决冲突方案:线性探测、平方探测、双散列。

    #define MAXTABLESIZE 100000 /* 允许开辟的最大散列表长度 */
    typedef int ElementType;    /* 关键词类型用整型 */
    typedef int Index;          /* 散列地址类型 */
    typedef Index Position;     /* 数据所在位置与散列地址是同一类型 */
    /* 散列单元状态类型,分别对应:有合法元素、空单元、有已删除元素 */
    typedef enum { Legitimate, Empty, Deleted } EntryType;
     
    typedef struct HashEntry Cell; /* 散列表单元类型 */
    struct HashEntry{
        ElementType Data; /* 存放元素 */
        EntryType Info;   /* 单元状态 */
    };
     
    typedef struct TblNode *HashTable; /* 散列表类型 */
    struct TblNode {   /* 散列表结点定义 */
        int TableSize; /* 表的最大长度 */
        Cell *Cells;   /* 存放散列单元数据的数组 */
    };
     
    int NextPrime( int N )
    { /* 返回大于N且不超过MAXTABLESIZE的最小素数 */
        int i, p = (N%2)? N+2 : N+1; /*从大于N的下一个奇数开始 */
     
        while( p <= MAXTABLESIZE ) {
            for( i=(int)sqrt(p); i>2; i-- )
                if ( !(p%i) ) break; /* p不是素数 */
            if ( i==2 ) break; /* for正常结束,说明p是素数 */
            else  p += 2; /* 否则试探下一个奇数 */
        }
        return p;
    }
     
    HashTable CreateTable( int TableSize )
    {
        HashTable H;
        int i;
     
        H = (HashTable)malloc(sizeof(struct TblNode));
        /* 保证散列表最大长度是素数 */
        H->TableSize = NextPrime(TableSize);
        /* 声明单元数组 */
        H->Cells = (Cell *)malloc(H->TableSize*sizeof(Cell));
        /* 初始化单元状态为“空单元” */
        for( i=0; i<H->TableSize; i++ )
            H->Cells[i].Info = Empty;
     
        return H;
    }

    1.线性探测法(Linear Probing)

    • 线性探测法:以增量序列1,2,......,(TableSize-1)循环试探下一个存储地址。

    设关键词序列为{47, 7, 29, 11, 9, 84, 54, 20, 30},

    散列表表长TableSize = 13(装填因子α = 9/13≈ 0.69);

    散列函数为:h(key) = key mod 11。

    用线性探测法处理冲突,列出一次插入后的散列表,并估算查找性能

    散列表查找性能分析

    • 成功平均查找长度(ASLs)
    • 不成功平均查找长度(ASLu)

    2.平方探测法(Quadratic Probing)--- 二次探测

    平方探测法:以增量序列12,-12, 22, -22, ......, q2, -q2且q ≤ [ TableSize/2 ] 循环试探洗一个存储地址。

    是否有空间,平方探测就能找得到?

    有定理显示:如果散列表长度TableSize是某个4k+3(k是正整数)形式的素数时,平方探测法就可以探查到整个散列表空间。

    Position Find( HashTable H, ElementType Key )
    {
        Position CurrentPos, NewPos;
        int CNum = 0; /* 记录冲突次数 */
     
        NewPos = CurrentPos = Hash( Key, H->TableSize ); /* 初始散列位置 */
        /* 当该位置的单元非空,并且不是要找的元素时,发生冲突 */
        while( H->Cells[NewPos].Info!=Empty && H->Cells[NewPos].Data!=Key ) {
                                               /* 字符串类型的关键词需要 strcmp 函数!! */
            /* 统计1次冲突,并判断奇偶次 */
            if( ++CNum%2 ){ /* 奇数次冲突 */
                NewPos = CurrentPos + (CNum+1)*(CNum+1)/4; /* 增量为+[(CNum+1)/2]^2 */
                if ( NewPos >= H->TableSize )
                    NewPos = NewPos % H->TableSize; /* 调整为合法地址 */
            }
            else { /* 偶数次冲突 */
                NewPos = CurrentPos - CNum*CNum/4; /* 增量为-(CNum/2)^2 */
                while( NewPos < 0 )
                    NewPos += H->TableSize; /* 调整为合法地址 */
            }
        }
        return NewPos; /* 此时NewPos或者是Key的位置,或者是一个空单元的位置(表示找不到)*/
    }
     
    bool Insert( HashTable H, ElementType Key )
    {
        Position Pos = Find( H, Key ); /* 先检查Key是否已经存在 */
     
        if( H->Cells[Pos].Info != Legitimate ) { /* 如果这个单元没有被占,说明Key可以插入在此 */
            H->Cells[Pos].Info = Legitimate;
            H->Cells[Pos].Data = Key;
            /*字符串类型的关键词需要 strcpy 函数!! */
            return true;
        }
        else {
            printf("键值已存在");
            return false;
        }
    }

    3.双散列探测法(Double Hashing)

    双散列探测法:di为i*h2(key),h2(key)是另一个散列函数探测序列成:h2(key), 2h2(key),3h2(key), ......

    • 对任意的key,h2(key) ≠ 0!
    • 探测序列还应该保证所有的散列存储单元都应该能够被探测到。选择一下形式有良好的效果:

      h2(key) = p - (key mod p)

    其中:p < TableSize, p、TableSize都是素数。

    4.再散列

    • 当散列表元素太多(即装填因子α太大)时,查找效率会下降;

    实用最大装填因子一般取0.5≤α≤0.85

    • 当装填因子过大时,解决的方法是加倍扩大散列表,这个过程叫做“再散列(Rehashing)”

    分离链接法(Separate Chaining)

    将响应位置上冲突的所有关键词存储在同一个单链表中

    #define KEYLENGTH 15                   /* 关键词字符串的最大长度 */
    typedef char ElementType[KEYLENGTH+1]; /* 关键词类型用字符串 */
    typedef int Index;                     /* 散列地址类型 */
    /******** 以下是单链表的定义 ********/
    typedef struct LNode *PtrToLNode;
    struct LNode {
        ElementType Data;
        PtrToLNode Next;
    };
    typedef PtrToLNode Position;
    typedef PtrToLNode List;
    /******** 以上是单链表的定义 ********/
     
    typedef struct TblNode *HashTable; /* 散列表类型 */
    struct TblNode {   /* 散列表结点定义 */
        int TableSize; /* 表的最大长度 */
        List Heads;    /* 指向链表头结点的数组 */
    };
     
    HashTable CreateTable( int TableSize )
    {
        HashTable H;
        int i;
     
        H = (HashTable)malloc(sizeof(struct TblNode));
        /* 保证散列表最大长度是素数,具体见代码5.3 */
        H->TableSize = NextPrime(TableSize);
     
        /* 以下分配链表头结点数组 */
        H->Heads = (List)malloc(H->TableSize*sizeof(struct LNode));
        /* 初始化表头结点 */
        for( i=0; i<H->TableSize; i++ ) {
             H->Heads[i].Data[0] = '';
             H->Heads[i].Next = NULL;
        }
     
        return H;
    }
     
    Position Find( HashTable H, ElementType Key )
    {
        Position P;
        Index Pos;
         
        Pos = Hash( Key, H->TableSize ); /* 初始散列位置 */
        P = H->Heads[Pos].Next; /* 从该链表的第1个结点开始 */
        /* 当未到表尾,并且Key未找到时 */ 
        while( P && strcmp(P->Data, Key) )
            P = P->Next;
     
        return P; /* 此时P或者指向找到的结点,或者为NULL */
    }
     
    bool Insert( HashTable H, ElementType Key )
    {
        Position P, NewCell;
        Index Pos;
         
        P = Find( H, Key );
        if ( !P ) { /* 关键词未找到,可以插入 */
            NewCell = (Position)malloc(sizeof(struct LNode));
            strcpy(NewCell->Data, Key);
            Pos = Hash( Key, H->TableSize ); /* 初始散列位置 */
            /* 将NewCell插入为H->Heads[Pos]链表的第1个结点 */
            NewCell->Next = H->Heads[Pos].Next;
            H->Heads[Pos].Next = NewCell; 
            return true;
        }
        else { /* 关键词已存在 */
            printf("键值已存在");
            return false;
        }
    }
     
    void DestroyTable( HashTable H )
    {
        int i;
        Position P, Tmp;
         
        /* 释放每个链表的结点 */
        for( i=0; i<H->TableSize; i++ ) {
            P = H->Heads[i].Next;
            while( P ) {
                Tmp = P->Next;
                free( P );
                P = Tmp;
            }
        }
        free( H->Heads ); /* 释放头结点数组 */
        free( H );        /* 释放散列表结点 */
    }
    无欲速,无见小利。欲速,则不达;见小利,则大事不成。
  • 相关阅读:
    转:gpio_direction_output 与 gpio_set_value
    转:gpio_request
    转: 静态模式makefile中$(cobjs): $(obj)/%.o: $(src)/%.c
    转:misc_register、 register_chrdev 的区别总结
    转:aptitude 命令详解
    转:Ubuntu12.04 LTS 使用心得-开机挂载其他分区
    转:大端模式和小段模式简述
    转:C++中 #ifdef 和#endif的作用
    转:FIFO和DMA
    Camera Link 信号源板卡学习资料第153篇: 基于Sprtan6的Full(Base) Camera Link 信号源
  • 原文地址:https://www.cnblogs.com/ch122633/p/9062827.html
Copyright © 2020-2023  润新知