哈希表(散列查找)(c/c++)

通过哈希表进行查找的特点是:不需要比较关键字,而是通过哈希函数计算出关键字的位置。一般来讲,为了进行高效率的查找,要求哈希函数简单均匀、空间利用率高、关键字之间的冲突少。

关于散列查找的实现需要着重考虑两个问题:1,散列函数的设计    2,解决冲突问题
函数构造方法

常用的方法有:
1,直接定址法:H(key)=axkey+b,特点:简单、无冲突,但造成存储空间浪费
2,数字分析法 3,平方取中法 4,折叠法 5,随机数法
6,除留余数法:H(key)=key%p,p一般取小于等于表长的质数,表长用m来表示,存储元素的个数用n来表示
因为除留余数法最为常用,下面以除留余数法来介绍解决冲突的方法

冲突的解决

冲突:如果有多个关键字通过哈希函数所计算出的结果相同,则称这些关键字互相冲突,并将这些关键字称为同义词
1,开放定址法: Hi=(H(key)+di)%n,i=1,2,3…n-1 di表示第i次冲突的增量,Hi为第i次冲突后应探测的地址
a,线性探测再散列:增量为,d1=1,d2=2,d3=3,… 特点,空间利用率高,但容易发生聚集现象
b,二次探测再散列:增量为,d1=1,d2=-1,d3=4,d4=-4,d5=9,d6=-9,…分别为正负1,2,3,4…的平方
c,伪随机数探测再散列:增量di为伪随机数
2,链地址法(拉链法):
假设对n个数的哈希函数为H(key)=key%p。建立数组array[p],数组下标分别对应所计算出的哈希值,将每个数存储在它对应的位置上。若发生冲突的话,将该冲突的数挂在它的同义词后面(类似于图的邻接表存储)
3,再哈希法:再设计一个哈希函数来解决冲突

平均查找长度(ASL)

散列查找理论上平均查找长度为常数1,即ASL=1,但由于冲突,所以ASL总是大于1的。引入装填因子α,α=元素个数/表长=n/m。
1,开放定址法
其中以线性探测在散列为例:
它的平均查找长度,ASL(平均)=(1+1/(1-α))/2
ASL(成功)=(每个元素查找成功的比较次数相加)/元素个数
ASL(失败)=(每个元素查找失败的比较次数相加)/p
对于表长m=14,元素个数n=11,哈希函数为H(key)=key%13,其中p=13的哈希表:

下标 0 1 2 3 4 5 6 7 8 9 10 11 12 13
元素 \ 1 2 3 4 5 6 7 8 9 10 11 \

ASL(成功)=(1+1+…+1)/11=1
ASL(失败)=(1+12+11+…+3+2)/13=6
2,链地址法
ASL(平均)=1+α/2
ASL(成功)=(每个元素查找成功的比较次数相加)/元素个数
ASL(失败)=(每个元素查找失败的比较次数相加)/p
对于下图:
哈希表(散列查找)(c/c++)_第1张图片
元素个数n=12,哈希函数为H(key)=key%11,其中p=11。
ASL(成功)=(6x1+4x2+3+4)/12=7/4
ASL(失败)=(4+2x3+1+1)/11=12/11(其中和空结点比较的次数计为0)

你可能感兴趣的:(数据结构与算法)