哈希冲突与解决哈希冲突的两种方法

哈希冲突与解决哈希冲突的两种方法

  • 1、哈希冲突
  • 2、解决哈希冲突的方法
    • (1)链接法
    • (2)开放寻址法
      • ①线性探查
      • ②二次探查
      • ③双重探查

注:本文注重对解决哈希冲突方法的介绍,而非对背后原理的介绍。

1、哈希冲突

当两个不同的数经过哈希函数计算后得到了同一个结果,即他们会被映射到哈希表的同一个位置时,即称为发生了哈希冲突。
在此我们不对哈希冲突的危害进行过多的描述,本文的重点是通俗的介绍解决哈希冲突的几种方法。

2、解决哈希冲突的方法

解决哈希冲突的方法主要有链接法与开放寻址法。

(1)链接法

链接法的构思来源于链表的启发,将被哈希到哈希表同一位置的数通过链表进行连接,使得他们能够在哈希表中共存,从而解决了哈希冲突。哈希冲突与解决哈希冲突的两种方法_第1张图片
如图所示,被哈希到同一位置的k1、k4;k5、k2、k7;k8、k6这三组数,被按照先后哈希的顺序,以双向链表的形式进行链接,从而共同被保存在哈希表中,解决了哈希冲突。

(2)开放寻址法

不同于链接法对哈希表的改变从而解决哈希冲突,开放寻址法的解决方法是通过对哈希函数的改变,从而将被可能发生哈希冲突的数按照一定规律哈希到另一个位置,从而保存在哈希表中。

需要注意的是,开放寻址法具有一个通用的位置计算公式,即
hi(x)= ( Hash( x ) + F ( i ) ) % TableSize
其中,hi(x)是第i次冲突的解决函数, Hash( x ) 是原哈希函数,F ( i )是不同的开放寻址法所定义的函数,TableSize是哈希表的大小。
以下三种开放寻址法解决方式,所不同的仅是对F ( i )的不同定义而已。

①线性探查

根据上面所叙述的通用公式,在线性探查中,F ( i ) 为探查的次数,即发生哈希冲突后,依次将哈希函数值加一后对表大小取模,重新计算新的哈希位置。
在具体实现中表现为,某个数x被哈希到i号位置,发现i号位置已经被占用,则查找(i+1)号位置,直到找到一个空的位置进行存放。
hi(x)= ( Hash( x ) + i ) % TableSize

举例说明:
哈希冲突与解决哈希冲突的两种方法_第2张图片
将U中的数按顺序哈希到如图所示的TableSize=7的哈希表中,其中0、1、2、3由于不发生冲突,都按照 h0(x)= ( Hash( x ) + 0 ) % 7 进行哈希计算,被放入了0,1,2,3的位置。
在进行7的哈希计算时发现 h0(7)= ( 7 + 0 ) % 7 = 0 ,而0号位置已经被占用,则进行冲突解决,尝试 h1(7)= ( 7 + 1 ) % 7 = 1 ,发现1号位置也被占用,继续探查,h2(7)= ( 7 + 2 ) % 7 = 2 ,h3(7)= ( 7 + 3 ) % 7 = 3 , h4(7)= ( 7 + 4 ) % 7 = 4 , 直到第三次探查,找到了4号位置是空的,则将7放入4号位置,解决了冲突。

②二次探查

在二次探查(也称平方探查)中,F ( i ) 是探查次数的平方
hi(x)= ( Hash( x ) + i^2 ) % TableSize
同样举例说明:
哈希冲突与解决哈希冲突的两种方法_第3张图片
同样的,我们先将0、1哈希到表的0、1位置,且未发生冲突。
接下来,我们对7进行哈希,发现 h0(7)= ( 7 + 0^2 ) % 7 = 0 ,且0号位置已被占用,则进行冲突解决,尝试 h1(7)= ( 7 + 1^2 ) % 7 = 1 ,发现1号位置同样被占用,继续探查, h2(7)= ( 7 + 2^2 ) % 7 = 4,此时4号位置未被占用,则将7放入4号位置,冲突解决。

③双重探查

双重探查也称二次再散列法,是指第一次散列产生哈希地址冲突,为了解决冲突,采用另外的散列函数或者对冲突结果进行处理的方法。
在双重探查中,F ( i ) 是一个新的哈希函数的值的整数倍
通常情况下,我们有:
hi(x)= ( Hash( x ) + i*Hash1( x ) ) % TableSize
其中Hash1( x )是一个不同于Hash( x )的新的哈希函数。

举例说明:
哈希冲突与解决哈希冲突的两种方法_第4张图片
此例中,我们定义Hash1( x ) = x mod 5 。
则有 hi(x)= ( Hash( x ) + i*(x mod 5) ) % 7 。
在这里,0、1、2被哈希到0、1、2的位置,且未发生哈希冲突。
对7进行哈希计算,发现 h0(7)= ( 7 + 0^2 ) % 7 = 0 ,0号位置已经被占用,发生哈希冲突,则进行解决,尝试 h1(7)= ( 7 + 1*(7 mod 5) ) % 7 = 2,发现2号位置同样被占用,则继续探查, h2(7)= ( 7 + 2*(7 mod 5) ) % 7 = 4,发现4号位置为空,则将7放入4号位置,解决冲突。

你可能感兴趣的:(算法导论,数据结构,算法,哈希表,哈希算法,算法导论)