算法6-3:解决哈希冲突之线性探针

线性探针是第二种解决哈希冲突的办法。这样的办法的基本思想就是当遇到哈希冲突时,寻找下一个空位,直到找到空位为止。


演示样例


先插入一个值S,例如以下图。

算法6-3:解决哈希冲突之线性探针


插入其它的一些值,这些值的哈系没有冲突,得到下图的结果。

算法6-3:解决哈希冲突之线性探针

再插入一个值H,因为H与A的哈系冲突,因此须要寻找一个空的位置。

算法6-3:解决哈希冲突之线性探针


找到了空位

算法6-3:解决哈希冲突之线性探针

插入

算法6-3:解决哈希冲突之线性探针



代码

public class LinearProbeST<Key, Value> {
    private static final int M = 100;
 
    private Key[] keys = (Key[])new Object[M];
    private Value[] values = (Value[])new Object[M];
 
    public LinearProbeST() {
    }
 
    public Value get(Key key) {
        int hash = hash(key);
        for(int i=0; i < M; i++) {
            int index = (hash + i) % M;
            Key key2 = keys[index];
 
            // 找不到该键
            if(key2 == null) return null;
 
            // 找到了该键
            if(key.equals(key2)) {
                return values[index];
            }
        }
        return null;
    }
 
    public void put(Key key, Value value) {
        int hash = hash(key);
        for(int i=0; i < M; i++) {
            int index = (hash+i) % M;
            Key key2 = keys[index];
 
            // 找到了空位
            if(key2 == null) {
                keys[index] = key;
                values[index] = value;
                return;
            }
 
            // 找到了已经存在的值
            if(key.equals(key2)) {
                values[index] = value;
                return;
            }
        }
    }
 
    private int hash(Key key) {
        return (key.hashCode() & 0x7fffffff) % M;
    }
}


性能


随着数据量的添加,因为冲突的哈希值添加因此速度会越来越慢。在冲突非常少的情况下,每一个操作的复杂度近似为1。在冲突非常多的情况下,每一个操作的复杂度可达到N。所以一般取M=N/2,这样性能最佳,又不浪费空间。


Knuth停车问题

有一个固定大小的停车场,每辆车都会在随机的位置i停下,假设停车位i已经被占用了,那么寻找停车位i+1、i+2等。


线性探针算法事实上就是Knuth停车问题。http://arxiv.org/abs/math/0502220



你可能感兴趣的:(算法)