jdk1.8 中 HashMap 的 hash 算法和数组寻址

开篇

本文基于 jdk1.8 讲述 HashMap 的 hash 算法,但是不会详细介绍其他相关内容(比如用法,底层数据结构)。所以必须事先知晓下面几点:

  • HashMap 的底层数据结构是数组,在数组的基础上再去考虑链表或者红黑树
  • put 一个 key-value 时,会先计算出在数组中的索引位置,再考虑剩下的步骤
  • 位运算操作(异或,与)
  • java 运算符优先级

正文

HashMap 是基于 key-value 形式存放元素的,所使用的方法是 put(key, value)

1. HashMap 的 put 方法源码


// 再次强调这是 jdk1.8 源码
public V put(K key, V value) {
    
    // 这里调用 putVal() 方法
    // 传入的第一个参数:是根据 key 计算出的 hash 值
    return putVal(hash(key), key, value, false, true);
}

   
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
    Node[] tab; Node p; int n, i;
    
    // 获取数组的长度
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
        
    // 计算元素在数组中的索引位置
    if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
    else {
    
        // 忽略部分代码
    }
}

2. 从上面的源码中提取出两个代码片段

2.1 片段 1 - 计算 hash 值

static final int hash(Object key) {
    int h;
    return (key == null) ?
    0 : 
    (h = key.hashCode()) ^ (h >>> 16);
}
  • 如果 key 为 null,hash == 0
  • 否则
    • 先取出 key 的 hashCode 值,得到 h1
    • 然后对 h1 右移 16 位,得到 h2
    • 最后将 h1 和 h2 进行异或运算,得到最终的 hash 值

举个例子吧:

  1. 先获得 key 的 hashCode 值,得到 h1

1111 1111 1111 1111 1010 1010 1010 1010

  1. 对 h1 右移 16 位,得到 h2

0000 0000 0000 0000 1111 1111 1111 1111

  1. 最后将 h1 和 h2 进行异或运算

1111 111 1111 1111 0101 0101 0101 0101

图解 1

jdk1.8 中 HashMap 的 hash 算法和数组寻址_第1张图片

图解 2

jdk1.8 中 HashMap 的 hash 算法和数组寻址_第2张图片

结论如下:

1. 最终结果就是将 h1 的高 16 位 和低 16位进行了异或运算。

2. 达到的效果就是混合原始哈希码的高位和低位,以此来加大低位的随机性。

3. 顺带着,低 16 位可以同时拥有高 16 位的信息。

2.2 片段 2 - 计算元素在数组中的索引位置

i = (n - 1) & hash

如果让我们来做,通常会想到用下面取模的方式计算索引。

i = hash % n

其实,上面两种算法得到的结果是一样的(自行验证),就当这是一个数学公式吧。

前提是 HashMap 的数组长度要取2的整次幂,这也说明了为什么 HashMap 的初始容量不能随便给

但是两者相比而言,位运算的效率会更高,所以 HashMap 用了第一种算法。

总结

  1. 当 HashMap 的数组长度是 2 的整次幂时,(n - 1) & hashhash % n计算的结果是等价的,而后者是更容易想到的办法,前者是更有效率的办法。

  2. HashMap 的 hash 算法(看起来分了好几步),其实就是把 hashCode 值的高 16 位 与 低 16 位进行了异或运算,目的就是增大随机性。

你可能感兴趣的:(Java)