在前面的文章【Java集合框架总结】https://blog.csdn.net/moni_mm/article/details/80065576中对集合框架进行概要分析之后,在此结合JDK源码对HashMap
进行深入分析。
提出并解决问题如下:
问题1:初始容量为什么是16,为什么必须是2的幂?
问题2: hash
方法为什么是无符号右移16位?
问题3:
问题4:
问题5:
问题1:初始容量为什么是16,为什么必须是2的幂?
HashMap
的hash
函数通过 hash & (table.length - 1)
来得到该对象的index
.仅与hash
值的低n位有关 可指定初始容量和负载因子,或从其他Map初始化
hash()
key的hash值高16位不变,低16位与高16位异或作为key的最终hash值
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
问题2: hash
方法为什么是无符号右移16位?
设计者权衡了speed, utility, and quality
在JDK1.7中,使用四次移位
static int hash(int h) {
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}
tableSizeFor()
返回一个比给定整数大且最接近的2的幂次方整数
问题3: tableSizeFor
如何实现?
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
先取n-1,五次右移后做或运算
超过最大值取最大值,否则取n-1
作为阈值threshold
put
通过对key的hashCode()进行hashing,并计算下标( n-1 & hash),从而获得buckets的位置。如果产生碰撞,则利用key.equals()方法去链表或树中去查找对应的节点.
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node[] tab; Node p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
else {
//到这里,说明数组该位置上是一个链表
for (int binCount = 0; ; ++binCount) {
// 插入到链表的最后面(Java7 是插入到链表的最前面)
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
// 如果在该链表中找到了"相等"的 key(== 或 equals)
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//e!=null 说明存在旧值的key与要插入的key"相等"
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//判断阈值,决定是否扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
具体过程
如果table为空或大小为0,触发resize
,用默认值初始化
用(n - 1) & hash
找到buckets,为空则在此插入
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
如果产生碰撞,取出该节点p
如果hash
相等且(key
==
或equal
),即就是要找的节点e
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
e = p;
如果不是要找的节点,就判断p是红黑是还是链表节点,调用不同的插入方法
如果插入后超过8个,会触发 treeifyBin将链表转换为红黑树
如果在该链表中找到了相等的 key(== 或 equals)
如果e!=null
说明存在旧值的key与要插入的key 相等
进行 “值覆盖”,然后返回旧值
判断阈值,决定是否扩容
未完待续