java.util.concurrent包系列文章
JUC—ThreadLocal源码解析(JDK13)
JUC—ThreadPoolExecutor线程池源码解析(JDK13)
JUC—各种锁(JDK13)
JUC—原子类Atomic*.java源码解析(JDK13)
JUC—CAS源码解析(JDK13)
JUC—ConcurrentHashMap源码解析(JDK13)
JUC—CopyOnWriteArrayList源码解析(JDK13)
JUC—并发队列源码解析(JDK13)
JUC—多线程下控制并发流程(JDK13)
JUC—AbstractQueuedSynchronizer解析(JDK13)
本篇只分析ConcurrentHashMap的源码。HashMap就简略带过,但是必须先明白了HashMap的相关原理再来了解ConcurrentHashMap更好。
Map是我们工作中用到最多的数据结构,key-value形式。看看整个Map家族
// Collections工具类中的synchronizedMap方法也能获得一个线程安全的Map,不过性能比ConcurrentHashMap低,也不推荐使用
// 在源码可以发现,它也是用synchronized把所有方法包装起来,类似HashTable
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) {
return new SynchronizedMap<>(m);
}
不管什么Map,都要求key是不可变对象。如果key还可变的话,存储,查询都会根据key计算hash值,那Map岂不是混乱了。
HashMap为什么线程不安全?多线程下就不应该使用HashMap
同时碰撞可能会导致数据丢失,两个线程put,如果计算的hash值一样,那么就有一个会丢失数据
同时扩容可能会导致数据丢失,两个线程扩容resize,最后只会保存一个数组,也会丢失数据
死循环(JDK7及更低版本存在),多个线程扩容的时候造成链表的死循环,环形链表
数组+链表的形式。产生Hash碰撞就采用拉链法。
相关图片来自:https://www.javadoop.com/post/hashmap
数组+链表+红黑树的形式。相比于1.7不同的是,产生Hash碰撞后,当链表长度超过8并且容量超过64就会转为红黑树。红黑树是一种平衡二叉树,也叫二叉查找树,会自动平衡节点。让左右树的高度差不超过1。达到一种平衡。左节点比右节点小。查询效率是O(logN)。相比于链表的查询效率O(N),查询速度更快。
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
// 新插入的值是链表中的第8个,则转为红黑树
treeifyBin(tab, hash);
break;
TREEIFY_THRESHOLD初始化值如下
static final int TREEIFY_THRESHOLD = 8;
static final int MIN_TREEIFY_CAPACITY = 64;
不过在treeifyBin方法还有一层判断
final void treeifyBin(Node<K,V>[] tab, int hash) {
int n, index; Node<K,V> e;
// 桶数组的长度要大于64才转为红黑树,否则执行数组扩容
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
resize();
else if ((e = tab[index = (n - 1) & hash]) != null) {
TreeNode<K,V> hd = null, tl = null;
do {
TreeNode<K,V> p = replacementTreeNode(e, null);
if (tl == null)
hd = p;
else {
p.prev = tl;
tl.next = p;
}
tl = p;
} while ((e = e.next) != null);
if ((tab[index] = hd) != null)
hd.treeify(tab);
}
}
为什么要达到一定长度才转:红黑树占用的内存是链表的2倍。冲突不多的情况下,用链表也无可厚非,速度差别忽略不计。而且很少有情况能链表长度超过8。
在1.7中ConcurrentHashMap采用分段锁的思想。是一个Segment数组。初始化有16个Segment。Segment继承了ReentrantLock来进行加锁,所以每次需要加锁的操作锁住的是一个 segment,这样只要保证每个 Segment 是线程安全的。每个Segment里面可以看做一个类似于HashMap的结构。每个Segment不相互影响,最大允许16个线程的并发。初始化时可以设置Segment大小,不过设置之后不会扩容。
static final class Segment<K,V> extends ReentrantLock implements Serializable{}
在1.8及更高的版本中ConcurrentHashMap和HashMap是非常相似的。两者结构上基本上一样,不过ConcurrentHashMap要保证线程安全性。
put(K key, V value)
public V put(K key, V value) {
return putVal(key, value, false);
}
/** Implementation for put and putIfAbsent */
final V putVal(K key, V value, boolean onlyIfAbsent) {
// 与HashMap不一样,key-value都不允许为null
if (key == null || value == null) throw new NullPointerException();
// 得到键的hash值
int hash = spread(key.hashCode());
// 用于记录相应链表的长度
int binCount = 0;
// 在for循环中完成值得put操作
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh; K fk; V fv;
// 如果数组"空",进行数组初始化
if (tab == null || (n = tab.length) == 0)
tab = initTable();
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
// 如果数组该位置为空,直接用CAS操作设置值
// casTabAt方法贴在下面。里面调用Unsafe的本地方法。
if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value)))
// 如果CAS成功,本次put就结束了
// 如果CAS失败,说明有另一个线程已经在这个位置put了值。那就是有并发操作,进到下一个循环就好了
break; // no lock when adding to empty bin
}
else if ((fh = f.hash) == MOVED)
// MOVED代表这个槽点正在扩容,那就去帮助扩容
tab = helpTransfer(tab, f);
else if (onlyIfAbsent // check first node without acquiring lock
&& fh == hash
&& ((fk = f.key) == key || (fk != null && key.equals(fk)))
&& (fv = f.val) != null)
return fv;
else {
// 到这里就说明f是该位置的头结点,而且不为空
// oldVal是要返回的旧值
V oldVal = null;
// 加锁,保证线程安全
synchronized (f) {
if (tabAt(tab, i) == f) {
if (fh >= 0) {
// 头结点的hash 值大于0,说明是链表
// 用于累加,记录链表的长度
binCount = 1;
// 遍历链表
for (Node<K,V> e = f;; ++binCount) {
K ek;
// 找到对应的位置,如果发现了相同的key,判断是否要进行值覆盖,然后就可以break结束了,退出for循环
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
// 把原来的值赋给oldVal
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
Node<K,V> pred = e;
// 没有相同的key,就到了链表的最后,将这个新值放到链表的最后面,退出for循环
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key, value);
break;
}
}
}
else if (f instanceof TreeBin) {
// 如果是红黑树
Node<K,V> p;
binCount = 2;
// 则把元素添加在树上
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
// 把原来的值赋给oldVal
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
else if (f instanceof ReservationNode)
throw new IllegalStateException("Recursive update");
}
}
if (binCount != 0) {
// 判断是否要将链表转换为红黑树,临界值8
// 这个方法在上面HashMap1.8版本中有说道
if (binCount >= TREEIFY_THRESHOLD)
treeifyBin(tab, i);
if (oldVal != null)
return oldVal;
break;
}
}
}
addCount(1L, binCount);
return null;
}
static final <K,V> boolean casTabAt(Node<K,V>[] tab, int i,
Node<K,V> c, Node<K,V> v) {
return U.compareAndSetReference(tab, ((long)i << ASHIFT) + ABASE, c, v);
}
put的流程:
利用CAS+synchronized 保证并发安全。
get(Object key)
public V get(Object key) {
Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
// 计算key的hash值
int h = spread(key.hashCode());
if ((tab = table) != null && (n = tab.length) > 0 &&
(e = tabAt(tab, (n - 1) & h)) != null) {
// 如果槽点hash值符合,并且key相等,就返回这个value
if ((eh = e.hash) == h) {
if ((ek = e.key) == key || (ek != null && key.equals(ek)))
return e.val;
}
else if (eh < 0)
// 如果头结点的hash小于0,说明正在扩容,或者该位置是红黑树
// 调用find方法查询值
return (p = e.find(h, key)) != null ? p.val : null;
while ((e = e.next) != null) {
// 走到这里的话就是链表,遍历链表获取值
if (e.hash == h &&
((ek = e.key) == key || (ek != null && key.equals(ek))))
return e.val;
}
}
return null;
}
Node<K,V> find(int h, Object k) {
Node<K,V> e = this;
if (k != null) {
// do while循环遍历节点寻找value
do {
K ek;
if (e.hash == h &&
((ek = e.key) == k || (ek != null && k.equals(ek))))
return e;
} while ((e = e.next) != null);
}
return null;
}
get的流程: