HashMap在高并发下引起的死循环深入剖析(正解)

今天研读Java并发容器和框架时,看到为什么要使用ConcurrentHashMap时,其中有一个原因是:线程不安全的HashMap, HashMap在并发执行put操作时会引起死循环,是因为多线程会导致HashMap的Entry链表形成环形数据结构,查找时会陷入死循环。纠起原因看了其他的博客,都比较抽象,所以这里以图形的方式展示一下,希望支持!

 (1)当往HashMap中添加元素时,会引起HashMap容器的扩容,原理不再解释,直接附源代码,如下:

复制代码

 
  1. 1 /**

  2. 2 *

  3. 3 * 往表中添加元素,如果插入元素之后,表长度不够,便会调用resize方法扩容

  4. 4 */

  5. 5 void addEntry(int hash, K key, V value, int bucketIndex) {

  6. 6 Entry e = table[bucketIndex];

  7. 7 table[bucketIndex] = new Entry(hash, key, value, e);

  8. 8 if (size++ >= threshold)

  9. 9 resize(2 * table.length);

  10. 10 }

  11. 11

  12. 12 /**

  13. 13 * resize()方法如下,重要的是transfer方法,把旧表中的元素添加到新表中

  14. 14 */

  15. 15 void resize(int newCapacity) {

  16. 16 Entry[] oldTable = table;

  17. 17 int oldCapacity = oldTable.length;

  18. 18 if (oldCapacity == MAXIMUM_CAPACITY) {

  19. 19 threshold = Integer.MAX_VALUE;

  20. 20 return;

  21. 21 }

  22. 22

  23. 23 Entry[] newTable = new Entry[newCapacity];

  24. 24 transfer(newTable);

  25. 25 table = newTable;

  26. 26 threshold = (int)(newCapacity * loadFactor);

  27. 27 }

复制代码

(2)参考上面的代码,便引入到了transfer方法,(引入重点)这就是HashMap并发时,会引起死循环的根本原因所在,下面结合transfer的源代码,说明一下产生死循环的原理,先列transfer代码(这是里JDK7的源偌),如下:

复制代码

 
  1. 1 /**

  2. 2 * Transfers all entries from current table to newTable.

  3. 3 */

  4. 4 void transfer(Entry[] newTable, boolean rehash) {

  5. 5 int newCapacity = newTable.length;

  6. 6 for (Entry e : table) {

  7. 7

  8. 8 while(null != e) {

  9. 9 Entry next = e.next; ---------------------(1)

  10. 10 if (rehash) {

  11. 11 e.hash = null == e.key ? 0 : hash(e.key);

  12. 12 }

  13. 13 int i = indexFor(e.hash, newCapacity);

  14. 14 e.next = newTable[i];

  15. 15 newTable[i] = e;

  16. 16 e = next;

  17. 17 } // while

  18. 18

  19. 19 }

  20. 20 }

复制代码

(3)假设:

 
  1. 1 Map map = new HashMap(2); // 只能放置两个元素,其中的threshold为1(表中只填充一个元素时),即插入元素为1时就扩容(由addEntry方法中得知)

  2. 2 //放置2个元素 3 和 7,若要再放置元素8(经hash映射后不等于1)时,会引起扩容

假设放置结果图如下:     

HashMap在高并发下引起的死循环深入剖析(正解)_第1张图片

 

 现在有两个线程A和B,都要执行put操作,即向表中添加元素,即线程A和线程B都会看到上面图的状态快照

执行顺序如下:

               执行一:  线程A执行到transfer函数中(1)处挂起(transfer函数代码中有标注)。此时在线程A的栈中

 
  1. 1 e = 3

  2. 2 next = 7

 执行二:线程B执行 transfer函数中的while循环,即会把原来的table变成新一table(线程B自己的栈中),再写入到内存中。如下图(假设两个元素在新的hash函数下也会映射到同一个位置)

HashMap在高并发下引起的死循环深入剖析(正解)_第2张图片

执行三: 线程A解挂,接着执行(看到的仍是旧表),即从transfer代码(1)处接着执行,当前的 e = 3, next = 7, 上面已经描述。

                          

                             1. 处理元素 3 , 将 3 放入 线程A自己栈的新table中(新table是处于线程A自己栈中,是线程私有的,不肥线程2的影响),处理3后的图如下:

HashMap在高并发下引起的死循环深入剖析(正解)_第3张图片

  2.  线程A再复制元素 7 ,当前 e = 7 ,而next值由于线程 B 修改了它的引用,所以next 为 3 ,处理后的新表如下图

HashMap在高并发下引起的死循环深入剖析(正解)_第4张图片

   3. 由于上面取到的next = 3, 接着while循环,即当前处理的结点为3, next就为null ,退出while循环,执行完while循环后,新表中的内容如下图:

HashMap在高并发下引起的死循环深入剖析(正解)_第5张图片

  4. 当操作完成,执行查找时,会陷入死循环!

你可能感兴趣的:(java)