JDK1.7中HashMap导致的死链以及数据丢失问题

简述

我们知道HashMap不支持并发,在并发情况下会有一系列问题产生,如形成死链和节点丢失,下面我们简单分析一下什么情况下会产生以及产生原因

死链问题

先贴一段源码

    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry e : table) {
            while(null != e) {
                Entry next = e.next;//第一处
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

当HashMap需要扩容时,会调用上面的transfer方法将旧的元素重新计算hash值然后放入新的table里面

JDK1.7中HashMap导致的死链以及数据丢失问题_第1张图片

假设对以上table进行扩容(例子不是很准确,但可以说明问题)
按照transfer方法的逻辑,分为以下几个步骤

  1. 新的table容量为4


    JDK1.7中HashMap导致的死链以及数据丢失问题_第2张图片
  2. e.next = newTable[i],即将3的next指向newTable[i](刚开始为null),然后将3放在在newTable的对应位置上作为链表头,然后将e指向7


    JDK1.7中HashMap导致的死链以及数据丢失问题_第3张图片
  3. 进入下次循环,同理将7的next指向newTable[i](即3),然后将7放在newTable的对应位置作为新的链表头,然后e指向5


    JDK1.7中HashMap导致的死链以及数据丢失问题_第4张图片
  4. 继续循环,将5的next指向newTable[i](即null),然后将5放在newTable的对应位置作为新的链表头,然后e指向null,此为最后一次循环


    JDK1.7中HashMap导致的死链以及数据丢失问题_第5张图片

可能会产生死链的情况
假设现在有两个线程A和B,按照以下顺序来执行transfer方法

  1. A执行到源码第一处标识时,即此时e为3,next为7,cpu将资源让给了线程B
  2. 线程B将整个过程执行完,即得到最终结果如下图


    JDK1.7中HashMap导致的死链以及数据丢失问题_第6张图片
  3. 此时对于原table来说,7指向了3,3指向了null,5指向了null,这时线程A继续运行,有以下步骤
    3.1 此时对于线程A来说,e为3,next为7,将3放入指定位置,进行下次循环
    3.2 此时e为7,保存7的next即3,然后将7指向3,进行下次循环
    3.3 此时e为3,保存3的next即null,然后将3指向7,死链就此形成!
    3.4 此时e为null,结束循环
  4. 后续调用put、get或者transfer时,如果命中此死链,将导致死循环!
    分析时有个需要注意的点就是newTable属于局部变量,线程私有,两个线程的newTable是互相独立的,共享的只是Entry节点

节点丢失问题

假设一开始是如下所示


JDK1.7中HashMap导致的死链以及数据丢失问题_第7张图片

线程A和B存在如下顺序

  1. 线程A执行到第一处被挂起,此时e为3,next为5
  2. 线程B执行完,得到如下结果


    JDK1.7中HashMap导致的死链以及数据丢失问题_第8张图片
  3. 此时线程A继续执行,将3放在指定位置,然后下次循环去放5,放完5由于5的next指向了null,故本次扩容结束,对于线程A和线程B,他俩有各自线程私有的newTable,其中A是正确的,但是线程A先执行了table=newTable进行赋值,线程B后执行,导致B覆盖了A,产生数据丢失

你可能感兴趣的:(JDK1.7中HashMap导致的死链以及数据丢失问题)