HashMap死循环简明分析

并行操作HashMap可能会丢失数据并发生死循环。
由于HashMap重新散列的过程会转置列表,由于不同线程转置进度不一致,慢线程会将快线程的转置结果切断并反方向连接形成闭环。

一、简述

设一哈希表map,散列表table长度为1,表示为:

map = [ {} ]
table[0]= {}

散列三个元素a、b、c,假设刚好全部散列在table[0],表示为

map = [ { a -> b -> c -> NUL } ]
table[0] = { a -> b -> c -> NUL }

主线程启动两个线程,线程1,线程2,分别向map插入数据,又假设刚好散列在table[0]
假设阀值为3,此时需要调整table长度避免数据扎堆,很不幸,a、b、c又刚好散列在同一位置newTable[i]

新建一个散列表newTable,将table的元素往newTable挪。
JDK的源码:

void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    if (oldCapacity == MAXIMUM_CAPACITY) {
        threshold = Integer.MAX_VALUE;
        return;
    }

    Entry[] newTable = new Entry[newCapacity];
    transfer(newTable, initHashSeedAsNeeded(newCapacity));
    table = newTable;
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}

void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry e : table) {
        while(null != e) {
            Entry next = e.next;
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

二、简析

2.1 对于线程1:


遍历table[0],重新散列。

newTable[i]={}
table[0] = { a -> b -> c -> NUL }

LOOP1:

Entry next = e.next;   //  e=a,next=b  
....
e.next = newTable[i];       //  a.next=NUL
newTable[i] = e;            //  newTable[i]={ a -> NUL }
e = next;                   //  e=b

LOOP2:

Entry next = e.next;   //  e=b,next=c  
....
e.next = newTable[i];       //  b.next=a
newTable[i] = e;            //  newTable[i]={ b -> a -> NUL }
e = next;                   //  e=c

LOOP3...略

相当于将table[0]置换顺序头插到newTable[i]
最终结果为:

newTable[i] = { c-> b -> a -> NUL }。

2.2 对于线程2:


假设执行中途切换到了线程1,如下:

LOOP1:

Entry next = e.next;   //  e=a,next=b
----线程1执行后----
....
e.next = newTable[i];       //  a.next=NUL
newTable[i] = e;            //  newTable[i]={ a -> NUL }
e = next;                   //  e=b

LOOP2:

Entry next = e.next;   //  e=b,next=a  注意线程1已修改指向
....
e.next = newTable[i];       //  b.next=a
newTable[i] = e;            //  newTable[i]={ b -> a -> NUL }
e = next;                   //  e=a

LOOP3:

Entry next = e.next;   //  e=a,next=NUL
....
e.next = newTable[i];       //  a.next=b 注意LOOP2中b.next=a
newTable[i] = e;            //  newTable[i]={ a -> b -> a -> b -> a -> ...... } 作死成功
e = next;                   //  e=NUL 线程2结束循环

如果最后是线程2的newTable替换了table,那么查找数据的时候就会死循环。

你可能感兴趣的:(HashMap死循环简明分析)