threadlocal的过期数据_ThreadLocal原理以及内存泄漏的问题

ThreadLocal的整体的结构

ThreadLocal的整体的结构

可以通过上图看到,ThreadLocal内部是基于一个ThreadLocalMap来实现,而ThreadLocalMap内部又是一个Entry的数据结构。这个Entry的数据结构最终是基于弱引用来使用。我们看源码的定义。

static class Entry extends WeakReference> {

/** The value associated with this ThreadLocal. */

Object value;

Entry(ThreadLocal> k, Object v) {

super(k);

value = v;

}

}

内部数据结构之间的通信

从图一,我们知道了ThreadLocal的数据结构与内部组件。下面,我们来看看他的这些内部组件是怎么进行一个沟通访问的。

我们通过看源码中的get()操作看看大致是一个怎么的过程。

public T get() {

Thread t = Thread.currentThread();

ThreadLocalMap map = getMap(t);

if (map != null) {

ThreadLocalMap.Entry e = map.getEntry(this);

if (e != null) {

@SuppressWarnings("unchecked")

T result = (T)e.value;

return result;

}

}

return setInitialValue();

}

我们想一下,Thread都说是线程之间相互隔离的,那么相互隔离的话,这个内部维护的数据就应该是每个线程他自己所持有的。我们可以看到getMap(t);的实现证明了我们这个想法:

ThreadLocalMap getMap(Thread t) {

return t.threadLocals;

}

而Thread的内部也刚好维护了ThreadLocalMap。

/* ThreadLocal values pertaining to this thread. This map is maintained

* by the ThreadLocal class. */

ThreadLocal.ThreadLocalMap threadLocals = null;

所以,我们可以理解成一个Thread就有个自己的ThreadMap.而自己维护自己的数据相互独立。但是,这里要注意一点,如果在线程中,在创建一个线程,这个时候,就不能通过ThreadLocal进行get数据了,这个时候已经做了线程之间的切换了,如果想要获子线程能够访问到父线程的数据,这个时候就要使用InheritableThreadLocal这个继承的ThreadLocal来操作了。

OK,我们通过ThreadLocal的get操作大致明白了他的一个内部数据之间是怎么一个联系。那么我们再来看看ThreadLocal的set操作又是怎么做的。线上源码:

public void set(T value) {

Thread t = Thread.currentThread();

ThreadLocalMap map = getMap(t);

if (map != null)

map.set(this, value);

else

createMap(t, value);

}

private void set(ThreadLocal> key, Object value) {

// We don't use a fast path as with get() because it is at

// least as common to use set() to create new entries as

// it is to replace existing ones, in which case, a fast

// path would fail more often than not.

Entry[] tab = table;

int len = tab.length;

int i = key.threadLocalHashCode & (len-1);

for (Entry e = tab[i];

e != null;

e = tab[i = nextIndex(i, len)]) {

ThreadLocal> k = e.get();

if (k == key) {

e.value = value;

return;

}

if (k == null) {

replaceStaleEntry(key, value, i);

return;

}

}

tab[i] = new Entry(key, value);

int sz = ++size;

if (!cleanSomeSlots(i, sz) && sz >= threshold)

rehash();

}

set方法的前两步没问题,通过当前Thread获得自己的ThreadLocalMap。如果ThreadLocalMap为空就进行一个创建,非空就是一个填值。而create的时候就是简单的new ThreadLocalMap(), 并且这个时候是绑定当前线程的value为一个null,然后赋值给当前ThreadLocal。

/**

* The initial capacity -- MUST be a power of two.

*/

private static final int INITIAL_CAPACITY = 16;

/**

* The table, resized as necessary.

* table.length MUST always be a power of two.

*/

private Entry[] table;

/**

* The number of entries in the table.

*/

private int size = 0;

/**

* The next size value at which to resize.

*/

private int threshold; // Default to 0

ThreadLocalMap(ThreadLocal> firstKey, Object firstValue) {

table = new Entry[INITIAL_CAPACITY];

int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);

table[i] = new Entry(firstKey, firstValue);

size = 1;

setThreshold(INITIAL_CAPACITY);

}

ThreadLocalMap并不像我们平常使用的HashMap那样维护一个链表,而是单纯的一个数组。而他的hashCode是从0x61c88647开始,没使用一次,进行一个加1. 将我们的key 和value维护到了Entry中,然后在放入我们的Entry数组中。并记录ThreadLocalMap的扩容阈值。由于他是使用了一个AtomicInteger的getAndAdd方法来获取hashCode,所以,我们想的hash冲突就迎刃而解了。

那么我们重点来关注他下面的set方法。

这个过程中。通过hash值算出在ThreadLocalMap中的table中的具体下标索引。

这里的大致过程就是通过key去寻找对应的Entry是否存在。这里为什么要这么做?因为Entry使用的是一个弱引用,弱引用在获取值的时候,可能已经被上一次GC所回收了值,这个时候,我们就要进行一个重新赋值。

而这个地方最有意思的就是在最下面的扩容了,因为前面的赋值只是一些常规的操作“有,覆盖;无,创建”,并且使用的是一个弱引用而已,可扩容的地方就要再看一看了。

int sz = ++size;

if (!cleanSomeSlots(i, sz) && sz >= threshold)

rehash();

cleanSomeSlots这个地方就是我们前面说的,由于是弱引用,所以这个地方,他在进行一个填充值的时候,进行了一个额外的删除已经被GC的Key对应的Value(至于为什么要说是已经被GC的Key对应的Value我们下面再说。),这个动作相当于是一个懒式的操作。

下面我们跟进rehash():

private void rehash() {

expungeStaleEntries();

// Use lower threshold for doubling to avoid hysteresis

if (size >= threshold - threshold / 4)

resize();

}

expungeStaleEntries这个其实就是cleanSomeSlots的内部实现,用法不解释了。而当容量大于阈值的3/4的时候,就需要resize了。

private void resize() {

Entry[] oldTab = table;

int oldLen = oldTab.length;

int newLen = oldLen * 2;

Entry[] newTab = new Entry[newLen];

int count = 0;

for (int j = 0; j < oldLen; ++j) {

Entry e = oldTab[j];

if (e != null) {

ThreadLocal> k = e.get();

if (k == null) {

e.value = null; // Help the GC

} else {

int h = k.threadLocalHashCode & (newLen - 1);

while (newTab[h] != null)

h = nextIndex(h, newLen);

newTab[h] = e;

count++;

}

}

}

setThreshold(newLen);

size = count;

table = newTab;

}

从这里可以看到,他的扩容是两倍两倍的进行扩容,然后将老的数据从老的table中拿出,然后重新hash得到一个新的index,然后填充到新的table中。这就是一个简单的两个数组的拷贝,然后重新设置了一下阈值。好吧,原来就是这么简单。。。。

再谈内存泄漏的问题

从第一张图中,我们知道了ThreadLocalMap中的内部是一个Entry的数据结构,而Entry的数据结构又是一个弱引用WeakReference>.这里要注意了, 弱引用里面的泛型是ThreadLocal,而这个从之前的代码里面可以发现,传递到这里的ThreadLocal就是this,再结合一下弱引用的特性想一下,如果ThreadLocal这个对象被回收了,但是我当前的线程还是在继续运行,注意哦,我们的ThreadLocalMap是在线程Thread里面的哦,所以ThreadLocal在弱引用的时候被GC,我们的线程还在继续运行,ThreadLocalMap也是还会继续存活的,但是,这个时候,TheadLocalMap的key已经不存在了, 但是,我们的value可不是WeakReference弱引用,并没有被GC。这样,这个value只要线程还在继续运行,就永远不会被GC掉。

static class Entry extends WeakReference> {

/** The value associated with this ThreadLocal. */

Object value;

Entry(ThreadLocal> k, Object v) {

super(k);

value = v;

}

}

所以,这就出现了内存泄漏的现象。避免出现这种现象的方法一般都是在ThreadLocal使用完了之后,进行一个TreadLocal.remove()方法操作。

总结

ThreadLocal在面试的过程中也经常被问到,这里主要要关注的就是他的内部是一个怎样的结构,resize的过程,内存泄漏是怎么发生(主要结合弱引用的特性)。

你可能感兴趣的:(threadlocal的过期数据_ThreadLocal原理以及内存泄漏的问题)