死磕Java源码之ThreadLocal实现分析

死磕Java源码之ThreadLocal实现分析

通俗的讲, ThreadLocal是Java里一种特殊的变量。每个线程都有一个ThreadLocalMap,用来存放ThreadLocal变量表,当然这里不是直接通过Map的方式存储,而是通过一个table和Entry结构存储

因为ThreadLocalMap变量是跟线程绑定的,所以不存在多线程共享变量之间的并发问题,所以ThreadLocal也就是线程安全的变量。

屏幕快照 2018-09-06 上午11.20.55.png

具体的结构,在源码部分说明

ThreadLocal的使用

ThreadLocal主要有以下几个方法:

public T get() { } // 用来获取ThreadLocal在当前线程中保存的变量副本
public void set(T value) { } //set()用来设置当前线程中变量的副本
public void remove() { } //remove()用来移除当前线程中变量的副本
protected T initialValue() { } //initialValue()是一个protected方法,一般是用来在使用时进行重写的

写一个demo,在main线程和新建线程中,对同一个ThreadLocal变量进行修改,看下修改后的结果:

public class ThreadLocalDemo {

    public static ThreadLocal threadLocal = new ThreadLocal<>();

    public static void main(String[] args) {


        ThreadLocalDemo.threadLocal.set("hello world main");
        System.out.println(ThreadLocalDemo.threadLocal.get());


        try {
            Thread thread = new Thread() {
                public void run() {
                    ThreadLocalDemo.threadLocal.set("hello world thread");
                    System.out.println(ThreadLocalDemo.threadLocal.get());
                };
            };
            thread.start();
            thread.join();
        } catch (Exception ex) {
            System.out.println(ex);
        }

        System.out.println(ThreadLocalDemo.threadLocal.get());

    }

}

执行输出:

hello world main
hello world thread
hello world main

不难看出,我们在new Thread()中对ThreadLocal的变量threadLocal进行修改后,在main线程中再次输出,其值并没有收到影响,他们修改的分别是各自的副本,不会对其他副本有影响。

当然这里完整的逻辑是应该在使用完调用remove方法删除threadLocal副本,以防内存泄露。

具体原理见下文

ThreadLocal的内存泄漏与源码分析

ThreadLocal的结构如图:

死磕Java源码之ThreadLocal实现分析_第1张图片
image

ThreadLocal为什么会内存泄漏

每个Thread 维护一个 ThreadLocalMap 映射表,这个映射表的 keyThreadLocal实例本身,value 是真正需要存储的 Object

也就是说 ThreadLocal 本身并不存储值,它只是作为一个 key 来让线程从 ThreadLocalMap 获取 value。值得注意的是图中的虚线,表示 ThreadLocalMap 是使用 ThreadLocal 的弱引用作为 Key 的,弱引用的对象在 GC 时会被回收。

ThreadLocalMap使用ThreadLocal的弱引用作为key,如果一个ThreadLocal没有外部强引用来引用它,那么系统 GC 的时候,这个ThreadLocal势必会被回收,这样一来,ThreadLocalMap中就会出现keynullEntry,就没有办法访问这些keynullEntryvalue,如果当前线程再迟迟不结束的话,这些keynullEntryvalue就会一直存在一条强引用链:Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value永远无法回收,造成内存泄漏。

其实,ThreadLocalMap的设计中已经考虑到这种情况,也加上了一些防护措施:在ThreadLocalget(),set(),remove()的时候都会清除线程ThreadLocalMap里所有keynullvalue,当然这只是一种防护措施,最好的使用方法是在用完了ThreadLocal变量时,调用remove()方法主动将ThreadLocal和value释放。

关于为什么ThreadLocalMap使用ThreadLocal的弱引用,这就跟弱引用的机制有关,若引用的对象在JVM执行GC的时候就会被回收掉。通过gc前后查看table中对应entry对象的referent即可查看是否被回收(示例的前提是ThreadLocal的强引用对象已经释放):

GC之前:

死磕Java源码之ThreadLocal实现分析_第2张图片
![屏幕快照 2018-09-05 下午5.03.21.png](https://upload-images.jianshu.io/upload_images/1272254-4a2814486c210166.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

GC之后:

此时Entry的referent=null,当再次通过调用get、set、remove方法是,ThreadLocal会有各自的机制,将Map中key(referent)为空的Entry移除,并释放其中的value,一定成都避免了内存泄漏,此机制源码分析阶段说明。

ThreadLocal源码分析

ThreadLocal中的关键属性

//创建ThreadLocal时,复制的HashCode
//HashCode是在全局静态的nextHashCode基础上增加一个HASH_INCREMENT而来
private final int threadLocalHashCode = nextHashCode();

下面分析几个具体的函数:

  • get方法的实现
/**
 * Returns the value in the current thread's copy of this
 * thread-local variable.  If the variable has no value for the
 * current thread, it is first initialized to the value returned
 * by an invocation of the {@link #initialValue} method.
 *
 * @return the current thread's value of this thread-local
 */
public T get() {
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null) {
        ThreadLocalMap.Entry e = map.getEntry(this);
        if (e != null) {
            @SuppressWarnings("unchecked")
            T result = (T)e.value;
            return result;
        }
    }
    return setInitialValue();
}

首先是当前线程,然后通过getMap(t)方法获取到一个map,map的类型为ThreadLocalMap。然后接着下面获取到键值对,注意这里获取键值对传进去的是 this,而不是当前线程t。如果获取成功,则返回value值。如果map为空,则调用setInitialValue方法返回value。

  • setInitialValue方法的实现
private T setInitialValue() {
    T value = initialValue();
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null)
        map.set(this, value);
    else
        createMap(t, value);
    return value;
}
/**
* 构造ThreadLocalMap
**/
ThreadLocalMap(ThreadLocal firstKey, Object firstValue) {
    table = new Entry[INITIAL_CAPACITY];
    int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
    table[i] = new Entry(firstKey, firstValue);
    size = 1;
    setThreshold(INITIAL_CAPACITY);
}

首先是通过调用initialValueinitialValue是protected方法,初始化ThreadLocal时可以重写此函数,相当于延迟加载,然后通过getMap创建threadLocals,如果threadLocals不存在时,会调用createMap创建一个初始大小为16的Entry数组table,并新建一个Entry存入table中。这个threadLocals就是用来存储实际的变量副本的,键值为当前ThreadLocal变量,value为变量副本(即T类型的变量)

这里重点看下Entry类

static class Entry extends WeakReference> {
    /** The value associated with this ThreadLocal. */
    Object value;

    Entry(ThreadLocal k, Object v) {
        super(k);
        value = v;
    }
}

Entry类是集成自WeakReference,然后使用ThreadLocal作为了键,也就是说这里的ThreadLocal是一个弱引用在GC的时候会被回收。

接上文,如果map存在,则会调用map的getEntry方法,getEntry方法实现:

private Entry getEntry(ThreadLocal key) {
    //通过hash算出数组下标
    int i = key.threadLocalHashCode & (table.length - 1);
    Entry e = table[i];
    if (e != null && e.get() == key)
        //如果取出Entry,并且e.get也就是referent与threadLocal相同,则说明是需要的值,返回Entry对象e ,判断e.get() = key 是解决hash碰撞的情况
        return e;
    else
        //如果下标i的Entry不存在或者 其threadLocal不相同,则执行此
        return getEntryAfterMiss(key, i, e);
}


private Entry getEntryAfterMiss(ThreadLocal key, int i, Entry e) {
    Entry[] tab = table;
    int len = tab.length;
    
    while (e != null) {
        //说明有此entry,可能是hash碰撞的结果
        ThreadLocal k = e.get();
        if (k == key)
            return e;
        if (k == null)
            //处理已无引用的ThreadLocal变量等,解决内存泄漏的机制之一
            expungeStaleEntry(i);
        else
            //下标+1 
            i = nextIndex(i, len);
        e = tab[i];
    }
    //如果getEntry中获取的entry=null,则说明无此ThreadLocal变量,返回null
    return null;
}

expungeStaleEntry 方法

//删除可以释放的Entry
private int expungeStaleEntry(int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;

    // expunge entry at staleSlot
    tab[staleSlot].value = null;
    tab[staleSlot] = null;
    size--;

    // Rehash until we encounter null
    Entry e;
    int i;
    for (i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        ThreadLocal k = e.get();
        if (k == null) {
            //如果发现ThreadLocal已经被释放掉,则通过这里来释放value的引用,以及删除数组table中的Entry
            e.value = null;
            tab[i] = null;
            size--;
        } else {
            int h = k.threadLocalHashCode & (len - 1);
            if (h != i) {
                //重新设置Entry在table中的位置
                tab[i] = null;

                // Unlike Knuth 6.4 Algorithm R, we must scan until
                // null because multiple entries could have been stale.
                while (tab[h] != null)
                    h = nextIndex(h, len);
                tab[h] = e;
            }
        }
    }
    return i;
}

通过对get方法的大致分析,可以分为几个阶段:

1)判断Map是否存在,如果不存在初始化Map以及table等

2)如果已存在,并且获取到Entry,则返回

3)如果不存在,则调用expungeStaleEntry清除需要释放的ThreadLocal、释放对value的一用,从table中删除相应下标的Entry,以及重新设置元素在table中的位置

  • set方法的实现
public void set(T value) {
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null)
        map.set(this, value);
    else
        createMap(t, value);
}

set方法中的createMap与上文的createMap相同,不在做说明,重点看下map.set(this, value); 这里直接在温中锋

private void set(ThreadLocal key, Object value) {

    // We don't use a fast path as with get() because it is at
    // least as common to use set() to create new entries as
    // it is to replace existing ones, in which case, a fast
    // path would fail more often than not.

    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);

    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        ThreadLocal k = e.get();

        if (k == key) {
           //如果通过hash计算的下标取出的entry的key与设置的相同,则更新value
            e.value = value;
            return;
        }

        if (k == null) {
            //和HashMap不一样,由于Entry key继承了软引用,会出现k是null的情况!所以会接着在replaceStaleEntry重新循环寻找相同的key
            replaceStaleEntry(key, value, i);
            return;
        }
    }

    //如果key!= null  并且 k != key 说明存在hash鹏铮
    tab[i] = new Entry(key, value);
    int sz = ++size;
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        //调用cleanSomeSlots()对table进行清理,如果没有任何Entry被清理,并且表的size超过了阈值,就会调用rehash()方
        rehash();
}

hash散列的键值数据在存储过程中可能会发生碰撞,大家知道HashMap存储的是一个Entry链,当hash发生冲突后,将新的Entry存放在链表最前端。但是ThreadLocalMap不一样,采用index+1作为重散列的hash值写入。另外有一点需要注意key出现null的原因是由于Entry的key是继承了软引用,在下一次GC时不管它有没有被引用都会被回收掉而Value没有被回收。当出现null时,会调用replaceStaleEntry()方法接着循环寻找相同的key,如果存在,直接替换旧值。如果不存在,则在当前位置上重新创建新的Entry.

  • remove方法的实现

  • //ThreadLocal
    public void remove() {
             ThreadLocalMap m = getMap(Thread.currentThread());
             if (m != null)
                 m.remove(this);
         }
    /**
     * ThreadeLocalMap
     * Remove the entry for key.
     */
    private void remove(ThreadLocal key) {
        Entry[] tab = table;
        int len = tab.length;
        int i = key.threadLocalHashCode & (len-1);
        for (Entry e = tab[i];
             e != null;
             e = tab[i = nextIndex(i, len)]) {
            if (e.get() == key) {
                e.clear();
                expungeStaleEntry(i);
                return;
            }
        }
    }
    

    remove方法相对简单,通过hashcode计算出下标,然后判断key与要删除的ThreadLocal是否一致,如果一致,释放掉相应的引用,并调用expungeStaleEntry方法清理其他的可以释放的对象。

ThreadLocal的使用场景

  • 每个线程自己独享的数据,比如session数据
  • 实例需要在多个方法中共享,但不希望被多线程共享

比如在Dubbo中的RpcContext实例,在RpcContext.java文件中,通过静态的ThreadLocal变量,为每个线程持有一个RpcContext对象,这个RpcContext对象只有在此线程的不同方法中共享使用,在多线程中不会共享,是一种典型的应用,包括重写了initialValue方法

rivate static final ThreadLocal LOCAL = new ThreadLocal() {
   @Override
   /**
   * 重新initialValue方法,当get时为null时,通过回调此方法获取RpcContext实例
   **/
   protected RpcContext initialValue() {
      return new RpcContext();
   }
};

/**
 * get context.
 * 
 * @return context
 */
public static RpcContext getContext() {
    return LOCAL.get();
}

/**
 * remove context.
 * 
 * @see com.alibaba.dubbo.rpc.filter.ContextFilter
 */
public static void removeContext() {
    LOCAL.remove();
}

总结

  • ThreadLocal 并不解决线程间共享数据的问题,通过使用ThreadLocal是使数据在不同线程有不同的副本,不会有多线程共享数据也就不需要解决共享数据的问题
  • 每个线程持有一个 Map 并维护了 ThreadLocal 对象与具体实例的映射,该 Map 由于只被持有它的线程访问,故不存在线程安全以及锁的问题
  • ThreadLocalMapEntryThreadLocal 的引用为弱引用,避免了因ThreadLocalMap强引用 ThreadLocal 对象在线程回收之前无法被回收的问题
  • ThreadLocalMap 的 set 方法通过调用 replaceStaleEntry 方法回收键为 null 的 Entry 对象的值(即为具体实例)以及 Entry 对象本身从而防止内存泄漏
  • ThreadLocalMap 的 get 方法通过调用 expungeStaleEntry 方法回收键为 null 的 Entry 对象的值(即为具体实例)以及 Entry 对象本身从而防止内存泄漏
  • ThreadLocalMap当hash发生冲突后,并不是与HashMap一样采用的Entry链表将新的Entry存放在链表最前端。而是采用index+1作为重散列的hash值来重新存储Entry值

文章部分自己理解,部分借鉴了大牛们的文章,在此表示感谢!如有bug,劳烦指正!

参考:

https://blog.csdn.net/liulongling/article/details/50607802

http://www.importnew.com/21206.html

http://www.jasongj.com/java/threadlocal/

http://www.importnew.com/22039.html

你可能感兴趣的:(死磕Java源码之ThreadLocal实现分析)