ThreadLocal 是本地线程变量,是一个以ThreadLocal对象为key,任意对象为value的存储结构。
一、使用案例
1.定义线程类MyThread,代码如下:
1 public class MyThread extends Thread{ 2 3 private User user; 4 5 public MyThread(User user){ 6 this.user = user; 7 } 8 9 public void run() { 10 System.out.println("线程:"+Thread.currentThread().getName()+"设置ThreadLocal的user="+user.getUserName()); 11 ThreadLocalTest.LOCAL.set(user); 12 try { 13 Thread.sleep(2000L); 14 } catch (InterruptedException e) { 15 e.printStackTrace(); 16 } 17 User user = ThreadLocalTest.LOCAL.get(); 18 System.out.println("线程:"+Thread.currentThread().getName()+"从ThreadLocal获取的user="+user.getUserName()); 19 } 20 }
2.测试方法Main方法
1 public class ThreadLocalTest { 2 3 //全局ThraedLocal变量 4 public static ThreadLocalLOCAL = new ThreadLocal (); 5 6 public static void main(String[] args){ 7 User user1 = new User(); 8 user1.setUserName("Jack"); 9 User user2 = new User(); 10 user2.setUserName("Bob"); 11 12 //定义两个线程变量 13 Thread t1 = new MyThread(user1); 14 Thread t2 = new MyThread(user2); 15 t1.start(); 16 t2.start(); 17 18 //从ThreadLocal变量中获取数据 19 User user = LOCAL.get(); 20 System.out.println(user==null);//当前线程为Main线程,而Main线程没有设置过TheadLocal的值,所以获取不到 21 LOCAL.set(user2); 22 System.out.println(LOCAL.get().getUserName());//从Main线程设置ThreadLocal,则可以获取 23 } 24 }
定义两个线程,线程的run方法执行了ThreadLocal变量的set操作,然后再执行get操作,可以获取到本线程设置的值
而直接从Main线程中执行ThreadLocal的get方法,返回的数据为null,只有在自己的线程中执行了set操作,才可以获取到值,
上例的执行结果如下:
1 true 2 Bob 3 线程:Thread-0设置ThreadLocal的user=Jack 4 线程:Thread-1设置ThreadLocal的user=Bob 5 线程:Thread-0从ThreadLocal获取的user=Jack 6 线程:Thread-1从ThreadLocal获取的user=Bob
二、源码解析
ThreadLocal主要有三个方法,
set (T value) 给ThreadLocal变量设置数据,ThreadLocal会存储当前线程存储的值
get ( ) 返回ThreadLocal当前线程设置的值
remove() 删除当前线程设置的ThreadLocal的值
2.1、set方法解析
源码如下:
1 public void set(T value) { 2 // 获取当前线程 3 Thread t = Thread.currentThread(); 4 // 获取当前线程的ThreadLocalMap 5 ThreadLocalMap map = getMap(t); 6 if (map != null) 7 // 如果当前线程的ThreadLocalMap存在,则直接将当前的value设置到map中,map的key就是当前的ThreadLocal对象 8 map.set(this, value); 9 else 10 // 如果当前线程的ThreadLocalMap不存在,则先创建ThreadLocalMap,则进行赋值 11 createMap(t, value); 12 }
首先是通过getMap (Thread t) 方法获取当前线程的ThreadLocalMap对象,代码如下:
1 ThreadLocalMap getMap(Thread t) { 2 return t.threadLocals; 3 }
每个线程Thread对象内部都有一个ThreadLocalMap对象threadLocals
1 ThreadLocal.ThreadLocalMap threadLocals = null; //Thread类中持有一个ThreadLocalMap对象
如果当前线程的ThreadLocalMap不存在,则只需createMap方法初始化,代码如下:
1 void createMap(Thread t, T firstValue) { 2 t.threadLocals = new ThreadLocalMap(this, firstValue); 3 }
直接初始化一个ThreadLocalMap,然后赋值给Thread的threadLocals对象
可以发现ThreadLocal的set方法逻辑其实很简单,就是获取一个ThreadLocalMap对象,然后将需要set的值保存在ThreadLocalMap中
ThreadLocalMap是ThreadLocal的一个内部类,如下:
static class ThreadLocalMap { static class Entry extends WeakReference> { Object value; Entry(ThreadLocal> k, Object v) { super(k); value = v; } } }
ThreadLocal的set方法实际是执行了ThreadLocalMap的set方法
1 private void set(ThreadLocal> key, Object value) { 2 3 // We don't use a fast path as with get() because it is at 4 // least as common to use set() to create new entries as 5 // it is to replace existing ones, in which case, a fast 6 // path would fail more often than not. 7 8 Entry[] tab = table; 9 int len = tab.length; 10 int i = key.threadLocalHashCode & (len-1); 11 12 for (Entry e = tab[i]; 13 e != null; 14 e = tab[i = nextIndex(i, len)]) { 15 ThreadLocal> k = e.get(); 16 17 if (k == key) { 18 e.value = value; 19 return; 20 } 21 22 if (k == null) { 23 replaceStaleEntry(key, value, i); 24 return; 25 } 26 } 27 28 tab[i] = new Entry(key, value); 29 int sz = ++size; 30 if (!cleanSomeSlots(i, sz) && sz >= threshold) 31 rehash(); 32 }
可以发现是ThreadLocalMap是将当前的ThreadLocal当做一个key,需要存储的对象为value,存储在ThreadLocalMap内部的Entry数组中。
ThreadLocalMap也会存储hash冲突的问题,只是解决冲突的方式比较简单,指定尝试获取下一个位置用于存放,直到能够放入位置(ThreadLocal不建议一个线程有太多ThreadLocal,所以没必要花费大力气解决冲突问题)
同理既然ThreadLocal的set方法是执行了ThreadLocalMap的set方法,那么可以猜想ThreadLocal的get方法也是执行了ThreadLocalMap的get方法。
如下:
1 public T get() { 2 Thread t = Thread.currentThread(); 3 ThreadLocalMap map = getMap(t); 4 if (map != null) { 5 ThreadLocalMap.Entry e = map.getEntry(this); 6 if (e != null) { 7 @SuppressWarnings("unchecked") 8 T result = (T)e.value; 9 return result; 10 } 11 } 12 return setInitialValue(); 13 }
ThreadLocalMap的getEntry方法如下:
1 private Entry getEntry(ThreadLocal> key) { 2 int i = key.threadLocalHashCode & (table.length - 1); 3 Entry e = table[i]; 4 if (e != null && e.get() == key) 5 return e; 6 else 7 return getEntryAfterMiss(key, i, e); 8 }
为什么ThreadLocalMap是采用数组存储的呢?因为ThreadLocalMap是和Thread绑定的,一个Thread只有一个ThreadLocalMap对象,但是每个Thread可以存储多个ThreadLocal对象
所以ThreadLocalMap中的数组就是存储了多个ThreadLocal对象,数组的下标是通过 threadLocal对象的hashCode和数组长度进行取模算法得到的数组下标值。
分析到这里可以总结出ThreadLocal的原理:
每个线程Thread 内部有一个 ThreadLocalMap对象,每个ThreadLocalMap 存储了多个以 ThreadLocal对象为key,存储的数据为value的值。ThreadLocalMap内部采用数组存储ThreadLocal的值
通过ThreadLocal的hashCode和数组长度进行取模算法得到数组的下标位置,在指定的位置存储ThreadLocal的值。
分析到这里涉及到的对象 包含了 Thread、ThreadLocal 和 ThreadLocalMap,这三者的关系为:
Thread 内部有一个 ThreadLocalMap对象实例
ThreadLocalMap 是 ThreadLocal的一个内部类
ThreadLocalMap 存储的是以 ThreadLocal 为key,ThreadLocal的值为value 的结构
光靠文字不好理解,使用图形的话很更直观,以上面的代码为例,三者关系如下图示:
每个Thread中的ThreadLocalMap可以存储多个ThreadLocal的值,但是同一个ThreadLocal变量在同一个Thread中只能保存一个值,后面set的值会把前面set的值覆盖。
如果需要保存多个值就需要使用多个ThreadLocal来存储
三、ThreadLocal内存泄露浅析
ThreadLocal很好的解决了线程之间数据隔离,但是大量的ThreadLocal在大量的线程中就有了空间的问题,内存中存储的ThreadLocal值的个数等于 ThreadLocal变量个数 * 线程个数,显然随着线程的变多,ThreadLocal占据的空间也是不容小觑的。
所以使用ThreadLocal的时候就需要做到不用对时候及时回收,防止没有被回收导致内存泄露问题。如下图示:
栈中有一个ThreadLocal的变量和一个Thread的变量 分别强引用堆中对应的实例,堆中的ThreadLocalMap实例也是被Thread变量引用
ThreadLocalMap又持有 Entry实例的强引用,而Entry分别持有key的弱引用,value的强引用,key是 ThreadLocal实例,value是实际存的数据
上图中实现表示强引用,虚线表示弱引用。
当ThreadLocal 不用的时候,ThreadLocal变量会被回收,此时ThreadLocal 变量和ThreadLocal实例的强引用断开,但是此时ThreadLocal实例还不能够被回收,引用还有 Entry的key对ThreadLocal实例持有着弱引用
所以当下一次执行GC的时候,ThreadLocal实例就会被回收,因为GC的时候会直接回收弱引用实例。此时Entry的key已经被回收了,所以Entry就变成了
如果这个Thread 一直活跃,那么Thread 强引用 ThreadLocalMap;ThreadLocalMap强引用Entry,Entry强引用value就都不能被回收,所以一旦ThreadLocal被回收,而Thread还继续工作的话,就会导致value无法被访问,
从而就造成了 内存泄露问题。
既然Entry的 key是弱引用,那么为什么value不是弱引用呢?
如果value是弱引用的话,那么在GC的时候就会被回收,而ThreadLocal除了有弱引用,还有一个强引用,所以在GC的时候ThreadLocal并不会被强制回收,而value会被回收,就会出现通过 key无法获取到数据的情况,
如果GC频繁,那么ThreadLocal的get方法就会频繁获取不到数据,那么这样的ThreadLocal还有什么意义呢?
所以ThreadLocalMap的实现仅仅将key作为了弱引用,value不会出现弱引用,这样虽然有内存泄露问题,但是至少可以保证只要 ThreadLocal 还在存活状态,就可以获取到value,显然是高可用的。
那么既然有内存泄露问题,ThreadLocal就不管了么?显然不可能!
ThreadLocal的get方法、set方法、remove方法的内部都做了判断,如果存储key=null都情况,就将value设置为null,一旦value设置为null之后,那么就将value和实际的数据之前的强引用断开了,那么数据在GC的时候就会被回收
但是这样的设计就导致ThreadLocal 如果再也不会执行get、set 或 remove方法了,那么还是会存在内存泄露问题,所以在使用的时候需要养成好习惯,当不用ThreadLocal的时候,手动执行remove方法回收数据。