ThreadLocal,即线程变量,是一个以ThreadLocal对象为键,任意对象为值的存储结构。这个结构被附带在线程上,也就是说一个线程可以通过ThreadLocal对象查询到绑定在这个线程上的一个值。
关于ThreadLocal的原理,理清四个角色关系:Thread,ThreadLocal,ThreadLocalMap,Entry
在ThreadLocal中有个变量指向ThreadLocalMap
ThreadLocal.ThreadLocalMap threadLocals = null;
ThreadLocalMap是ThreadLocal的静态内部类,当线程第一次执行set时,ThreadLocal会创建一个ThreadLocalMap对象,设置给Thread的threadLocals变量。
ThreadLocalMap中存放的是Entry,Entry是ThreadLocal和value的映射。
每一个线程都拥有一个ThreadLocalMap。
ThreadLocal在ThreadLocalMap中是以一个弱引用身份被Entry中的Key引用的,因此如果ThreadLocal没有外部强引用来引用它,那么ThreadLocal会在下次JVM垃圾收集时被回收。
这个时候就会出现Entry中Key已经被回收,出现一个null Key的情况,外部读取ThreadLocalMap中的元素是无法通过null Key来找到Value的。因此如果当前线程的生命周期很长,一直存在,那么其内部的ThreadLocalMap对象也一直生存下来,这些null key就存在一条强引用链的关系:Thread --> ThreadLocalMap–>Entry–>Value,这条强引用链会导致Entry不会回收,Value也不会回收,但Entry中的Key却已经被回收的情况,造成内存泄漏。
但是JVM团队已经考虑到这样的情况,并做了一些措施来保证ThreadLocal尽量不会内存泄漏:
采用线性探测法来处理冲突,从当前位置往后找寻空位,空位指的是table[ i ] = null 或是 table[ i ] .key = null,将Entry插入该位置。也就是说一个Entry要么在它的hash位置上,要么就在该位置往后的某一位置上。
由于线性探测发 table 数组中的情况一定是一段一段连续的片段,我们将一个连续的片段称为 run。
每个线程都有自己的ThreadLocalMap,以及Entry[] 数组,只有自己操作,所以是线程安全的。那么ThreadLocal呢?它并没有可更改的状态,所以也是线程安全的,来看看它的三个成员变量
// 每个ThreadLocal对象初始化后都会得到自己的hash值,之后不会再变
private final int threadLocalHashCode = nextHashCode();
// 静态对象AtomicInteger,与ThreadLocal对象无关,
// 在第一次ThreadLocal类加载时初始化
private static AtomicInteger nextHashCode = new AtomicInteger();
// 不可变
private static final int HASH_INCREMENT = 0x61c88647;
所以说 ThreadLocal 也是线程安全的。
常用于同一次请求的参数传递。比如说把身份信息埋到ThreadLocal中,然后该请求的所有接口都可以获取到这个身份信息。
如果子线程想要拿到父线程的中的ThreadLocal值怎么办呢?
比如会有以下的这种代码的实现。由于ThreadLocal的实现机制,在子线程中get时,我们拿到的Thread对象是当前子线程对象,那么他的ThreadLocalMap是null的,所以我们得到的value也是null。
private static void demo1() throws Exception {
Thread.currentThread().setName("主线程");
final ThreadLocal<String> threadLocal = new ThreadLocal<>();
// 调用set方法的时候,会初始化一个ThreadLocalMap
threadLocal.set("这个父线程设置的变量");
Thread subThread = new Thread(new Runnable() {
@Override
public void run() {
// 子线程获取父线程的threadLocal,结果为null
System.out.println("子线程获取的变量为 " +
threadLocal.get());
}
});
subThread.setName("子线程");
subThread.start();
}
public static void main(String[] args) throws Exception {
demo1();
}
那么有没有方法正确的获取父线程中的ThreadLocal呢?
那其实很多时候我们是有子线程获得父线程ThreadLocal的需求的,要如何解决这个问题呢?这就是InheritableThreadLocal
这个类所做的事情。先来看下InheritableThreadLocal所做的事情。
public class InheritableThreadLocal<T> extends ThreadLocal<T> {
/**
* 重写ThreadLocal类中的getMap方法,在原Threadlocal中是返回
* t.theadLocals,而在这么却是返回了inheritableThreadLocals,因为
* Thread类中也有一个要保存父子传递的变量
*/
ThreadLocalMap getMap(Thread t) {
return t.inheritableThreadLocals;
}
/**
* 同理,在创建ThreadLocalMap的时候不是给t.threadlocal赋值
*而是给inheritableThreadLocals变量赋值
*
*/
void createMap(Thread t, T firstValue) {
t.inheritableThreadLocals = new ThreadLocalMap(this, firstValue);
}
}
以上代码大致的意思就是,如果你使用InheritableThreadLocal,那么保存的所有东西都已经不在原来的t.thradLocals里面,而是在一个新的t.inheritableThreadLocals变量中了。下面是Thread类中两个变量的定义
/**
* 线程所持有的threadLocals
*/
ThreadLocal.ThreadLocalMap threadLocals = null;
/**
* 线程所持有的inheritableThreadLocals,保持了从父线程继承而来的本地变量信息
*/
ThreadLocal.ThreadLocalMap inheritableThreadLocals = null;
InheritableThreadLocal是如何实现在子线程中能拿到当前父线程中的值的呢?
一个常见的想法就是把父线程的所有的值都copy
到子线程中。
// Thread 线程类的初始化方法
private void init(ThreadGroup g, Runnable target, String name,
long stackSize, AccessControlContext acc) {
//省略上面部分代码
if (parent.inheritableThreadLocals != null)
//这句话的意思大致不就是,copy父线程parent的map,创建一个新的map赋值给当前线程的inheritableThreadLocals。
this.inheritableThreadLocals =
ThreadLocal.createInheritedMap(parent.inheritableThreadLocals);
//ignore
}
而且,在copy过程中是浅拷贝
,key和value都是原来的引用地址
private ThreadLocalMap(ThreadLocalMap parentMap) {
Entry[] parentTable = parentMap.table;
int len = parentTable.length;
setThreshold(len);
table = new Entry[len];
for (int j = 0; j < len; j++) {
Entry e = parentTable[j];
if (e != null) {
// 获取key
@SuppressWarnings("unchecked")
ThreadLocal<Object> key = (ThreadLocal<Object>) e.get();
if (key != null) {
// 获取value
Object value = key.childValue(e.value);
Entry c = new Entry(key, value);
// 计算存放key的位置
int h = key.threadLocalHashCode & (len - 1);
// 线性探测法
while (table[h] != null)
h = nextIndex(h, len);
table[h] = c;
size++;
}
}
}
到了这里,大致的解释了一下InheritableThreadLocal
为什么能解决父子线程传递Threadlcoal值的问题。
private static void demo2() throws Exception {
Thread.currentThread().setName("主线程");
final ThreadLocal<String> threadLocal = new InheritableThreadLocal<>();
// 调用set方法的时候,会初始化一个ThreadLocalMap
threadLocal.set("这个父线程设置的变量");
Thread subThread = new Thread(new Runnable() {
@Override
public void run() {
// 子线程获取父线程的threadLocal
// 输出为: 子线程获取的变量为 这个父线程设置的变量
System.out.println("子线程获取的变量为 " +
threadLocal.get());
}
});
subThread.setName("子线程");
subThread.start();
}
我们在使用线程的时候往往不会只是简单的new Thread对象,而是使用线程池,当然线程池的好处多多。这里不详解,既然这里提出了问题,那么线程池会给InheritableThreadLocal带来什么问题呢?
我们列举一下线程池的特点:
如下示例:
private static void demo3() throws Exception {
final InheritableThreadLocal<String> inheritableThreadLocal =
new InheritableThreadLocal<>();
inheritableThreadLocal.set("xiexiexie");
//输出 xiexiexie
System.out.println("父线程中获取inheritableThreadLocal, 值为:" +
inheritableThreadLocal.get());
Runnable runnable = new Runnable() {
@Override
public void run() {
System.out.println("子线程中获取inheritableThreadLocal, 值为:" +
inheritableThreadLocal.get());
inheritableThreadLocal.set("zhangzhangzhang");
System.out.println("子线程中获取inheritableThreadLocal, 值为:" +
inheritableThreadLocal.get());
}
};
ExecutorService executorService = Executors.newFixedThreadPool(1);
executorService.submit(runnable);
TimeUnit.SECONDS.sleep(1);
/**
* 第二次执行的时候,使用的是上一条线程,
* 并且InheritableThreadLocal只有在线程初始化的时候才从父线程继承数据。
* 因此这次执行任务直接使用线程当前的InheritableThreadLocal
*/
executorService.submit(runnable);
TimeUnit.SECONDS.sleep(1);
System.out.println("父线程中获取inheritableThreadLocal, 值为:" +
inheritableThreadLocal.get());
executorService.shutdown();
}
可见,在使用线程池的情况,由于复用线程,所以造成InheriableThreadLocal被复用,从而导致无法使用父类的数据。
如果我们能够,在submit新任务的时候在重新从父线程中拷贝所有的变量。然后将这些变量赋值给当前线程的t.inhertableThreadLocal赋值。这样就能够解决在线程池中每一个新的任务都能够获得父线程中ThreadLocal中的值而不受其他任务的影响。Alibaba的一个库解决了这个问题 [github:alibaba/transmittable-thread-local]
这个库最简单的方式是这样使用的,通过简单的修饰,使得提交的runable拥有了上一节所述的功能。具体的API文档详见github,这里不再赘述。
TransmittableThreadLocal<String> parent = new TransmittableThreadLocal<String>();
parent.set("value-set-in-parent");
Runnable task = new Task("1");
// 额外的处理,生成修饰了的对象ttlRunnable
Runnable ttlRunnable = TtlRunnable.get(task);
executorService.submit(ttlRunnable);
// Task中可以读取, 值是"value-set-in-parent"
String value = parent.get();
这个方法TtlRunnable.get(task)最终会调用构造方法,返回的是该类本身,也是一个Runable,这样就完成了简单的装饰。最重要的是在run方法这个地方。
public final class TtlRunnable implements Runnable {
private final AtomicReference<Map<TransmittableThreadLocal<?>, Object>> copiedRef;
private final Runnable runnable;
private final boolean releaseTtlValueReferenceAfterRun;
private TtlRunnable(Runnable runnable, boolean releaseTtlValueReferenceAfterRun) {
//从父类copy值到本类当中
this.copiedRef = new AtomicReference<Map<TransmittableThreadLocal<?>, Object>>(TransmittableThreadLocal.copy());
this.runnable = runnable;//提交的runable,被修饰对象
this.releaseTtlValueReferenceAfterRun = releaseTtlValueReferenceAfterRun;
}
/**
* wrap method {@link Runnable#run()}.
*/
@Override
public void run() {
Map<TransmittableThreadLocal<?>, Object> copied = copiedRef.get();
if (copied == null || releaseTtlValueReferenceAfterRun && !copiedRef.compareAndSet(copied, null)) {
throw new IllegalStateException("TTL value reference is released after run!");
}
//装载到当前线程
Map<TransmittableThreadLocal<?>, Object> backup = TransmittableThreadLocal.backupAndSetToCopied(copied);
try {
runnable.run();//执行提交的task
} finally {
//clear
TransmittableThreadLocal.restoreBackup(backup);
}
}
}
在上面的使用线程池的例子当中,如果换成这种修饰的方式进行操作,B任务得到的肯定是父线程中ThreadLocal的值,解决了在线程池中InheritableThreadLocal不能解决的问题。
如果线程之间出了要能够得到父线程中的值,同时想更新值怎么办呢?在前面我们有提到,当子线程copy父线程的ThreadLocalMap的时候是浅拷贝的,代表子线程Entry里面的value都是指向的同一个引用,我们只要修改这个引用的同时就能够修改父线程当中的值了。
ThreadLocal时要注意什么?比如说内存泄漏?
需要主动调用remove()方法释放无用的内存,原因查看上面的内存泄漏。
ThreadLocal内存泄漏
ThreadLocal父子线程传递数据