ThreadLocal全解析——你想要的这里都有

ThreadLocal


概念

ThreadLocal,即线程变量,是一个以ThreadLocal对象为键,任意对象为值的存储结构。这个结构被附带在线程上,也就是说一个线程可以通过ThreadLocal对象查询到绑定在这个线程上的一个值。


原理

关于ThreadLocal的原理,理清四个角色关系:Thread,ThreadLocal,ThreadLocalMap,Entry

ThreadLocal全解析——你想要的这里都有_第1张图片

在ThreadLocal中有个变量指向ThreadLocalMap

ThreadLocal.ThreadLocalMap threadLocals = null;

ThreadLocalMap是ThreadLocal的静态内部类,当线程第一次执行set时,ThreadLocal会创建一个ThreadLocalMap对象,设置给Thread的threadLocals变量。

ThreadLocalMap中存放的是Entry,Entry是ThreadLocal和value的映射。

每一个线程都拥有一个ThreadLocalMap。

ThreadLocal全解析——你想要的这里都有_第2张图片


关于内存泄漏

ThreadLocal在ThreadLocalMap中是以一个弱引用身份被Entry中的Key引用的,因此如果ThreadLocal没有外部强引用来引用它,那么ThreadLocal会在下次JVM垃圾收集时被回收。

这个时候就会出现Entry中Key已经被回收,出现一个null Key的情况,外部读取ThreadLocalMap中的元素是无法通过null Key来找到Value的。因此如果当前线程的生命周期很长,一直存在,那么其内部的ThreadLocalMap对象也一直生存下来,这些null key就存在一条强引用链的关系:Thread --> ThreadLocalMap–>Entry–>Value,这条强引用链会导致Entry不会回收,Value也不会回收,但Entry中的Key却已经被回收的情况,造成内存泄漏。

但是JVM团队已经考虑到这样的情况,并做了一些措施来保证ThreadLocal尽量不会内存泄漏:

  • 在ThreadLocal的get()、set()、remove()方法调用的时候会清除掉线程ThreadLocalMap中所有Entry中Key为null的Value,并将整个Entry设置为null,利于下次内存回收Entry、value。

ThreadLocalMap处理Hash冲突

采用线性探测法来处理冲突,从当前位置往后找寻空位,空位指的是table[ i ] = null 或是 table[ i ] .key = null,将Entry插入该位置。也就是说一个Entry要么在它的hash位置上,要么就在该位置往后的某一位置上。

由于线性探测发 table 数组中的情况一定是一段一段连续的片段,我们将一个连续的片段称为 run


关于线程安全性

每个线程都有自己的ThreadLocalMap,以及Entry[] 数组,只有自己操作,所以是线程安全的。那么ThreadLocal呢?它并没有可更改的状态,所以也是线程安全的,来看看它的三个成员变量

// 每个ThreadLocal对象初始化后都会得到自己的hash值,之后不会再变
private final int threadLocalHashCode = nextHashCode();

// 静态对象AtomicInteger,与ThreadLocal对象无关,
// 在第一次ThreadLocal类加载时初始化
private static AtomicInteger nextHashCode = new AtomicInteger();

// 不可变
private static final int HASH_INCREMENT = 0x61c88647;

所以说 ThreadLocal 也是线程安全的。


使用场景

常用于同一次请求的参数传递。比如说把身份信息埋到ThreadLocal中,然后该请求的所有接口都可以获取到这个身份信息。


父子线程传递实现方案

如果子线程想要拿到父线程的中的ThreadLocal值怎么办呢?


错误的示例

比如会有以下的这种代码的实现。由于ThreadLocal的实现机制,在子线程中get时,我们拿到的Thread对象是当前子线程对象,那么他的ThreadLocalMap是null的,所以我们得到的value也是null。

private static void demo1() throws Exception {

  Thread.currentThread().setName("主线程");

  final ThreadLocal<String> threadLocal = new ThreadLocal<>();
  // 调用set方法的时候,会初始化一个ThreadLocalMap
  threadLocal.set("这个父线程设置的变量");

  Thread subThread = new Thread(new Runnable() {
    @Override
    public void run() {
      // 子线程获取父线程的threadLocal,结果为null
      System.out.println("子线程获取的变量为   " +
                         threadLocal.get());
    }
  });
  subThread.setName("子线程");
  subThread.start();
}

public static void main(String[] args) throws Exception {
  demo1();
}

那么有没有方法正确的获取父线程中的ThreadLocal呢?


InheritableThreadLocal

那其实很多时候我们是有子线程获得父线程ThreadLocal的需求的,要如何解决这个问题呢?这就是InheritableThreadLocal这个类所做的事情。先来看下InheritableThreadLocal所做的事情。

public class InheritableThreadLocal<T> extends ThreadLocal<T> {

    /**
     * 重写ThreadLocal类中的getMap方法,在原Threadlocal中是返回
     * t.theadLocals,而在这么却是返回了inheritableThreadLocals,因为
     * Thread类中也有一个要保存父子传递的变量
     */
    ThreadLocalMap getMap(Thread t) {
       return t.inheritableThreadLocals;
    }

    /**
     * 同理,在创建ThreadLocalMap的时候不是给t.threadlocal赋值
     *而是给inheritableThreadLocals变量赋值
     * 
     */
    void createMap(Thread t, T firstValue) {
        t.inheritableThreadLocals = new ThreadLocalMap(this, firstValue);
    }
}

以上代码大致的意思就是,如果你使用InheritableThreadLocal,那么保存的所有东西都已经不在原来的t.thradLocals里面,而是在一个新的t.inheritableThreadLocals变量中了。下面是Thread类中两个变量的定义

/**
 * 线程所持有的threadLocals
 */
ThreadLocal.ThreadLocalMap threadLocals = null;

/**
 * 线程所持有的inheritableThreadLocals,保持了从父线程继承而来的本地变量信息
 */
ThreadLocal.ThreadLocalMap inheritableThreadLocals = null;

InheritableThreadLocal是如何实现在子线程中能拿到当前父线程中的值的呢?

一个常见的想法就是把父线程的所有的值都copy到子线程中。

// Thread 线程类的初始化方法
private void init(ThreadGroup g, Runnable target, String name,
                     long stackSize, AccessControlContext acc) {
       //省略上面部分代码
       if (parent.inheritableThreadLocals != null)
       //这句话的意思大致不就是,copy父线程parent的map,创建一个新的map赋值给当前线程的inheritableThreadLocals。
           this.inheritableThreadLocals =
               ThreadLocal.createInheritedMap(parent.inheritableThreadLocals);
      //ignore
}

而且,在copy过程中是浅拷贝,key和value都是原来的引用地址

private ThreadLocalMap(ThreadLocalMap parentMap) {
  Entry[] parentTable = parentMap.table;
  int len = parentTable.length;
  setThreshold(len);
  table = new Entry[len];

  for (int j = 0; j < len; j++) {
    Entry e = parentTable[j];
    if (e != null) {

      // 获取key
      @SuppressWarnings("unchecked")
      ThreadLocal<Object> key = (ThreadLocal<Object>) e.get();
      if (key != null) {
        // 获取value
        Object value = key.childValue(e.value);
        Entry c = new Entry(key, value);

        // 计算存放key的位置
        int h = key.threadLocalHashCode & (len - 1);

        // 线性探测法
        while (table[h] != null)
          h = nextIndex(h, len);
        table[h] = c;

        size++;
      }
    }
  }

到了这里,大致的解释了一下InheritableThreadLocal为什么能解决父子线程传递Threadlcoal值的问题。

  1. 在创建新线程的时候会检查父线程中t.inheritableThreadLocals变量是否为null,如果不为null则拷贝一份ThradLocalMap到子线程的t.inheritableThreadLocals成员变量中去
  2. 因为复写了getMap(Thread)和createMap()方法,所以调用get()方法的时候,就可以在getMap(t)的时候就会从t.inheritableThreadLocals中拿到map对象,从而实现了可以拿到父线程ThreadLocal中的值。
private static void demo2() throws Exception {
  Thread.currentThread().setName("主线程");

  final ThreadLocal<String> threadLocal = new InheritableThreadLocal<>();
  // 调用set方法的时候,会初始化一个ThreadLocalMap
  threadLocal.set("这个父线程设置的变量");

  Thread subThread = new Thread(new Runnable() {
    @Override
    public void run() {
      // 子线程获取父线程的threadLocal
      // 输出为:    子线程获取的变量为   这个父线程设置的变量
      System.out.println("子线程获取的变量为   " +
                         threadLocal.get());
    }
  });
  subThread.setName("子线程");
  subThread.start();
}

InheritableThreadLocal不足

我们在使用线程的时候往往不会只是简单的new Thread对象,而是使用线程池,当然线程池的好处多多。这里不详解,既然这里提出了问题,那么线程池会给InheritableThreadLocal带来什么问题呢?

我们列举一下线程池的特点:

  1. 为了减小创建线程的开销,线程池会缓存已经使用过的线程
  2. 生命周期统一管理,合理的分配系统资源

如下示例:

private static void demo3() throws Exception {
        final InheritableThreadLocal<String> inheritableThreadLocal =
                new InheritableThreadLocal<>();
        inheritableThreadLocal.set("xiexiexie");

        //输出 xiexiexie
        System.out.println("父线程中获取inheritableThreadLocal, 值为:" +
                inheritableThreadLocal.get());

        Runnable runnable = new Runnable() {
            @Override
            public void run() {

                System.out.println("子线程中获取inheritableThreadLocal, 值为:" +
                        inheritableThreadLocal.get());

                inheritableThreadLocal.set("zhangzhangzhang");

                System.out.println("子线程中获取inheritableThreadLocal, 值为:" +
                        inheritableThreadLocal.get());
            }
        };

        ExecutorService executorService = Executors.newFixedThreadPool(1);
        executorService.submit(runnable);
        TimeUnit.SECONDS.sleep(1);

        /**
         * 第二次执行的时候,使用的是上一条线程,
         * 并且InheritableThreadLocal只有在线程初始化的时候才从父线程继承数据。
         * 因此这次执行任务直接使用线程当前的InheritableThreadLocal
         */
        executorService.submit(runnable);

        TimeUnit.SECONDS.sleep(1);

        System.out.println("父线程中获取inheritableThreadLocal, 值为:" +
                inheritableThreadLocal.get());

        executorService.shutdown();
}

可见,在使用线程池的情况,由于复用线程,所以造成InheriableThreadLocal被复用,从而导致无法使用父类的数据。


解决方案

如果我们能够,在submit新任务的时候在重新从父线程中拷贝所有的变量。然后将这些变量赋值给当前线程的t.inhertableThreadLocal赋值。这样就能够解决在线程池中每一个新的任务都能够获得父线程中ThreadLocal中的值而不受其他任务的影响。Alibaba的一个库解决了这个问题 [github:alibaba/transmittable-thread-local]


transmittable-thread-local实现原理

这个库最简单的方式是这样使用的,通过简单的修饰,使得提交的runable拥有了上一节所述的功能。具体的API文档详见github,这里不再赘述。

TransmittableThreadLocal<String> parent = new TransmittableThreadLocal<String>();
parent.set("value-set-in-parent");

Runnable task = new Task("1");
// 额外的处理,生成修饰了的对象ttlRunnable
Runnable ttlRunnable = TtlRunnable.get(task); 
executorService.submit(ttlRunnable);

// Task中可以读取, 值是"value-set-in-parent"
String value = parent.get();

这个方法TtlRunnable.get(task)最终会调用构造方法,返回的是该类本身,也是一个Runable,这样就完成了简单的装饰。最重要的是在run方法这个地方。

public final class TtlRunnable implements Runnable {
    private final AtomicReference<Map<TransmittableThreadLocal<?>, Object>> copiedRef;
    private final Runnable runnable;
    private final boolean releaseTtlValueReferenceAfterRun;

    private TtlRunnable(Runnable runnable, boolean releaseTtlValueReferenceAfterRun) {
    //从父类copy值到本类当中
        this.copiedRef = new AtomicReference<Map<TransmittableThreadLocal<?>, Object>>(TransmittableThreadLocal.copy());
        this.runnable = runnable;//提交的runable,被修饰对象
        this.releaseTtlValueReferenceAfterRun = releaseTtlValueReferenceAfterRun;
    }
    /**
     * wrap method {@link Runnable#run()}.
     */
    @Override
    public void run() {
        Map<TransmittableThreadLocal<?>, Object> copied = copiedRef.get();
        if (copied == null || releaseTtlValueReferenceAfterRun && !copiedRef.compareAndSet(copied, null)) {
            throw new IllegalStateException("TTL value reference is released after run!");
        }
        //装载到当前线程
        Map<TransmittableThreadLocal<?>, Object> backup = TransmittableThreadLocal.backupAndSetToCopied(copied);
        try {
            runnable.run();//执行提交的task
        } finally {
        //clear
            TransmittableThreadLocal.restoreBackup(backup);
        }
    }
}

在上面的使用线程池的例子当中,如果换成这种修饰的方式进行操作,B任务得到的肯定是父线程中ThreadLocal的值,解决了在线程池中InheritableThreadLocal不能解决的问题。


更新父线程ThreadLocal值?

如果线程之间出了要能够得到父线程中的值,同时想更新值怎么办呢?在前面我们有提到,当子线程copy父线程的ThreadLocalMap的时候是浅拷贝的,代表子线程Entry里面的value都是指向的同一个引用,我们只要修改这个引用的同时就能够修改父线程当中的值了。


问题

ThreadLocal时要注意什么?比如说内存泄漏?

需要主动调用remove()方法释放无用的内存,原因查看上面的内存泄漏。


参考

ThreadLocal内存泄漏

ThreadLocal父子线程传递数据

你可能感兴趣的:(Java)