【多线程与并发】ThreadLocal与强软弱虚引用

一、概述

ThreadLocal:线程本地变量,针对同一变量可以保存线程私有的值,保证多线程之间的数据隔离性。为什么不用方法内的局部变量?局部变量作用域为当前方法,而ThreadLocal可以跨方法获取。例如框架作者可以事先在threadlocal中设置好一些经常用到的变量,使用者就可以直接在自己的业务方法中获取到。列举几个在spring中的应用场景:

  1. spring的事务管理:每个请求处理对应的是一个线程,该线程中不同方法对数据库的操作都可以复用一个连接和事务。
  2. spring的国际化:每个请求到来后都会将语言信息保存起来,框架使用者可以直接通过LocaleContextHolder的静态方法获取语言、地区的上下文。

二、结构

ThreadLocal本身不会存储线程设置的值,而是通过往Thread对象的成员变量threadLocals(一个ThreadLocalMap类)增加键值对来实现的。不知道作者为什么是这样实现的。如果是我的话,就直接在ThreadLocal中加一个线程安全map,然后将线程对象作为map的key,线程设置的值为value。不过这样子做的话就会把重心从线程对象往ThreadLocal对象转移了。

与HashMap相类似,ThreadLocalMap也是一个entry数组,存储键值对,其中key是ThreadLocal对象,value是一个object对象。不过它没有链表和红黑树,几个核心的数据结构见如下源码。需要注意的是:entry中对key的引用是弱引用,为什么需要用到这个引用呢?这个会在下文”弱引用“小节分析。

每个ThreadLocal对象会自动生成一个threadLocalHashCode,用于决定它在ThreadLocalMap中的位置。当hash冲突时采取线性查询(即下标递增)的方式找寻空位。因此ThreadLocalMap不适合存储大量的键值对。和HashMap一样,ThreadLocalMap也有一个负载因子为2/3,当map容量超过table.length*2/3时会触发扩容。

public class ThreadLocal<T> {
     
	// 和HashMap一样hash值用于决定元素的位置
    private final int threadLocalHashCode = nextHashCode();

    private static AtomicInteger nextHashCode = new AtomicInteger();

    private static final int HASH_INCREMENT = 0x61c88647;
	// hash增长策略
    private static int nextHashCode() {
     
        return nextHashCode.getAndAdd(HASH_INCREMENT);
    }
    
	//...
	
    static class ThreadLocalMap {
     
		// key是弱引用
        static class Entry extends WeakReference<ThreadLocal<?>> {
     
            Object value;

            Entry(ThreadLocal<?> k, Object v) {
     
                super(k);
                value = v;
            }
        }

        private static final int INITIAL_CAPACITY = 16;
		// 核心数据结构
        private Entry[] table;
		// 存储kv对的数量
        private int size = 0;

        private int threshold; // Default to 0
        // 容量超过阈值时会触发扩容
        private void setThreshold(int len) {
     
            threshold = len * 2 / 3;
        }
        
		//...
	}
}	

三、源码分析

1.设置ThreadLocal变量的值

当使用ThreadLocal.set的时候,会检查当前线程是否已经有一个map了,如果有的话就把kv放到map中,如果没有就创建一个map并置入kv。

// java.lang.ThreadLocal#set
public void set(T value) {
     
    Thread t = Thread.currentThread();
    // 获取当前线程的ThreadLocalMap
    ThreadLocalMap map = t.threadLocals;
    if (map != null)
    	// 当前线程的ThreadLocalMap不为空时,将kv对插入该map,该set方法类似于put,详细步骤见下面一个方法
        map.set(this, value);
    else
    	// 当前线程的ThreadLocalMap为空时(第一次设置threadLocal变量),构造该线程的ThreadLocalMap并初始化
        t.threadLocals = new ThreadLocalMap(this, firstValue);
}

// java.lang.ThreadLocal.ThreadLocalMap#set
private void set(ThreadLocal<?> key, Object value) {
     
    Entry[] tab = table;
    int len = tab.length;
    // kv对位置的算法
    int i = key.threadLocalHashCode & (len-1);

	/* 
		递增i,线性查询空位子。有两种情况进入for循环:
		1. 重新设置ThreadLocal变量
		2. 哈希冲突
	*/
    for (Entry e = tab[i];
         e != null;
         // i递增,直到找到空位置
         e = tab[i = nextIndex(i, len)]) {
     
        ThreadLocal<?> k = e.get();

		// 重新设置ThreadLocal变量的场景
        if (k == key) {
     
            e.value = value;
            return;
        }
		// ThreadLocal已经被置为null
        if (k == null) {
     
            replaceStaleEntry(key, value, i);
            return;
        }
    }
	// 找到空位子,插入该键值对
    tab[i] = new Entry(key, value);
    int sz = ++size;
    // 超出阈值时扩容两倍,并重新计算entry位置,阈值为table.length*2/3其中2/3可以看做是负载因子
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        rehash();
}

2.获取ThreadLocal变量的值

获取ThreadLocal变量就是从当前线程的threadLocalMap中找到该threadLocal对象对应的value

// java.lang.ThreadLocal#get
public T get() {
     
    Thread t = Thread.currentThread();
    ThreadLocalMap map = t.threadLocals;
    if (map != null) {
     
    	// 通过key获取到entry
        ThreadLocalMap.Entry e = map.getEntry(this);
        if (e != null) {
     
            T result = (T)e.value;
            return result;
        }
    }
    // 构建ThreadLocalMap,并用null初始化
    return setInitialValue();
}

// java.lang.ThreadLocal#setInitialValue
private T setInitialValue() {
     
    T value = null;
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null)
        map.set(this, value);
    else
	    // 构建ThreadLocalMap,并用null初始化
        createMap(t, value);
    return value;
}

3.删除ThreadLocal变量的值

类似的,删除threadLocal变量的值的流程就是从当前线程的ThreadLocalMap中获取该threadLocal对应的entry然后将key和value置为null

// java.lang.ThreadLocal#remove
public void remove() {
     
    ThreadLocalMap m = getMap(Thread.currentThread());
    if (m != null)
    	// 取出当前线程的ThreadLocalMap,然后移除键值对
        m.remove(this);
}

// java.lang.ThreadLocal.ThreadLocalMap#remove
private void remove(ThreadLocal<?> key) {
     
    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
     
        // 考虑到hash冲突的情况需要判断key是否是同一个(比较地址)
        if (e.get() == key) {
     
            e.clear();
            expungeStaleEntry(i);
            return;
        }
    }
}

// java.lang.ThreadLocal.ThreadLocalMap#expungeStaleEntry
private int expungeStaleEntry(int staleSlot) {
     
    Entry[] tab = table;
    int len = tab.length;

    // key和value置为null等待gc,size减一
    tab[staleSlot].value = null;
    tab[staleSlot] = null;
    size--;

    // 重新计算entry的位置
    Entry e;
    int i;
    for (i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
     
        ThreadLocal<?> k = e.get();
        // 手动清理过期数据
        if (k == null) {
     
            e.value = null;
            tab[i] = null;
            size--;
        } else {
     
            int h = k.threadLocalHashCode & (len - 1);
            if (h != i) {
     
                tab[i] = null;


                while (tab[h] != null)
                    h = nextIndex(h, len);
                tab[h] = e;
            }
        }
    }
    return i;
}

四、引用分类

强软弱虚四种引用的引入和jvm的内存回收密不可分。
【多线程与并发】ThreadLocal与强软弱虚引用_第1张图片

1.强引用

强引用是我们日常使用最普遍的引用方式例如Object o = new Object(),只要强引用存在,其指向的对象无论何时都不会被jvm回收,换句话说只要引用不指向null该对象就会一直存活。

 /*
输出:
	 obj cleaned...
 */
public static void testStrongRef() throws InterruptedException {
     
    MyObj myObj = new MyObj("obj", null);
    System.gc();
    myObj = null;
    System.gc();
    TimeUnit.MILLISECONDS.sleep(100);
}


static class MyObj {
     
    private String name;
    public Reference<byte[]> padding;

    MyObj(String name, Reference<byte[]> padding) {
     
        this.name = name;
        this.padding = padding;
    }

    @Override
    public String toString() {
     
        return name;
    }

    @Override
    protected void finalize() throws Throwable {
     
        System.out.println(this.name + " cleaned...");
    }
}

2.软引用

软引用指向的对象在jvm堆内存不足时会被释放。比较适用于有用但不是必须的对象,可以用作缓存。

/*
说明:
	MyObj类就是上面那个片段代码中的类
	需要增加虚拟机参数-Xmx10M
	下面不会输出'soft3 cleaned...',因为软引用对象本身不会被回收,回收的是它指向的对象,即字节数组
	
输出:
	null
	[B@2f4d3709
	null
	null
	[B@4e50df2e
	null
	null
	[B@1d81eb93
*/
public static void testSoftRef() throws InterruptedException {
     

    MyObj myObj1 = new MyObj("soft1", new SoftReference<>(new byte[5 * 1024 * 1024]));
    MyObj myObj2 = new MyObj("soft2", new SoftReference<>(new byte[5 * 1024 * 1024]));
    System.out.println(myObj1.padding.get());
    System.out.println(myObj2.padding.get());

    SoftReference<byte[]> bytes1 = new SoftReference<>(new byte[5 * 1024 * 1024]);
    SoftReference<byte[]> bytes2 = new SoftReference<>(new byte[5 * 1024 * 1024]);
    System.out.println(myObj2.padding.get());
    System.out.println(bytes1.get());
    System.out.println(bytes2.get());

    SoftObj softObj1 = new SoftObj("soft3", new byte[5 * 1024 * 1024]);
    SoftObj softObj2 = new SoftObj("soft4", new byte[5 * 1024 * 1024]);
    System.out.println(bytes2.get());
    System.out.println(softObj1.get());
    System.out.println(softObj2.get());

    TimeUnit.MILLISECONDS.sleep(100);
}

static class SoftObj extends SoftReference<byte[]> {
     
    private String name;

    SoftObj(String name, byte[] bytes) {
     
        super(bytes);
        this.name = name;
    }

    @Override
    protected void finalize() throws Throwable {
     
        System.out.println(this.name + " cleaned...");
    }
}

3.弱引用

弱引用指向的对象只要在gc之后就会被释放回收,即使这个gc不是由内存不足产生的,或者gc也没有清除弱引用指向的对象。

/*
输出:
	[B@2f4d3709
	null
*/
public static void testWeakRef(){
     
    WeakReference<byte[]> weak = new WeakReference<>(new byte[1]);
    System.out.println(weak.get());
    System.gc();
    System.out.println(weak.get());
}

像上文ThreadLocalMap中对key的引用就是弱引用,目的是为了防止内存泄露。因为当threadLocal的引用被指向null后,若ThreadLocalMap的key还是强引用的话则这对entry就永远得不到释放了,可以思考下面一段代码。
tl.set(”test“)会在当前线程内部的threadLocalMap设置一对kv(key为tl对象,v为test字符串),当tl指向null后,若threadLocalMap对key(也就是tl对象)的引用是强引用则这一对kv永远也释放不了了,即使该tl不再使用了。

    private static ThreadLocal<String> tl = new ThreadLocal<>();

    public void testThreadLocal() {
     
        tl.set("test");
        System.out.println(tl.get());
        tl = null;
    }

4.虚引用

虚引用是四类引用中最为特殊的一种,它创建的时候除了要传递包裹的对象外还要增加一个引用队列参数。并且你无法获取虚引用指向的对象。那么虚引用究竟有什么作用呢?它是jvm管理直接内存(direct memory,是堆外内存)的一种方式,直接内存的分配和回收都是有Unsafe类去操作,java在申请一块直接内存之后,会在堆内存分配一个对象保存这个堆外内存的引用,这个对象被垃圾收集器管理,一旦这个对象被回收,相应的用户线程会收到通知并对直接内存进行清理工作。工作方式类似于下面这段代码。

/*
说明:
	phantomReference.get()永远返回null
	当虚引用指向的对象被gc时,虚引用对象就会进入到引用队列中。
*/
public static void testPhantomRef() throws InterruptedException {
     
    Object obj = new Object();	// 可以看做是堆外内存
    ReferenceQueue<Object> referenceQueue = new ReferenceQueue<>();
    PhantomReference<Object> phantomReference = new PhantomReference<>(obj, referenceQueue);
    System.out.println(phantomReference.get());
    System.out.println(referenceQueue.poll());

    Thread thread = new Thread(() -> {
     
        Reference reference;
        for (reference = referenceQueue.poll(); reference == null; ) {
     
            reference = referenceQueue.poll();
        }
        System.out.println(reference);	// 感知到堆外内存被gc了,unsafe清理堆外内存
    });

    thread.start();
    obj = null;
    System.gc();	//堆外内存被gc
    thread.join();

}

五、小结

对象被回收时间 用途
强引用 永远不会 对象常用的引用方式
软引用 内存不足时 缓存可以缓存但非必须缓存的对象
弱引用 gc发生后 ThreadLocal
虚引用 所指向的对象被gc jvm管理直接内存

六、参考

Java:强引用,软引用,弱引用和虚引用
强软弱虚引用,只有体会过了,才能记住

你可能感兴趣的:(Java)