ThreadLocal,直译为“线程本地”或“本地线程”,如果你真的这么认为,那就错了!其实,它就是一个容器,用于存放线程的局部变量,我认为应该叫做 ThreadLocalVariable(线程局部变量)才对,真不理解为什么当初 Sun 公司的工程师这样命名。
早在 JDK 1.2 的时代,java.lang.ThreadLocal 就诞生了,它是为了解决多线程并发问题而设计的,只不过设计得有些难用,所以至今没有得到广泛使用。其实它还是挺有用的,不相信的话,我们一起来看看这个例子吧。
一个序列号生成器的程序,可能同时会有多个线程并发访问它,要保证每个线程得到的序列号都是自增的,而不能相互干扰。
先定义一个接口:
1
2
3
4
|
public
interface
Sequence {
int
getNumber();
}
|
每次调用 getNumber() 方法可获取一个序列号,下次再调用时,序列号会自增。
再做一个线程类:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
public
class
ClientThread
extends
Thread {
private
Sequence sequence;
public
ClientThread(Sequence sequence) {
this
.sequence = sequence;
}
@Override
public
void
run() {
for
(
int
i =
0
; i <
3
; i++) {
System.out.println(Thread.currentThread().getName() +
" => "
+ sequence.getNumber());
}
}
}
|
在线程中连续输出三次线程名与其对应的序列号。
我们先不用 ThreadLocal,来做一个实现类吧。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
public
class
SequenceA
implements
Sequence {
private
static
int
number =
0
;
public
int
getNumber() {
number = number +
1
;
return
number;
}
public
static
void
main(String[] args) {
Sequence sequence =
new
SequenceA();
ClientThread thread1 =
new
ClientThread(sequence);
ClientThread thread2 =
new
ClientThread(sequence);
ClientThread thread3 =
new
ClientThread(sequence);
thread1.start();
thread2.start();
thread3.start();
}
}
|
序列号初始值是0,在 main() 方法中模拟了三个线程,运行后结果如下:
Thread-0 => 1
Thread-0 => 2
Thread-0 => 3
Thread-2 => 4
Thread-2 => 5
Thread-2 => 6
Thread-1 => 7
Thread-1 => 8
Thread-1 => 9
由于线程启动顺序是随机的,所以并不是0、1、2这样的顺序,这个好理解。为什么当 Thread-0 输出了1、2、3之后,而 Thread-2 却输出了4、5、6呢?线程之间竟然共享了 static 变量!这就是所谓的“非线程安全”问题了。
那么如何来保证“线程安全”呢?对应于这个案例,就是说不同的线程可拥有自己的 static 变量,如何实现呢?下面看看另外一个实现吧。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
public
class
SequenceB
implements
Sequence {
private
static
ThreadLocal
new
ThreadLocal
@Override
protected
Integer initialValue() {
return
0
;
}
};
public
int
getNumber() {
numberContainer.set(numberContainer.get() +
1
);
return
numberContainer.get();
}
public
static
void
main(String[] args) {
Sequence sequence =
new
SequenceB();
ClientThread thread1 =
new
ClientThread(sequence);
ClientThread thread2 =
new
ClientThread(sequence);
ClientThread thread3 =
new
ClientThread(sequence);
thread1.start();
thread2.start();
thread3.start();
}
}
|
通过 ThreadLocal 封装了一个 Integer 类型的 numberContainer 静态成员变量,并且初始值是0。再看 getNumber() 方法,首先从 numberContainer 中 get 出当前的值,加1,随后 set 到 numberContainer 中,最后将 numberContainer 中 get 出当前的值并返回。
是不是很恶心?但是很强大!确实稍微饶了一下,我们不妨把 ThreadLocal 看成是一个容器,这样理解就简单了。所以,这里故意用 Container 这个单词作为后缀来命名 ThreadLocal 变量。
运行结果如何呢?看看吧。
Thread-0 => 1
Thread-0 => 2
Thread-0 => 3
Thread-2 => 1
Thread-2 => 2
Thread-2 => 3
Thread-1 => 1
Thread-1 => 2
Thread-1 => 3
每个线程相互独立了,同样是 static 变量,对于不同的线程而言,它没有被共享,而是每个线程各一份,这样也就保证了线程安全。 也就是说,TheadLocal 为每一个线程提供了一个独立的副本!
搞清楚 ThreadLocal 的原理之后,有必要总结一下 ThreadLocal 的 API,其实很简单。
- public void set(T value):将值放入线程局部变量中
- public T get():从线程局部变量中获取值
- public void remove():从线程局部变量中移除值(有助于 JVM 垃圾回收)
- protected T initialValue():返回线程局部变量中的初始值(默认为 null)
为什么 initialValue() 方法是 protected 的呢?就是为了提醒程序员们,这个方法是要你们来实现的,请给这个线程局部变量一个初始值吧。
了解了原理与这些 API,其实想想 ThreadLocal 里面不就是封装了一个 Map 吗?自己都可以写一个 ThreadLocal 了,尝试一下吧。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
public
class
MyThreadLocal
private
Map
new
HashMap
public
void
set(T value) {
container.put(Thread.currentThread(), value);
}
public
T get() {
Thread thread = Thread.currentThread();
T value = container.get(thread);
if
(value ==
null
&& !container.containsKey(thread)) {
value = initialValue();
container.put(thread, value);
}
return
value;
}
public
void
remove() {
container.remove(Thread.currentThread());
}
protected
T initialValue() {
return
null
;
}
}
|
以上完全山寨了一个 ThreadLocal,其中中定义了一个同步 Map(为什么要这样?请读者自行思考),代码应该非常容易读懂。
下面用这 MyThreadLocal 再来实现一把看看。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
public
class
SequenceC
implements
Sequence {
private
static
MyThreadLocal
new
MyThreadLocal
@Override
protected
Integer initialValue() {
return
0
;
}
};
public
int
getNumber() {
numberContainer.set(numberContainer.get() +
1
);
return
numberContainer.get();
}
public
static
void
main(String[] args) {
Sequence sequence =
new
SequenceC();
ClientThread thread1 =
new
ClientThread(sequence);
ClientThread thread2 =
new
ClientThread(sequence);
ClientThread thread3 =
new
ClientThread(sequence);
thread1.start();
thread2.start();
thread3.start();
}
}
|
每个线程的变量副本是存储在哪里的?
2、变量副本是怎么从共享的那个变量赋值出来的?源码中的threadlocal的初始值是什么时机设置的?
=====================================
最关键的问题是:ThreadLocal是怎么实现了多个线程之间每个线程一个变量副本的?它是如何实现共享变量的。
ThreadLocal提供了set和get访问器用来访问与当前线程相关联的线程局部变量。
可以从ThreadLocal的get函数中看出来,其中getmap函数是用t作为参数,这里t就是当前执行的线程。
从而得知,get函数就是从当前线程的threadlocalmap中取出当前线程对应的变量的副本【注意,变量是保存在线程中的,而不是保存在ThreadLocal变量中】。当前线程中,有一个变量引用名字是threadLocals,这个引用是在ThreadLocal类中createmap函数内初始化的。每个线程都有一个这样的threadLocals引用的ThreadLocalMap,以ThreadLocal和ThreadLocal对象声明的变量类型作为参数。这样,我们所使用的ThreadLocal变量的实际数据,通过get函数取值的时候,就是通过取出Thread中threadLocals引用的map,然后从这个map中根据当前threadLocal作为参数,取出数据。现在,变量的副本从哪里取出来的(本文章提出的第一个问题)已经确认解决了。
【ThreadLocal整体上给我的感觉就是,一个包装类。声明了这个类的对象之后,每个线程的数据其实还是在自己线程内部通过threadLocals引用到的自己的数据。只是通过ThreadLocal访问这个数据而已】
=================================
那么还剩下第二个问题。变量副本是什么时候“复制”到threadlocal中的呢?这里“复制”两个字用的很不专业。准确的说,应该是,变量副本【每个线程中保存的那个map中的变量】是怎么声明和初始化的?
看下面set函数的源码:
当线程中的threadlocalmap是null的时候,会调用createmap创建一个map。同时根据函数参数设置上初始值。也就是说,当前线程的threadlocalmap是在第一次调用set的时候创建map并且设置上相应的值的。
对于这篇文章中的例子,每个线程打印的东西都是相互独立的,是因为SequenceNumber的getNextNum()函数中先set了一个值,再get。写到这里,终于清楚了ThreadLocal的运作方法了。
解释如下:
1、在代码中声明的ThreadLocal对象,实际上只有一个。
2、在每个线程中,都维护了一个threadlocals对象,在没有ThreadLocal变量的时候是null的。一旦在ThreadLocal的createMap函数中初始化之后,这个threadlocals就初始化了。以后每次那个ThreadLocal对象想要访问变量的时候,比如set函数和get函数,都是先通过getMap(t)函数,先将线程的map取出,然后再从这个在线程(Thread)中维护的map中取出数据【以当前threadlocal作为参数】。
到此,第二个问题也解决了。
从这个函数中可以看出来,Thread中的threadlocals变量是在ThreadLocal对象中调用createMap函数来初始化的。其实在Thread的代码中可以搜搜看,是没有threadlocals这个变量的很多应用场景的。主要就是用在ThreadLocal中用来set和get函数中。
———————————————————-
那么上面的问题解决之后,又来了一个问题。不同的线程局部变量,比如说声明了n个(n>=2)这样的线程局部变量threadlocal,那么在Thread中的threadlocals中是怎么存储的呢?threadlocalmap中是怎么操作的?
在ThreadLocal的set函数中,可以看到,其中的map.set(this, value);把当前的threadlocal传入到map中作为键,也就是说,在不同的线程的threadlocals变量中,都会有一个以你所声明的那个线程局部变量threadlocal作为键的key-value。假设说声明了N个这样的线程局部变量变量,那么在线程的ThreadLocalMap中就会有n个分别以你的线程局部变量作为key的键值对。