关键字volatile
可以说是Java虚拟机提供的最轻量级的同步机制,Java内存模型为volatile
专门定义了一些特殊的访问规则,在介绍这些比较拗口的规则定义之前,先用一些不那么正式,但通俗易懂的语言来介绍一下这个关键字的作用。
当一个变量被定义成volatile
之后,它将具备两项特性:第一项是保证此变量对所有线程的可见性,这里的“可见性”是指当一条线程修改了这个变量的值,新值对于其他线程来说是可以立即得知的。而普通变量并不能做到这一点,普通变量的值在线程间传递时均需要通过主内存来完成。比如,线程A修改一个普通变量的值,然后向主内存进行回写,另外一条线程B在线程A回写完成了之后再对主内存进行读取操作,新变量值才会对线程B可见。
关于volatile
变量的可见性,经常会被开发人员误解,他们会误以为下面的描述是正确的:“volatile
变量对所有线程是立即可见的,对volatile变量所有的写操作都能立刻反映到其他线程之中。换句话说,volatile
变量在各个线程中是一致的,所以基于volatile
变量的运算在并发下是线程安全的”。这句话的论据部分并没有错,但是由其论据并不能得出“基于volatile
变量的运算在并发下是线程安全的”这样的结论。volatile
变量在各个线程的工作内存中是不存在一致性问题的(从物理存储的角度看,各个线程的工作内存中volatile
变量也可以存在不一致的情况,但由于每次使用之前都要先刷新,执行引擎看不到不一致的情况,因此可以认为不存在一致性问题),但是Java里面的运算操作符并非原子操作,这导致volatile变量的运算在并发下一样是不安全的,可以通过一段简单的演示来说明原因,下面的代码可以演示类似的例子:
/**
* volatile变量自增运算测试
*
* @author zh
*/
public class VolatileTest {
public static volatile int race = 0;
public static void increase() {
race++;
}
private static final int THREADS_COUNT = 20;
public static void main(String[] args) {
Thread[] threads = new Thread[THREADS_COUNT];
for (int i = 0; i < THREADS_COUNT; i++) {
threads[i] = new Thread(new Runnable() {
@Override
public void run() {
for (int i = 0; i < 10000; i++) {
increase();
}
}
});
threads[i].start();
}
// 等待所有累加线程都结束
while (Thread.activeCount() > 1)
Thread.yield();
System.out.println(race);
}
}
这段代码发起了20个线程,每个线程对race
变量进行10000次自增操作,如果这段代码能够正确并发的话,最后输出的结果应该是200000。但运行完这段代码之后,并不会获得期望的结果,而且每次运行程序,输出的结果都不一样,都是一个小于200000的数字。
问题就出在自增运算“race++
”之中,我们用Javap反编译这段代码后会得到下面的代码清单,发现只有一行代码的increase()
方法在Class文件中是由4条字节码指令构成(return指令不是由race++产生的,这条指令可以不计算),从字节码层面上已经很容易分析出并发失败的原因了:当getstatic
指令把race
的值取到操作栈顶时,volatile
关键字保证了race
的值在此时是正确的,但是在执行iconst_1
、iadd
这些指令的时候,其他线程可能已经把race
的值改变了,而操作栈顶的值就变成了过期的数据,所以putstatic
指令执行后就可能把较小的race
值同步回主内存之中。
public static void increase();
Code:
Stack=2, Locals=0, Args_size=0
0: getstatic #13; //Field race:I
3: iconst_1
4: iadd
5: putstatic #13; //Field race:I
8: return
LineNumberTable:
line 14: 0
line 15: 8
使用字节码来分析并发问题仍然是不严谨的,因为即使编译出来只有一条字节码指令,也并不意味执行这条指令就是一个原子操作。一条字节码指令在解释执行时,解释器要运行许多行代码才能实现它的语义。如果是编译执行,一条字节码指令也可能转化成若干条本地机器码指令。此处使用-XX:+PrintAssembly
参数输出反汇编来分析才会更加严谨一些,但是考虑到阅读的方便性,并且字节码已经能很好地说明问题,所以此处使用字节码来解释。
由于volatile
变量只能保证可见性,在不符合以下两条规则的运算场景中,仍然要通过加锁(使用synchronized
、java.util.concurrent
中的锁或原子类)来保证原子性:
而在像如下代码所示的这类场景中就很适合使用volatile
变量来控制并发,当shutdown()
方法被调用时,能保证所有线程中执行的doWork()
方法都立即停下来。
volatile boolean shutdownRequested;
public void shutdown() {
shutdownRequested = true;
}
public void doWork() {
while (!shutdownRequested) {
// 代码的业务逻辑
}
}
使用volatile
变量的第二个语义是禁止指令重排序优化,普通的变量仅会保证在该方法的执行过程中所有依赖赋值结果的地方都能获取到正确的结果,而不能保证变量赋值操作的顺序与程序代码中的执行顺序一致。因为在同一个线程的方法执行过程中无法感知到这点,这就是Java内存模型中描述的所谓“线程内表现为串行的语义”(Within-Thread As-If-Serial Semantics)。
上面描述仍然比较拗口难明,我们还是继续通过一个例子来看看为何指令重排序会干扰程序的并发执行。演示程代码如下所示:
Map configOptions;
char[] configText;
// 此变量必须定义为volatile
volatile boolean initialized = false;
// 假设以下代码在线程A中执行
// 模拟读取配置信息,当读取完成后
// 将initialized设置为true,通知其他线程配置可用
configOptions = new HashMap();
configText = readConfigFile(fileName);
processConfigOptions(configText, configOptions);
initialized = true;
// 假设以下代码在线程B中执行
// 等待initialized为true,代表线程A已经把配置信息初始化完成
while (!initialized) {
sleep();
}
// 使用线程A中初始化好的配置信息
doSomethingWithConfig();
上述中所示的程序是一段伪代码,其中描述的场景是开发中常见配置读取过程,只是在处理配置文件时一般不会出现并发,所以没有察觉这会有问题。如果定义initialized
变量时没有使用volatile
修饰,就可能会由于指令重排序的优化,导致位于线程A中最后一条代码“initialized=true
”被提前执行(这里虽然使用Java作为伪代码,但所指的重排序优化是机器级的优化操作,提前执行是指这条语句对应的汇编代码被提前执行),这样在线程B中使用配置信息的代码就可能出现错误,而volatile
关键字则可以避免此类情况的发生。
指令重排序是并发编程中最容易导致开发人员产生疑惑的地方之一,除了上面伪代码的例子之外,可以再举一个可以实际操作运行的例子来分析volatile
关键字是如何禁止指令重排序优化的。下面代码展示的是一段标准的双锁检测(Double Check Lock,DCL)单例代码,可以观察加入volatile
和未加入volatile
关键字时所生成的汇编代码的差别。
public class Singleton {
private volatile static Singleton instance;
public static Singleton getInstance() {
if (instance == null) {
synchronized (Singleton.class) {
if (instance == null) {
instance = new Singleton();
}
}
}
return instance;
}
public static void main(String[] args) {
Singleton.getInstance();
}
}
编译后,这段代码对instance
变量赋值的部分如以下代码所示:
0x01a3de0f: mov $0x3375cdb0,%esi ;...beb0cd75 33
; {oop('Singleton')}
0x01a3de14: mov %eax,0x150(%esi) ;...89865001 0000
0x01a3de1a: shr $0x9,%esi ;...c1ee09
0x01a3de1d: movb $0x0,0x1104800(%esi) ;...c6860048 100100
0x01a3de24: lock addl $0x0,(%esp) ;...f0830424 00
;*putstatic instance
; - Singleton::getInstance@24
解决了volatile
的语义问题,再来看看在众多保障并发安全的工具中选用volatile
的意义——它能让我们的代码比使用其他的同步工具更快吗?在某些情况下,volatile
的同步机制的性能确实要优于锁(使用synchronized
关键字或java.util.concurrent
包里面的锁),但是由于虚拟机对锁实行的许多消除和优化,使得很难确切地说volatile
就会比synchronized
快上多少。如果让volatile
自己与自己比较,那可以确定一个原则:volatile
变量读操作的性能消耗与普通变量几乎没有什么差别,但是写操作则可能会慢上一些,因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。不过即便如此,**大多数场景下volatile
的总开销仍然要比锁来得更低。在volatile
与锁中选择的唯一判断依据仅仅是volatile的语义能否满足使用场景的需求。
Java内存模型中对volatile变量定义的特殊规则的定义。假定T表示一个线程,V和W分别表示两个volatile型变量,那么在进行read、load、use、assign、store和write操作时需要满足如下规则:
这条规则要求在工作内存中,每次使用V前都必须先从主内存刷新最新的值,用于保证能看见其他线程对变量V所做的修改。
这条规则要求在工作内存中,每次修改V后都必须立刻同步回主内存中,用于保证其他线程可以看到自己对变量V所做的修改。
这条规则要求volatile修饰的变量不会被指令重排序优化,从而保证代码的执行顺序与程序的顺序相同。