当读一个volatile变量时,JMM会把该线程对应的本地内存置为无效。线程接下来将从主内存中读取共享变量(注意不仅仅是一个volatile变量,是所有共享变量)
当写一个volatile变量时,JMM会把该线程对应的本地内存中的共享变量值刷新到主内存(注意不仅仅是一个volatile变量,是所有共享变量)
可见性的意思是当一个线程修改一个共享变量时,另外一个线程能读到这个修改的值。
如果一个字段被声明为volatile,Java线程内存模型确保所有线程看到这个变量的值是一致的。
我们使用X86处理器下通过工具获取JIT编译器生成的汇编指令来查看对volatile进行写操作会发生什么
instance = new Singleton();
转成汇编代码如下
0x01a3de1d: movb $0×0,0×1104800(%esi);0x01a3de24: lock addl $0×0,(%esp);
我们发现了lock前缀的指令,Lock前缀的指令在多核处理器下会发生两件事情:
为了提高处理速度,处理器不直接和内存进行通信,而是先将系统内存的数据读到内部缓存(L1,L2或其他)后再进行操作,但操作完不知道何时会写到内存。如果对声明了volatile的变量进行写操作,JVM就会向处理器发送一条Lock前缀的指令,将这个变量所在缓存行的数据写回到系统内存。但是,就算写回到内存,如果其他处理器缓存的值还是旧的,再执行计算操作就会有问题。所以,在多处理器下,为了保证各个处理器的缓存是一致的,就会实现缓存一致性协议,每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了,当处理器发现自己缓存行对应的内存地址被修改,就会将当前处理器的缓存行设置成无效状态,当处理器对这个数据进行修改操作的时候,会重新从系统内存中把数据读到处理器缓存里。
重排序是指编译器和处理器为了优化程序性能在不影响程序执行结果的前提下而对指令序列进行重新排序的一种手段。
如果两个操作访问同一个变量,且至少一个操作是写操作,此时这两个操作之间就存在数据依赖性。
名称 | 代码示例 | 说明 |
---|---|---|
写后读 | a=1;b=a; | 写一个变量后,再读这个变量 |
写后写 | a=1;b=1; | 写一个变量后,再写这个变量 |
读后写 | a=b;b=1; | 读一个变量后,再写这个变量 |
上面三种情况,只要重排序两个操作的执行顺序,程序的执行结果就会被改变。
前面提到过,编译器和处理器可能会对操作做重排序。编译器和处理器再重排序时,会遵守数据依赖性,编译器和处理器不会改变存在数据依赖关系的两个操作的顺序。
这里说的数据依赖性仅针对单个处理器中执行的指令序列和单个线程中执行的操作,不同处理器之间和不同线程之间的数据依赖性不会被考虑,也就是说多线程下重排序可能会影响执行的结果。
现在有AB两个线程,A线程调用writer()
方法,B线程调用reader()
方法。因为A线程中的操作1与操作2不具备数据依赖性,所以会发生指令重排,同样操作3和操作4也不具备数据依赖性。当线程B在执行操作4时,能否看到线程A在操作1对共享变量a的写入?不一定!
class ReorderExample {
int a = 0;
boolean flag = false;
public void writer() {
a = 1; // 1
flag = true; // 2
}
public void reader() {
if (flag) { // 3
int i = a * a; // 4
}
}
}
所以说多线程下重排序可能会影响执行的结果
内存屏障是一个 CPU 指令,不同的硬件实现内存屏障的手段不一样,java通过屏蔽这些差异,统一由jvm来生成内存屏障的指令。
阻止屏障两侧的代码指令重排序
强制将工作内存中的数据写回主内存,让工作内存中的数据失效。
class VolatileBarrierExample {
int a;
volatile int v1 = 1;
volatile int v2 = 2;
void readAndWrite() {
int i = v1; // 第一个volatile读
int j = v2; // 第二个volatile读
a = i + j; // 普通写
v1 = i + 1; // 第一个volatile写
v2 = j * 2; // 第二个 volatile写
}
… // 其他方法
}
可以看出策略及其保守,但是在连续的加屏障操作中,jvm会自行进行优化,除去不必要的屏障。这就叫:首先保证正确性,然后再去追寻执行效率。
所有写操作的后面插入StoreLoad屏障还有一个重要作用,因为写操作之后方法可能会return,此时编译器无法确定后面时候会有bolatile读或写,所以为了安全起见,编译器通常会在这里插入一个StoreLoad屏障。
部分参考《并发编程的艺术》