一句话,Java内存模型是为了解决多线程安全问题的一种Java虚拟机实现的规范。
程序,就是指令与数据的集合,指令由处理器执行,指令对象为内存中的数据
处理器的运算速度比主内存的读写速度要快得多(几个数量级),如果处理器直接与主内存交互,那处理器在访问内存时就要花很长时间来等待内存的操作,所以在处理器与主内存之间加上高速缓存作为缓冲,减少处理器的等待时间。
将运算需要用到的数据复制到缓存中,让运算能快速进行,当运算结束后再从缓存同步回主内存中,这样处理器就无需等待缓慢的内存读写了。
基于高速缓存的存储交互很好地解决了处理器与内存的速度矛盾,但是也为计算系统带来更高的复杂度,因为它引入了一个新的问题:缓存一致性(Cache Coherence)。
当多个处理器的运算任务都涉及同一块主内存区域时,将可能导致各自的缓存数据不一致,如果真的发生这种情况,那同步回到主内存时以谁的缓存数据为准呢?
所以,高速缓存与主内存之间的交互,需要遵循一些协议,这些协议就是为了解决缓存一致性而存在的
多线程安全问题
为了使得处理器内部的运算单元尽量被充分利用,处理器可能会对输入代码进行乱序执行(Out-Of-Order Execution)优化,处理器会在计算之后将乱序执行的结果重组,保证该结果与顺序执行的结果是一致的,并不保证程序中各个语句计算的先后顺序与输入代码中的顺序一致。
Java虚拟机的即时编译器中也有类似的指令重排序优化
Java虚拟机规范中试图定义一种Java内存模型,来屏蔽各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。
平台开关性,同一套代码不能在一个平台上线程安全,在另一个平台上就出问题
Java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节。
此处的变量(Variables)与Java编程中所说的变量有所区别,它包括了实例字段、静态字段和构成数组对象的元素,但不包括局部变量与方法参数(如果局部变量是一个reference类型,它引用的对象在Java堆中可被各个线程共享,但是reference本身在Java栈的局部变量表中,它是线程私有的)
主内存与工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存之类的实现细节
Java内存模型还定义了主内存、工作内存,线程间变量值的传递均需要通过主内存来完成
注意:
为了获得较好的执行效能,Java内存模型并没有限制执行引擎使用处理器的特定寄存器或缓存来和主内存进行交互,也没有限制即时编译器进行调整代码执行顺序这类优化措施
总的来说,虚拟机把运行内存、物理内存(文件)、堆、方法区等存储共享数据的地方,抽象成主内存;把寄存器、高速缓存、栈等存储私有数据的地方,抽象成工作内存。
Java内存模型定义了8种操作,来实现主内存和工作内存之间的交互,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存之类的实现细节。
这8种操作,虚拟机实现时,必须保证都是原子的,不可再分的。
double、long类型在某些平台上允许有例外
字节码指令为monitorenter,对应的Java关键字为synchronized
多线程安全问题产生的根本原因?
下面三个特征,有一个不符合,就有可能出现多线程安全问题
Java内存模型是围绕着在并发过程中如何处理原子性、可见性和有序性这3个特征来建立的。
只要代码保证了这三个特征,就是线程安全的
原子性的一般定义为:一个或多个操作,要么都执行成功,要么都不执行。
在多线程中,原子性,就是代码在被一个线程在执行时,排斥其它线程。
由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store、和write,我们大致可以认为基本数据类型的访问读写是具备原子性的(long和double有非原子性协定,但无须太过在意这些几乎不会发生的例外情况)。
如果应用场景需要一个更大范围的原子性保证,Java内存模型还提供了lock和unlock操作来满足这种需求,尽管虚拟机未把lock和unlock操作直接开放给用户使用,但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作,这两个字节码指令反映到Java代码中就是同步块——synchronized关键字,因此在synchronized块之间的操作也具备原子性。
Java语言提供synchronized保证原子性
可见性是指当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。
Java内存模型是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方式来实现可见性的,无论是普通变量还是volatile变量都是如此,普通变量与volatile变量的区别是,volatile的特殊规则保证了新值能立即同步到主内存,以及每次使用前立即从主内存刷新。因此,可以说volatile保证了多线程操作时变量的可见性,而普通变量则不能保证这一点。
Java语言提供volatile、synchronized保证可见性
synchronized怎么保证可见性?
public class VolatileTest2 {
private static int number = 0;
private static class ReaderThread extends Thread {
@Override
public void run() {
if (number == 0) {
System.out.println("synchronized外,线程" + Thread.currentThread().getName() + ",number = " + number);
Thread.yield();
synchronized (VolatileTest2.class) {
System.out.println("synchronized内,线程" + Thread.currentThread().getName() + ",number = " + number);
if (number == 0) {
number = 1;
System.out.println("synchronized内,线程" + Thread.currentThread().getName() + ",修改number,number = " + number);
Thread.yield();
}
}
}
}
}
public static void main(String[] args) {
new ReaderThread().start();
new ReaderThread().start();
}
}
输出
synchronized外,线程Thread-0,number = 0
synchronized内,线程Thread-0,number = 0
synchronized内,线程Thread-0,修改number,number = 1
synchronized外,线程Thread-1,number = 0
synchronized内,线程Thread-1,number = 1
synchronized怎么保证可见性?
注意:这里清空的工作内存,是本线程的工作内存,其它线程的工作内存不会被清空
结论:synchronized保证的是同一个块内的共享变量的可见性,其在块外的可见性不会被保证
有序性分时间有序性和语义有序性,JVM保证单线程下指令执行的语义有序性,CPU保证自身指令执行的语义有序性。
JVM和CUP都存在指令重排序的情况,都是为了提高并行度、提高程序运行效率。
就是对没有依赖关系的指令,可以进行乱序执行。
如
int a = 1; // 1
int b = a + 1; // 2
int c = 2; // 3
在这个例子中,3与1,3与2都没有依赖关系,所以3可以先执行,也可以在中间执行,还可以在最后执行;而1与2有依赖关系,2只能在1执行后再执行
volatile保证时间有序性,是指所修饰变量前后的代码不能重排序,但是前和后的代码可以分别重排序。
Java语言提供volatile、synchronized保证有序性
final变量也可以保证有序性
synchronized怎么保证有序性的?
synchronized是通过排斥其它线程,实现的排队执行synchronized代码块的有序性,但是,它并不能保证块内代码执行的有序性。换句话说,synchronized保证的是整体的有序性,不保证内部的有序性。
注意:代码先不一定就先行发生
先行发生原则是判断数据是否存在竞争、线程是否安全的主要依据。
先行发生是Java内存模型中定义的两项操作之间的偏序关系,如果说操作A先行发生于操作B,其它就是说在发生操作B之前,操作A产生的影响能被操作B观察到,“影响”包括修改了内存中共享变量的值、发送了消息、调用了方法等。
注意:
- 先行发生不等于代码书写在前,代码书写在前不等于先行发生。
- happens-before规则不是描述实际操作的先后顺序,它是用来描述可见性的一种规则
如果代码符合以下规则之一,就是天然的先行发生,就是线程安全的(在保证原子性的前提下)。
程序次序规则(Program Order Rule):在一个线程内,按照程序代码顺序,书写在前面的操作先行发生于书写在后面的操作。准确地说,应该是控制流顺序而不是程序代码顺序,因为要考虑分支、循环等结构。
管程锁定规则(Monitor Lock Rule):一个unlock操作先行发生于后面对同一个锁的lock操作。这里必须强调的是同一个锁,面“后面”是指时间上的先后顺序。
如果线程1解锁了monitor a,接着线程2锁定了a,那么,线程1解锁a之前的写操作都对线程2可见(线程1和线程2可以是同一个线程)。这里强调的是同一个锁!
如果线程1写入了volatile变量v(这里和后续的“变量”都指的是对象的字段、类字段和数组元素),接着线程2读取了v,那么,线程1写入v及之前的写操作都对线程2可见(线程1和线程2可以是同一个线程)。
线程启动规则(Thrad Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作。
线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值等手段检测到线程已经终止执行。
线程中断规则(Thread Interruption Rule):对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生,可以通过Thread.interrupted()方法检测到是否有中断发生。
对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始。
传递性(Transitivity):如果操作A先行发生于操作B,操作B先行发生于操作C,那就可以得出操作A先行发生于操作C的结论。
语言的尽头都是机器指令,CPU指令集也针对乱序执行也有相关指令,这里我们以x86为例
上述只是x86指令集下的相关指令,不同的指令集可能barrier的效果并不一样,fence和lock是两种实现内存屏障的方式(毕竟一个指令集很庞大)
JMM也定义了4种内存屏障(JVM再使用CPU指令去实现这些语义)
Load1;LoadLoad;Load2
,确保 Load1 数据的装载,之前于 Load2 及所有后续装载指令的装载。保证Load1要读取的数据被读取完毕Store1;StoreStore;Store2
,确保 Store1 数据对其他处理器可见(刷新到内存),之前于Store2 及所有后续存储指令的存储。保证Store1的写入操作对其它处理器可见Load1;LoadStore;Store2
,Load1 数据装载,之前于Store2 及所有后续的存储指令刷新到内存。保证Load1要读取的数据被读取完毕Store1;StoreLoad;Load2
,确保 Store1 数据对其他处理器变得可见(指刷新到内存),之前于Load2 及所有后续装载指令的装载。StoreLoad Barriers 会使该屏障之前的所有内存访问指令(存储和装载指令)完成之后,才执行该屏障之后的内存访问指令。这个屏障是个万能屏障,兼具其它三种内存屏障的功能注意
- 对于不同的处理器/指令集(平台),JVM有不同的实现方式,比如有可能在x86上一个StoreLoad会使用mfence去实现(猜测)
- 这四个barrier是JVM内存模型的规范,而不是具体的字节码指令,volatile变量在字节码中只是一个标志位,javap反编译是没有barriers的,只是说JVM执行引擎会在执行时会插一个对应的屏障,或者说在JIT/AOT生成机器指令的时候插一条对应逻辑的barriers,说句人话,这个barrier不是javac插的!
总结
到这里我们可以看到,其实不存在任何一种指令能够禁止乱序执行,我们能做到的只是把这一堆指令根据“分段”,比如在指令中插入一条full barrier指令,然后所有指令被分成了两段,barrier前面的我们称之为程序段A,后面的称之为程序段B,通过barrier我们能够保证A所有指令的执行都在B之前,也就是说,程序段A和B分别都是乱序执行的。
总结下来,内存屏障有三个作用:
volatile的内存屏障策略非常严格保守,非常悲观且毫无安全感的心态:
由于内存屏障的作用,避免了volatile变量和其它指令重排序、实现了线程之间的通信,使得volatile表现出了锁的特性。
volatile 的读性能消耗与普通变量几乎相同,但是写操作稍慢,因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。
volatile可以保证可见性、有序性(禁止指令重排)
它是Java虚拟机提供的最轻量级的同步机制
volatile怎么保证可见性?
volatile怎么保证有序性?
注意:volatile关键字在jdk1.5后才被完全修复,在1.4及之前的版本,volatile变量前后的代码仍然存在重排序的问题。
基于volatile变量的运算在并发下是安全的,这是错误的(它不保证原子性)
示例代码
public class VolatileTest {
private static volatile int race = 0;
private static void increase() {
race++;
}
public static void main(String[] args) throws Exception {
Thread[] threads = new Thread[20];
for (int i = 0; i < 20; i++) {
threads[i] = new Thread(() -> {
for (int j = 0; j < 10000; j++) {
increase();
}
});
threads[i].start();
}
for (Thread t : threads) {
while (t.isAlive()) {
Thread.sleep(100);
}
}
System.out.println(race);
}
}
输出
125637
原因?
race++;
这句代码,编译成Class文件时,由4个字节码指令构成,分别是getstatic、iconst_1、iadd、putstatic,
一条字节码指令,并不一定就是一个原子操作,如这里,这4个字节码,需要read、load、use、assign、stroe、write6个Java内存模型定义的原子操作来完成,当然,如果
race++;
被synchronized修饰,那这4个字节码就是原子操作的一部分了。
从字节码上分析原因:当getstatic指令把race的值取到操作栈顶时,volatile关键字保证了race的值在些时是正确的,但是在执行iconst_1、iadd这些指令的时候,其他线程可能已经把race的值加大了,而在操作栈顶的值就变成了过期的数据,所以putstatic指令执行后就可能把较小的race值同步回主内存之中。
根本原因:变量的操作不是原子操作
解决办法很多,如使用synchronized或java.util.concurrent中的原子类
private static volatile SingleInstance instance;
instance = new SingleInstance(); // 1
语句1转换成汇编代码,在赋值给instance后,会多一个指令,lock addl $0x0,(%esp)
,addl $0x0,(%esp)
(把ESP寄存器的值加0)是一个空操作,目的是使用lock
指令,原因是lock
不能搭配空操作指令nop
使用。lock
的作用是使得本CPU的Cache写入了内存,该写入动作也会引起别的CPU或者别的内核无效化(Invalidate)其Cache,这种操作相当于对Cache中的变量做了一次前面介绍Java内存模型中所说的“store”和“write”操作。所以通过这样一个操作,可让前面volatile变量的修改对其它CPU立即可见。
通俗地说,对volatile变量的修改,会立即同步回主内存,并且会无效化其它线程中的缓存
lock addl $0x0,(%esp)
这个指令就是传说中的“内存屏障”
由于lock指令可以禁止其前后代码的重排序,自其前的代码肯定先执行于其后的代码
当代码符合以下两条规则时,可使用volatile保证线程安全
第一条很好理解,就是上面的代码例子。第二条是什么意思呢?可以看看下面这个场景:
volatile static int start = 3;
volatile static int end = 6;
线程A执行如下代码:
while (start < end){
//do something
}
线程B执行如下代码:
start+=3;
end+=3;
这种情况下,一旦在线程A的循环中执行了线程B,start有可能先更新成6,造成了一瞬间 start == end,从而跳出while循环的可能性。
下面这种情况,适合使用volatile
volatile boolean shutdownRequested;
public void shutdown() {
shutdownRequested = true;
}
public void doWord() {
while(!shutdownRequested) {
// do stuff
}
}
shutdownRequested的赋值不依赖原值,也与其它变量无关
DCL(double-checked locking)
是不是使用synchronized,线程就一定安全?
public class SingletonClass4 {
private static SingletonClass4 instance;
private int someField;
private SingletonClass4() {
this.someField = 1;
}
public static SingletonClass4 getInstance() {
if (instance == null) {
synchronized (SingletonClass4.class) {
if (instance == null) {
instance = new SingletonClass4();
}
}
}
return instance;
}
public int getSomeField() {
return this.someField;
}
}
网络上普遍存在的说法
1. 什么原因
instance = new SingletonClass4();
这段代码会被转换成多个指令,简化成三个步骤
(1) memory=allocate(); // 分配DCL类实例需要的内存空间
(2) ctorInstance(memory); // 通过构造函数对内存空间进行初始化
(3) instance=memory; // 将内存空间地址赋值给instance对象引用
由于JVM和CPU都存在乱序执行的情况,当执行顺序为(3)->(2)时,就可能造成其它线程使用了没初始化完成的对象,从而出现问题。
(1) memory=allocate(); // 分配DCL类实例需要的内存空间
(3) instance=memory; // 将内存空间地址赋值给instance对象引用
(4) instance.getSomeField(); // 这里,可能就得到someField的初始值0
(2) ctorInstance(memory); // 通过构造函数对内存空间进行初始化
这就是传说中的对象逸出
- 对象发布(Publish):提供一个对象的引用给作用域之外的代码使用
- 对象逸出(Escape):发布一个尚未初始化完成的对象
2. 怎么解决
使用volatile修饰instance变量
3. 为什么
volatile可以禁止JVM和CPU重排序,也就是说(3)不会先于(2)执行,也就不存在对象逸出问题了。
当instance被volatile修饰,翻译成汇编代码后,会在变量赋值后,加上一个内存屏障
instance = new SingleInstance();
(1) memory=allocate(); // 分配DCL类实例需要的内存空间
(2) ctorInstance(memory); // 通过构造函数对内存空间进行初始化
(3) instance=memory; // 将内存空间地址赋值给instance对象引用
StoreLoad -> lock
(4) instance.getSomeField(); // 不管(2)(3)以什么顺序执行,这里都是返回赋值后的1
回顾一下StoreLoad的作用:在指令前执行的写操作完成后,才可以执行之后的读操作
这样,lock后的操作不会重排序到lock前执行,lock前的操作不会重排序到lock后执行,这就是volatile变量保证时间有序性的体现。
而且,lock指令,还会保证它前面的操作都已经执行完毕,才会执行lock后面的操作,也就不存在对象逸出问题了。
结论:加上volatile修饰instance后,并不会禁止(1)(2)(3)重排序!
但是,这样只能说明了在同一个线程内是安全的,而DCL是另外的线程去读这个instance
变量。内存屏障怎么保证该变量修改后,在其它线程使用也是安全的呢?
这是因为,lock
还有一个作用是使得本CPU的Cache写入了内存,该写入动作也会引起别的CPU或者别的内核无效化(Invalidate)其Cache,这种操作相当于对Cache中的变量做了一次前面介绍Java内存模型中所说的“store”和“write”操作。所以通过这样一个操作,可让前面volatile变量的修改对其它CPU立即可见。
先行发生是Java内存模型中定义的两项操作之间的偏序关系,如果说操作A先行发生于操作B,其它就是说在发生操作B之前,操作A产生的影响能被操作B观察到,“影响”包括修改了内存中共享变量的值、发送了消息、调用了方法等。
8条规则在上面
public class SingletonClass4 {
private static SingletonClass4 instance;
private int someField;
private SingletonClass4() {
this.someField = 1; // (1)
}
public static SingletonClass4 getInstance() {
if (instance == null) { // (2)
synchronized (SingletonClass4.class) { // (3)
if (instance == null) { // (4)
instance = new SingletonClass4(); // (5)
}
}
}
return instance; // (6)
}
public int getSomeField() {
return this.someField; // (7)
}
}
场景:线程1执行getInstance()
到(5)时,线程挂起,紧接着线程2执行int someField = getInstance().getSomeField()
到(2),这里分两种情况
当语句A happens-before B时,用hb(A, B)表示
目的:只要说明hb(1, 7)不成立,那4可能返回0,也可能返回1。
先分析第1种情况:instance == null
结论:第1种情况的结果是正确的
再分析第2种情况:instance != null
结论:第种情况,线程2得到的结果可能是0,也可能是1
怎么解决呢?
办法很多,这里用volatile修饰instance变量private static volatile SingletonClass4 instance;
再用先行发生原则分析一下:
既然问题出在instance != null,那就直接对这种情况进行分析
结论:用volatile修饰instance变量,可解决DCL问题