这里说的内存模型与堆栈内存模型不是同一回事,是定义一种变量在线程工作内存和主内存之间的工作规范。在书中描述一种如下图所示的内存模型。
变量在工作内存和主内存之间的交互操作,由图中的8种操作完成,书中定义如下。
同时还定义了以下规则来约束上面8种操作的执行,如下所示。
1、不允许read和load、store和write操作之一单独出现,以上两个操作必须按顺序执行,但没有保证必须连续执行,也就是说,read与load之间、store与write之间是可插入其他指令的。
2、不允许一个线程丢弃它的最近的assign操作,即变量在工作内存中改变了之后必须把该变化同步回主内存。
3、不允许一个线程无原因地(没有发生过任何assign操作)把数据从线程的工作内存同步回主内存中。
4、一个新的变量只能从主内存中“诞生”,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,换句话说就是对一个变量实施use和store操作之前,必须先执行过了assign和load操作。
5、一个变量在同一个时刻只允许一条线程对其执行lock操作,但lock操作可以被同一个条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。
6、如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
7、如果一个变量实现没有被lock操作锁定,则不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定的变量。
8、对一个变量执行unlock操作之前,必须先把此变量同步回主内存(执行store和write操作)。
另外,除了以上的通用执行约束,对于volatile变量有自己的一套约束,是虚拟机自动完成的,如下所示。
先针对volatile的约束规则的了解一下约束是怎么工作的。以下的约束都是java虚拟机帮助我们自动完成。
volatile约束第一条:通用约束里面,规定了read、load必须连续出现。而在volatile约束中,规定想要use volatile变量的话必须先执行load动作,那么也就是说read、load、use必须一起连续进行,这规则保证线程执行引擎每次使用的volatile变量的值是从主内存中读取的。
volatile约束第二条:通用约束里面store、write是必须成对出现。同时volatile第二约束里面,规定第后一个动作必须是store才能进行assign,所以如果执行引擎要assign volatile变量,必须assign、store、write一起连续进行,也就是,这条规则保证volatile变量的值修改时必须马上同步回主内存,保证主内存变量一定是最新值。
volatile约束第三条:通俗来说就是规定了,对变量A read、load、use,对变量B read、load、use,假如程序(执行引擎)对A的use先于对B的use,那么A 的 load先于B的load,A的read、load先于B的read、load。保证指令不会被执行重排(例如常量赋值等),按照代码顺序执行。
通用约束:主要还是看对lock、unlock规则约束。通用约束6如果执行lock的话,清空工作内存此变量,保证赋值或者取值都是最新的;通用约束7保证lock执行约束;通用约束8如果执行unlock的话,需要先把此变量同步回主内存,保证了变量可见性。synchronized关键字和concurrent包下面的锁基于此约束执行。
先看一段《深入理解Java虚拟机》的描述
原子性(Atomicity):由Java内存模型来直接保证的原子性变量操作包括read、load、use、assign、store、write,我们大致可以认为基本数据类型的访问读写是具备原子性的。
如果需要一个更大范围的原子性操作,Java内存模型提供了lock和unlock操作来满足这种需求,尽管虚拟机未把lock和unlock操作直接开放给用户使用,但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作,这两个字节码指令反应到Java代码中就是同步块—synchronized关键字,所以在synchronized块之间的操作也具备原子性。
可见性(Visibility):可见性是指当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。
volatile、synchronized、final都可以实现可见性,synchronized可见性是由对一个变量执行unlock操作之前,必须先把此变量同步回主内存中(执行store、write操作)这条规则获得的,而final关键字的可见性是指:被final修饰的字段在构造器中一旦被初始化完成,并且构造器没有把this的引用传递出去,那在其他线程中就能见final字段的值。
有序性(Ordering):Java程序中天然的有序性可以总结为一句话:如果在本线程内观察,所有的操作都是有序的;如果在一个线程中观察另一个线程,所有的操作都是无序的。前半句是指线程内表现为串行的语义(within-Thread AS-if-Serial Semantics),后半句是指指令重排序现象和工作内存和主内存同步延迟现象。
Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性,volatile关键字本身就包含了禁止指令重排序的语义,而synchronized则是由一个变量在同一时刻只允许一条线程对其进行lock做这条规则获得的,这条规则决定了持有同一个锁的两个同步块只能串行的进入。
lock、unlock之间的内存操作具备原子性
一个线程做的值修改,其他线程能够马上感知到这个修改,或者说在其他线程使用这个值的时候,肯定能从主内存获取到最新的值。
volatile:保证感知
synchronized:在线程A unlock的时候,肯定会执行把值同步回主内存操作,当下一个线程B synchronized这个变量的时候,会从主内存读取这个值到线程B,保证了schronized的变量的可见性。
final:我们都知道final变量一旦初始化值之后其对应的值是不能改变的,因此对于所有的线程来说都是可见的。但是需要注意一点就是在final变量所在对象初始化未未完成时,对象this引用暴露给外部的话,那么final变量初始化会有线程安全问题。
public class FinalInit {
public final int a;
public static FinalInit thisPoint;
public FinalInit() throws InterruptedException {
//引用逃逸
thisPoint = this;
Thread.sleep(5000);
a = 10;
}
public static void main(String[] args) throws InterruptedException {
new Thread(() -> {
try {
new FinalInit();
} catch (InterruptedException e) {
e.printStackTrace();
}
}).start();
Thread.sleep(1000);
//输出未初始化的final值0
System.out.println(FinalInit.thisPoint.a);
}
}
这个有序可以理解为java基本内存操作的顺序,能否有序影响着执行结果的正确性。
串行的语义保证了线程内部所有操作都是内存操作按照预想有序进行,线程安全的;
跨线程的话所有的操作都无法保证有序,例如指令重排保证变量对于线程内部使用到时计算上正确,但是如果多线程下,重排可能会导致别的线程访问本线程的变量结果不对,无法保证内存操作按照预想有序进行。
又或者是由于虚拟机对于变量在工作内存和主内存之间的同步存在延迟,无法保证内存操作按照预想有序进行,导致线程无法访问到正确的变量值。例如下图,我们程序设计时预想
多线程环境下,我们需要保持线程之间的有序性,java提供synchronized和volatile关键之来给我们使用保证可见性与有序性。volatile变量具有禁止指令重排的语义,同时其本身具有可见性,因此我们可以利用这些特性来逻辑控制保证线程之间的有序性。synchronized本身就有“一个变量在同一时刻只允许一条线程对其进行lock”的规则,因此天然就具有保证线程之间有序性。
为了保证有序性,我们写代码时可以利用的手段就是先行发生原则。套用这些原则,如果程序能够保证是有序的,并且能确定执行顺序和结果,那么就是线程安全的。先行发生原则是对线程安全判断的重要终结原则。
程序次序规则(Program Order Rule):在一个线程内,按照程序代码顺序,书写在前面的操作先行发生于书写在后面的操作。准确地说,应该是控制流顺序而不是程序代码顺序,因为考虑分支、循环等结构。
管程锁定规则(Monitor Lock Rule):一个unlock操作先行发生于后面对同一个锁的lock操作,这里必须强调的是同一个锁,而“后面”是指时间上的先后顺序。
volatile变量规则(Volatile Variable Rule):对一个volatile变量的写操作先行发生于后面对这个变量的读操作,“后面”是指时间上的先后顺序。
线程启动规则(Thread Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作。
线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,可以通过Thread.join()方法结束、Thread.isAlive()的返回值等手段检测到线程已经终止执行。
线程中断规则(Thread Interruption Rule):对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断时间的发生,可以通过Thread.interrupted()方法检测到是否有中断发生。
对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始。
传递性(Transitivity):如果操作A先行发生于操作B,操作B先行发生于操作C,那就可以得出操作A先行发生于操作C的结论。
《深入理解java虚拟机》书中已经演示如何套用这些规则来判断程序的顺序,如果根据这些规则能够为程序定出一个顺序,那么线程就是安全的,否则就是不安全。
先来一个线程不安全的例子。和书中一样,wrapObject.a = 30先执行赋值,另起一个线程取值输出,执行下面程序,输出。
public class NotSafeThreadDemo {
public static void main(String[] args) {
WrapObject wrapObject = new WrapObject();
wrapObject.a = 30;
final int tag = 30;
System.out.println(tag + "--main-->" + wrapObject.a);
new Thread(() ->{
System.out.println(tag +"--join-->"+wrapObject.a);
}).start();
}
static class WrapObject{
public int a = 10;
}
}
不是预想的输出结果:
30--main-->30
30--join-->10
赋值a = 30,但是在另一个线程中取值输出输出却是10,不按预想输出。
按照先行发生规则分析,有没有适用规则来保证顺序。首先是多线程所以程序次序规则不适用;没有使用synchronized或者其他concurrent包的锁,所以也没有管程锁定规则;没有使用volatile关键字,所以也不适用volatile变量规则。除此之外的规则就更加不用说。因此无规则使用,所以线程是无法确定顺序,无法保证有序。
再来一个线程安全的例子。试着使用volatile规则或者管程锁定规则改造上面的例子,达到线程安全。
public class SafeThreadDemo {
public static void main(String[] args) {
WrapObject wrapObject = new WrapObject();
wrapObject.a = 30;
final int tag = 30;
System.out.println(tag + "--main-->" + wrapObject.a);
new Thread(() ->{
System.out.println(tag +"--join-->"+wrapObject.a);
}).start();
}
static class WrapObject{
public volatile int a = 10;
}
}
或者这样
public class SafeThreadDemo2 {
public static void main(String[] args) {
WrapObject wrapObject = new WrapObject();
synchronized (wrapObject){
wrapObject.a = 30;
}
final int tag = 30;
System.out.println(tag + "--main-->" + wrapObject.a);
new Thread(() ->{
synchronized (wrapObject){
System.out.println(tag +"--join-->"+wrapObject.a);
}
}).start();
}
static class WrapObject{
public int a = 10;
}
}
就能保证线程安全。书中有曰,如果不加先行发生规则进行控制的话,代码的先行执行,并不代表对应的内存操作是先行执行的;同时内存操作的先行执行,也不代表在代码级别是先行执行的。内存操作的顺序,需要我们根据先行发生规则去进行控制。
重排序指编译器编译出的指令执行顺序跟我们代码中编写顺序有误差,指令重排必须保证它们重排序后的结果和程序代码本身的应有结果是一致的。Java编译器、运行时和处理器都会保证单线程下的as-if-serial语义。
内存屏障是一种CPU级别指令,用于控制特定条件下的重排序和内存可见性问题。Java编译器会根据内存屏障的规则禁止重排序。
内存屏障可以被分为以下几种类型
在JMM的编译器层面,通过volatile关键字来保证不会重排指令。对于volatile关键字,相当于加入一个StoreLoad屏障,屏障前所有store操作先行执行于屏障后的load操作。
但是要是同时又多个store操作,那么就无法保证读取数据的正确性,例如原本(store1、load1)和(store2、load2)为两组操作,并发执行,可能出现以下情形,最直观的就是另个写操作可能覆盖另一个写操作,就好像经典的例子,volatile变量在多个线程中做++操作,结果是不正确的。所以也可以理解volatile的实现是基于内存屏障的实现,既保证可见性也保证不会指令重排。