目录
1.Java内存模型(Java memory model JMM)
1.1 什么是JMM(JMM的作用)
1.2 JMM的组成
2.硬件内存架构与java内存模型
2.1 硬件架构
2.2 Java线程与硬件处理器
2.3 Java内存模型与硬件内存架构的关系
2.4 Java内存模型的必要性
3.并发编程的三个重要特性
3.1 原子性
3.2 可见性
3.3 有序性
JMM在保证有序性时所使用的两个原则
4.JMM对三个特征的保证
4.1 JMM与原子性
JMM对原子性的保证方式
4.2 JMM与可见性
JMM对可见性的保证方式
4.3 JMM与有序性
JMM对有序性的保证方式
JMM(java内存模型Java Memory Model)本身是一种抽象的概念,描述的是一组规则或规范。通过这组规范定义了程序中各个变量的访问方式。Java本身的运行是基于虚拟机的,在虚拟机的规范中,Java定义了一种内存模型,来屏蔽掉硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。Java 线程之间的通信由 Java 内存模型(本文简称为 JMM)控制的。
由于JVM运行程序的实体是线程,而每个线程,JVM都会为其创建一个工作内存,工作内存是每个线程的私有数据区域,而Java内存模型规定中的变量都存储在主内存。主内存是共享数据,所有线程都能访问,但线程对变量的操作(读写值)都必须在工作内存中完成。简单说,就是先读取,再操作,再写回。工作内存存放的是主内存中的副本,线程的通信都需要通过主内存来完成。
A线程修改私有数据,直接在工作空间修改
B线程修改共享数据,把数据复制到工作空间中去,在工作空间中修改,修改完成以后,刷新内存中的数据
像上面这种图就是多核的机器,每一个CPU都对应着一个cache,cache中的数据是对应CPU私有的,内存中的数据是所有CPU共享的。
在说明Java并发特性之前,先简单了解一下物理计算机中的并发问题,这二者有不少相似之处。物理机对并发的处理方案对于虚拟机也有很大的参考意义。
“并发”在计算机领域内,一直是比较头疼。因为并发不仅仅是计算的事情,也是存储的事情。我们在处理并发时,不可能只靠CPU就能完成,也需要与内存交互,比如读取运算数据,存储运算结果等。
但是,由于CPU的处理效率和内存的处理效率差了几个数量级,计算机不得不引入高速缓存作为内存和CPU之间的缓冲,将运算需要使用的数据复制到缓存中,减少I/O瓶颈,加速运算,当运算完成之后,再将数据从缓存同步回内存中,这样能够提升不少处理的效率。
不过,在引入高速缓存的同时,也带来了另外一个问题——缓存一致性。每个处理器都有自己的高速缓存,而他们又共享同一主内存,当多个处理器任务都是涉及到同一块主内存区域时,就会出现缓存数据不一致的问题。
同时,为了解决一致性的问题,高速缓存就需要遵守一些一致性协议(MSI等协议)来规范对数据的读写。
具体示意图,如下:
注:引入物理计算机并发的概念,主要是为了提供一种思路,实际上的实现远比描述的要复杂。
CPU缓存的一致性问题:并发处理的不同步。比如CPU1将共享数据1改成2,如果CPU1修改完了CPU2再去读取就会读取到2,如果CPU1没有修改完CPU2读取到的就是1,有可能造成脏读的问题,这就是并发处理不同步。
解决方案:
当CPU在cache中操作数据时,如果该数据是共享变量,数据从cache读到寄存器中,进行新修改,同时将该数据的cache line标志位置为无效,然后更新内存数据。因为修改完数据之后,该数据以前在其他CPU的cache中就失效了,不能再读取了,将标志置为无效是为了让其他CPU直接去内存中读取最新的该数据,然后再更新自己的cache数据,这样就解决了不同步问题。
JMM和硬件内存结构的工作方式很相似,JMM中的工作空间对应的就是cache和寄存器,JMM中的主内存对应的就是硬件中的内存。
整个流程就是用户指定任务交给线程池,由线程池去分配进程用来执行这些任务,一个任务也就对应着一个线程,每一个Java线程是需要映射到一个真实的操作系统线程,通过操作系统线程完成任务的,将Java线程映射到操作系统线程,对线程的挂起或唤醒,这些操作都需要操作系统线程来完成,这就需要请求OS内核的帮助,需要操作系统由用户态转变成内核态,给每一个线程分配一个内核线程,然后内核线程被交给CPU进行操作。
模型分为主内存和工作内存,所有的变量(局部变量除外,局部变量都是线程私有的,不存在并发问题)都存储在主内存中。每条线程具有自己的工作内存,其中工作内存中保存了线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接操作主内存中的变量。不同线程之间是无法访问对方的工作内存,线程间变量值的传递均需要通过主内存来完成,示意图如下:
由上面的讲解可知,工作空间和内存都对应着硬件系统的寄存器,cache和内存。这种交叉的关系也就造成了在多线程并发的环境下很容易出现数据不同步的问题。
注:这里提到的主内存和工作内存,实际上和我们常说的Java内存分为堆、栈、方法区等并不是同一层次的划分,二者基本上没有直接联系。如果一定要勉强对应的话,那主内存主要对应于Java堆中的对象实例部分,而工作内存则对应于虚拟机栈中的部分区域。从更低层次上说,主内存直接对应于物理硬件的内存,而工作内存可能优先存储于高速缓存中。
关于主内存与工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从 工作内存同步回主内存这一类的实现细节,Java内存模型中定义了以下8种操作来完成。Java虚拟机实 现时必须保证下面提及的每一种操作都是原子的、不可再分的(对于double和long类型的变量来说, load、store、read和write操作在某些平台上允许有例外。
Java内存模型还规定了执行上述8种基本操作时必须满足如下规则:
Java内存模型(JMM)的作用:规范内存数据和工作空间数据的交互。来解决数据不同步的问题
关于主内存与工作内存之间具体的交互协议,也就是说,一个变量如何从主内存拷贝到工作内存,又是如何从工作内存同步回到主内存的。Java定义了8种操作来实现的,并且虚拟机保证每一种操作都是原子的。
8种操作分别是lock、unlock、read、load、use、assign、store、write.
上图所示,是两组操作,一组是读取,一组是写入。
值得注意的是,Java模型只要求这两个操作必须是顺序执行,但并没有保证是连续执行,这点区别是非常大的。
也就是说,read和load之间、store和write之间是可以插入其他指令的。
接下来,我们关注一下,Java并发中的三个特性,原子性、可见性和有序性
所谓原子性,是指在一次操作或多次操作中,要么所有的操作全部执行,并不会受到人任何元素的干扰而中断,要么所有的操作都不执行,中间不会有任何上下文切换(context switch)。比如:A给B转账100,A账户扣除100,B账户账户收入100,这两个操作必须符合原子性,要么都成功,要么都失败。所以并发编程就需要将应该是原子操作的一系列操作封装成一个原子操作。
线程只能操作自己工作空间中的数据,对其他线程的工作空间不可见。但是并发编程中一个线程对共享变量进行了修改,另一个线程要能立刻看到被改后的最新值。
线程1对共享变量的修改如果要被线程2及时看到,需要经过2个步骤:
1. 把工作内存1中更新过的共享变量值刷新到主内存中
2. 把主内存中最新的共享变量的值更新打工作内存2中
以上2个步骤,任意一个出现问题,都会导致共享变量无法被其他线程及时看到,无法实现可见性,导致其他线程读取的数据不准确从而产生线程不安全。
例子:
private int i = 0;
private int j = 0;
//线程1 i = 10;
//线程2 j = i;
线程1修改i的值为10时的执行步骤:
1)将10赋给线程1工作内存中的 i 变量;
2)将线程1工作内存中的 i 变量的值赋给主内存中的 i 变量;
当线程2执行j = i时,线程2的执行步骤:
1)将主内存中的 i 变量的值读取到线程2的工作内存中;
2)将主内存中的 j 变量的值读取到线程2的工作内存中;
3)将线程2工作内存中的 i 变量的值赋给线程2工作内存中的 j 变量;
4)将线程2工作内存中的 j 变量的值赋给主内存中的 j 变量;
如果线程1执行完步骤1,线程2开始执行,此时主内存中 i 变量的值仍然为 0,那么线程2获取到的 i 变量的值为 0,而不是 10。
这就是可见性问题,线程1对 i 变量做了修改之后,线程2没有立即看到线程1修改的值。
程序中的顺序不一定就是执行的顺序,因为系统会对代码进行一次重排序,重排序的作用就是提高效率。但是虽然指令重排不会影响单线程的执行结果,但是会影响多线程并发执行的结果正确性,所以并发编程就要保证重排序之后的有序性,执行结果不能因为重排序而出错。重排序有三种:
例子:
int x = 1;
int y = 2;
int z;
z = x + y;
int m = 0;
这一段代码int m = 0;这个操作在前面和在后面对程序的最终结果不会有影响,但是z=x+y这个操作本身很耗时,所以int m = 0要等一会才能执行到它,这在并发执行的时候显然单位时间内完成的任务比较少,也就降低了整体的效率,所以系统就会重排序将int m = 0放到上面去提前执行。一般重排序的原则就有将执行操作时间少的指令排在前面执行。其实这个就是计算机组成原理中学的CPU流水线作业,能够大大提高系统吞吐量。
举例一:
int i = 0;
int j = 0;
i = 10; //语句1
j = 1; //语句2
语句可能的执行顺序如下:
1)语句1 语句2
2)语句2 语句1
语句1一定在语句2前面执行吗?答案是否定的,这里可能会发生执行重排(Instruction Reorder)。一般来说,处理器为了提高程序运行效率,可能会对输入代码进行优化,它不保证程序中各个语句的执行先后顺序同代码中的顺序一致,但是它会保证程序在单线程环境下最终执行结果和代码顺序执行的结果是一致的。
比如上面的代码中,语句1和语句2谁先执行对最终的程序结果并没有影响,那么就有可能在执行过程中,语句2先执行而语句1后执行。
举例二:
int i = 0; //语句1
int j = 0; //语句2
i = i + 10; //语句3
j = i * i; //语句4
语句可能的执行顺序如下:
1)语句1 语句2 语句3 语句4
2)语句2 语句1 语句3 语句4
3)语句1 语句3 语句2 语句4
语句3是不可能在语句4之后执行的,因为编译器在进行指令重排时会考虑数据的依赖性问题,语句4依赖于语句3,因此语句3一定在语句4之前执行。
接下来我们说一下多线程环境。
举例三:
private boolean flag = false;
private Context context = null;
//线程1
context = loadContext(); //语句1
flag = true; //语句2
//线程2
while(!flag){
Thread.sleep(1000L);
}
dowork(context);
语句可能的执行顺序如下:
1)语句1 语句2
2)语句2 语句1
由于在线程1中语句1、语句2是没有依赖性的,所以可能会出现指令重排。如果发生了指令重排,线程1先执行语句2,这时候线程2开始执行,此时flag值为true,因此线程2继续执行dowrk(context),此时context并没有初始化,因此就会导致程序错误。
因此可以得出结论,指令重排不会影响单线程的执行结果,但是会影响多线程并发执行的结果正确性.
处理器不会对存在数据依赖的操作进行重排序。这里数据依赖的准确定义是:如果两个操作同时访问一个变量,其中一个操作是写操作,此时这两个操作就构成了数据依赖。
* as-if-seria(单线程遵循):在单线程中,无论如何重排序,程序执行的结果都应该与代码顺序执行的结果一致(java编译器和处理器运行时都会保证在单线程中遵循as-if-serial规则,多线程存在程序交错执行时,则不遵守)
* happens-before(多线程遵循):在发生操作B之前,操作A产生的影响都能被操作B观察到,“影响”包括修改了内存中共享变量的值、发送了消息、调用了方法等,它与时间上的先后发生基本没有太大关系。这个是多线程中程序运行遵守的原则,保证在多线程环境下程序运行结果不会出错,后面有对其的详细讲解。重排序也就是遵守这个原则。
一个正确执行的并发程序,必须具备原子性、可见性、有序性。否则就有可能导致程序运行结果不正确,甚至引起死循环。
这种写操作有两种,如果是私有数据具有原子性,如果是共享数据没原子性,因为共享对象还需要一次读操作,将数据从内存中读到工作空间,也就失去了原子性。
由上面的这些例子可知多个原子性的操作合并到一起没有原子性
注: JUC 就是 java.util .concurrent 工具包的简称。这是一个处理线程的工具包, JDK 1.5 开始出现的。
- volatile:在JMM模型上实现MESI协议,也就是在变量使用volatile关键字,一个线程将内存中的有volatile关键字标识的变量拿到工作空间进行修改后,就会通知其他线程再访问这个变量的话直接到内存中去找,就不要在自己的工作空间找了,因为数据已经被修改了。
深入来说,是通过加入内存屏障和禁止重排序优化来实现的:
通俗地讲,volatile变量在每次被访问的时候,都强迫从主内存中读取该变量的值,而当该变量在发生变化时,又会强迫变量讲最新的值刷新到主内存中,这样,任意时刻,不同的线程总能看到该变量的最新值。
- synchronized:使用synchronized加锁来保证可见性,它会保证两条原则:
- JUC中Lock的lock
- volatile:被加了volatile关键字的变量不会被重排序。
对于volatile修饰的变量:
- synchronized:被它括起来的代码块内部会进行重排序,但是同步代码块整体在所有代码中的顺序不会改变。
对synchronized同步代码块:
- JMM对有序保证按照Happens-before原则:
满足任意一个原则,对于读写共享变量来说,就是线程安全。
时间上的先后与happens-before的关系: