什么是JMM
JMM(java内存模型)源于物理机器CPU架构的内存模型,最初用于解决MP(多处理器架构)系统中的缓存一致性问题
JMM可以分为工作内存和主内存
JMM规定了所有的变量(此处变量特指实例变量,静态变量等,但不包括局部变量和函数参数,因为这两种是线程私有)都存储在主内存中,此处的主内存仅仅是虚拟机内存的一部分,而虚拟机内存也仅仅是计算机物理内存的一部分(为虚拟机进程分配的那一部分)
每条线程还有自己的工作内存,线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝。线程对变量的所有操作(读取、赋值),都必须在工作内存中进行,而不能直接读写主内存中的变量,这是造成线程安全的主要原因。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成,线程、主内存、工作内存三者之间的交互关系如下图
物理内存架构
Java内存模型和硬件内存体系结构是不同的。 硬件内存体系结构不区分线程堆栈和堆。 在硬件上,线程堆栈和堆都位于主内存中。 部分线程堆栈和堆有时可能存在于CPU高速缓存和内部CPU寄存器中
JMM和JVM内存模型的关系
关系不大,是两个概念,JMM用于解决MP(多处理器架构)系统中的缓存一致性问题,
而JVM为了屏蔽各个硬件平台和操作系统对内存访问机制的差异化,提出了JMM的概念。
在java内存模型中,有方法区,堆等概念,比如只要放实例对象的地方就叫堆
而在JMM中,所有变量都放在主内存中
他们都是虚构的,都对应了物理内存架构中的某一部分
内存间交互操作
- 锁定(lock):作用于主内存变量,把一个变量标识为一条线程独占状态。
- 解锁(unlock):作用于主内存变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
- 读取(read):一个变量值从主内存传输到线程的工作内存中
- 载入(load):将从主内存得到的变量值放到工作内存的变量副本中
- 使用(use):把工作内存中的一个变量值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作
- 赋值(assign):它把一个从执行引擎接收到的值赋值给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作
- 存储(store):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write的操作
- 写入(write):作用于主内存的变量,它把store操作从工作内存中一个变量的值传送到主内存的变量中
重排序
通常我们假设程序的执行是按照编码顺序依次执行,这种模型被称作顺序一致性模型,但是现代多处理器架构没有使用这个模型,而是引入了重排序的概念
什么是重排序?
重排序通常是编译器或运行时环境为了优化程序性能而采取的对指令进行重新排序执行的一种手段。
重排序分为两类:编译期重排序和运行期重排序(包括指令级并行的重排序和内存系统重排序),分别对应编译时和运行时环境。
主要规则
能否重排序 | 第二个操作 | ||
---|---|---|---|
第一个操作 | Normal Load,Normal Store | Volatile load,MonitorEnter | Volatile store,MonitorExit |
Normal Load,Normal Store | yes | yes | no |
Volatile load,MonitorEnter | no | no | no |
Volatile store,MonitorExit | yes | no | no |
- Normal Load指令包括:对非volatile字段的读取,getfield,getstatic和array load;
- Normal Store指令包括:对非volatile字段的存储,putfield,putstatic和array store;
- Volatile load指令包括:对多线程环境的volatile变量的读取,getfield,getstatic;
- Volatile store指令包括:对多线程环境的volatile变量的存储,putfield,putstatic;
- MonitorEnters指令(包括进入同步块synchronized方法)是用于多线程环境的锁对象;
- MonitorExits指令(包括离开同步块synchronized方法)是用于多线程环境的锁对象
编译期重排序
编译期重排序的典型就是通过调整指令顺序,在不改变程序语义的前提下,尽可能减少寄存器的读取、存储次数,充分复用寄存器的存储值
运行时重排序
现代CPU几乎都采用流水线机制加快指令的处理速度,一般来说,一条指令需要若干个CPU时钟周期处理,而通过流水线并行执行,可以在同等的时钟周期内执行若干条指令,具体做法简单地说就是把指令分为不同的执行周期,例如读取、寻址、解析、执行等步骤,并放在不同的元件中处理,同时在执行单元EU中,功能单元被分为不同的元件,例如加法元件、乘法元件、加载元件、存储元件等,可以进一步实现不同的计算并行执行。
as-if-serial语义
as-if-serial语义的意思是,所有的操作均可以为了优化而被重排序,但是你必须要保证重排序后执行的结果不能被改变,编译器、runtime、处理器都必须遵守as-if-serial语义。注意as-if-serial只保证单线程环境,多线程环境下无效。
happens-before(先行发生)法则
- 程序次序规则:一个线程内,按照代码顺序,书写在前面的操作先行发生于书写在后面的操作;
- 锁定规则:一个unLock操作先行发生于后面对同一个锁的lock操作;
- volatile变量规则:对一个变量的写操作先行发生于后面对这个变量的读操作;
- 传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C;
- 线程启动规则:Thread对象的start()方法先行发生于此线程的每个一个动作;
- 线程中断规则:对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生;
- 线程终结规则:线程中所有的操作都先行发生于线程的终止检测,我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值手段检测到线程已经终止执行;
- 对象终结规则:一个对象的初始化完成先行发生于他的finalize()方法的开始;
happens-before的前后两个操作不会被重排序且后者对前者的内存可见
as-if-serial语义和happens-before法则可以概括成:
- 在单线程环境下不能改变程序运行的结果
- 存在数据依赖关系的不允许重排序
可见性问题和有序性问题
可见性问题是对变量做了修改,而另一个线程不知道
有序性问题是代码执行顺序发生改变导致获取到的值异常,变量的值可能并没有做修改操作
重排序和多线程
一个例子
public class RecordExample2 {
public void writer(){
int x, y;
x = 1;
try {
x = 2;
y = 0 / 0;
} catch (Exception e) {
} finally {
System.out.println("x = " + x);
}
}
}
该例子在多线程中可能不会输出预想的结果
代码可能被重排序成了,0/0
在x=2
之前执行
多线程可见性问题
一个经典的例子
public class RecordExample2 {
int a = 0;
boolean flag = false;
/**
* A线程执行
*/
public void writer(){
a = 1; // 1
flag = true; // 2
}
/**
* B线程执行
*/
public void read(){
if(flag){ // 3
int i = a + a; // 4
}
}
}
线程B不一定可以看到flag的值被修改了,因为不满足happens-before法则
参考资料
JVM的重排序
jmm-cookbook
【死磕Java并发】-----Java内存模型之重排序
happens-before俗解
Java内存访问重排序的研究