JMM 即 Java内存模型(Java Memory Model),一种抽象的概念,并不真实存在,它描述的是一组规则或规范,通过这组规范定义了程序中各个变量的访问方式。
JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存,用于存储线程私有的数据。
Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作必须在工作内存中进行,所以首先要将变量从主内存拷贝的自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量。
工作内存中存储着主内存中的变量副本拷贝,不同的线程间无法访问对方的工作内存,线程间的通信必须通过主内存来完成。
JMM与JVM内存区域的划分是不同的概念层次。JMM描述的是一组规则,通过这组规则控制程序中各个变量在共享数据区域和私有数据区域的访问方式,它是围绕原子性,有序性、可见性展开的。
JMM与JVM内存区域唯一相似点,都存在共享数据区和私有数据区
线程,工作内存,主内存工作交互图(基于JMM规范):
主内存:类比于JVM中的堆和方法区,存放所有线程共享的数据。所有线程创建的实例对象都存放在主内存中,不管该实例对象是成员变量还是方法中的本地变量(也称局部变量),当然也包括了共享的类信息、常量、静态变量。由于是共享数据区域,多条线程对同一个变量进行访问存在线程安全问题。
工作内存:类比于JVM中的程序计数器、虚拟机栈以及本地方法栈,存放线程私有的数据。比如当前方法的所有本地变量信息(工作内存中存储着主内存中的变量副本拷贝),每个线程只能访问自己的工作内存,即线程中的本地变量对其它线程是不可见的,就算是两个线程执行的是同一段代码,它们也会各自在自己的工作内存中创建属于当前线程的本地变量,当然也包括了字节码行号指示器、相关Native方法的信息。注意由于工作内存是每个线程的私有数据,线程间无法相互访问工作内存,因此存储在工作内存的数据不存在线程安全问题。
根据JVM虚拟机规范主内存与工作内存的数据存储类型以及操作方式:
需要注意的是:在主内存中的实例对象可以被多线程共享,倘若两个线程同时调用了同一个对象的同一个方法,那么两条线程会将要操作的数据拷贝一份到自己的工作内存中(这个时候此数据在两个线程中不可见),执行完成操作后才刷新到主内存。
实际上,多线程的执行最终都会映射到硬件处理器上进行执行,但Java内存模型和硬件内存架构并不完全一致。
也就是说:JMM对内存的划分对硬件内存并没有任何影响,因为JMM只是一种抽象的概念,是一组规则,并不实际存在。
不管是工作内存的数据还是主内存的数据,对于计算机硬件来说,在计算机主内存、CPU缓存或者寄存器中,都可能存在。
总体上来说,JMM和计算机硬件内存架构是一个相互交叉的关系,是一种抽象概念划分与真实物理硬件的交叉。
两个线程同时对一个主内存中的实例对象的变量进行操作有可能导致线程安全问题。
假设主内存中存在一个共享变量x,现在有A和B两条线程分别对该变量x=1进行操作,A/B线程各自的工作内存中存在共享变量副本x。假设现在A线程想要修改x的值为2,而B线程却想要读取x的值,那么B线程读取到的值是A线程更新后的值2还是更新前的值1呢?答案是:不确定!因为主内存与工作内存间数据存在一致性问题。
关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节,JMM定义了以下八种内存交互操作。
JMM定义了八种内存交互操作来定义一个变量应该如何从主内存拷贝到工作内存、如何从工作内存同步到主内存。
操作 | 说明 |
---|---|
lock(锁定) | 作用于主内存的变量,把一个变量标记为一条线程独占状态 |
unlock(解锁) | 作用于主内存的变量,把一个处于锁定状态的变量释放出来; 释放后的变量才可以被其他线程锁定 |
read(读取) | 作用于主内存的变量,把一个变量值从主内存传输到线程的工作内存中, 以便随后的load动作使用 |
load(载入) | 作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中 |
use(使用) | 作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎 |
assign(赋值) | 作用于工作内存的变量,它把一个从执行引擎接收到的值赋给工作内存的变量 |
store(存储) | 作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中, 以便随后的write的操作 |
write(写入) | 作用于工作内存的变量,它把store操作从工作内存中的一个变量的值传送到主内存的变量中 |
同步规则分析
可见性:可见性指的是当一个线程修改了某个共享变量的值,其他线程是否能够马上得知这个修改的值。
串行程序中不存在可见性问题。
有序性:有序性是指对于单线程的执行代码,我们总是认为代码的执行是按顺序依次执行的。
程序编译成机器码指令后可能会出现指令重排现象,重排后的指令与原指令的顺序未必一致。
原子性:原子性指的是一个操作是不可中断的,即使是在多线程环境下,一个操作一旦开始就不会被其他线程影响。
在java中,对基本数据类型的变量的读取和赋值操作是原子性操作。
可见性问题:volatile关键字保证可见性。当一个共享变量被volatile修饰时,它会保证修改的值立即被其他的线程看到,即修改的值立即更新到主存中,当其他线程需要读取时,它会去内存中读取新值。
synchronized和Lock也可以保证可见性,因为它们可以保证任一时刻只有一个线程能访问共享资源,并在其释放锁之前将修改的变量刷新到内存中。
有序性问题:通过volatile关键字来保证一定的“有序性”。
原子性问题:除了JVM自身提供的对基本数据类型读写操作的原子性外,可以通过synchronized和Lock实现原子性。因为synchronized和Lock能够保证任一时刻只有一个线程访问该代码块。