并发编程之JMM(Java内存模型)

什么是JMM

JMM 即 Java内存模型(Java Memory Model),一种抽象的概念,并不真实存在,它描述的是一组规则或规范,通过这组规范定义了程序中各个变量的访问方式。

JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存,用于存储线程私有的数据。

Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作必须在工作内存中进行,所以首先要将变量从主内存拷贝的自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量。

工作内存中存储着主内存中的变量副本拷贝,不同的线程间无法访问对方的工作内存,线程间的通信必须通过主内存来完成。

JMM与JVM内存区域模型的区别

JMM与JVM内存区域的划分是不同的概念层次。JMM描述的是一组规则,通过这组规则控制程序中各个变量在共享数据区域和私有数据区域的访问方式,它是围绕原子性,有序性、可见性展开的。

JMM与JVM内存区域唯一相似点,都存在共享数据区私有数据区

  • 在JMM中主内存属于共享数据区,从某个程度上讲应该包括了堆和方法区
  • 在JMM中工作内存属于线程私有数据区,从某个程度上讲则应该包括程序计数器、虚拟机栈以及本地方法栈

线程,工作内存,主内存工作交互图(基于JMM规范):

并发编程之JMM(Java内存模型)_第1张图片

主内存:类比于JVM中的堆和方法区,存放所有线程共享的数据。所有线程创建的实例对象都存放在主内存中,不管该实例对象是成员变量还是方法中的本地变量(也称局部变量),当然也包括了共享的类信息、常量、静态变量。由于是共享数据区域,多条线程对同一个变量进行访问存在线程安全问题

工作内存:类比于JVM中的程序计数器、虚拟机栈以及本地方法栈,存放线程私有的数据。比如当前方法的所有本地变量信息(工作内存中存储着主内存中的变量副本拷贝),每个线程只能访问自己的工作内存,即线程中的本地变量对其它线程是不可见的,就算是两个线程执行的是同一段代码,它们也会各自在自己的工作内存中创建属于当前线程的本地变量,当然也包括了字节码行号指示器、相关Native方法的信息。注意由于工作内存是每个线程的私有数据,线程间无法相互访问工作内存,因此存储在工作内存的数据不存在线程安全问题

根据JVM虚拟机规范主内存与工作内存的数据存储类型以及操作方式:

  • 对于一个实例对象中的成员方法而言,如果方法中包含本地变量是基本数据类型 (boolean,byte,short,char,int,long,float,double),将直接存储在工作内存的帧栈结构中
  • 倘若本地变量是引用类型,那么该变量的引用会存储在工作内存的帧栈中,而对象实例将存储在主内存(共享数据区域,堆)中
  • 对于实例对象的成员变量,不管它是基本数据类型或者包装类型(Integer、Double等)还是引用类型,都会被存储到堆区
  • static变量以及类本身相关信息将会存储在主内存中

需要注意的是:在主内存中的实例对象可以被多线程共享,倘若两个线程同时调用了同一个对象的同一个方法,那么两条线程会将要操作的数据拷贝一份到自己的工作内存中(这个时候此数据在两个线程中不可见),执行完成操作后才刷新到主内存。

并发编程之JMM(Java内存模型)_第2张图片

JMM与硬件内存架构的关系

实际上,多线程的执行最终都会映射到硬件处理器上进行执行,但Java内存模型和硬件内存架构并不完全一致。

  • 硬件内存:分为寄存器、CPU缓存、主内存
  • JMM:分为工作内存(线程私有数据区域)和主内存(堆内存)

也就是说:JMM对内存的划分对硬件内存并没有任何影响,因为JMM只是一种抽象的概念,是一组规则,并不实际存在。

不管是工作内存的数据还是主内存的数据,对于计算机硬件来说,在计算机主内存、CPU缓存或者寄存器中,都可能存在。

并发编程之JMM(Java内存模型)_第3张图片

总体上来说,JMM和计算机硬件内存架构是一个相互交叉的关系,是一种抽象概念划分与真实物理硬件的交叉

为什么要有JMM

两个线程同时对一个主内存中的实例对象的变量进行操作有可能导致线程安全问题。

假设主内存中存在一个共享变量x,现在有A和B两条线程分别对该变量x=1进行操作,A/B线程各自的工作内存中存在共享变量副本x。假设现在A线程想要修改x的值为2,而B线程却想要读取x的值,那么B线程读取到的值是A线程更新后的值2还是更新前的值1呢?答案是:不确定!因为主内存与工作内存间数据存在一致性问题。

并发编程之JMM(Java内存模型)_第4张图片

关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节,JMM定义了以下八种内存交互操作

JMM内存交互操作

JMM定义了八种内存交互操作来定义一个变量应该如何从主内存拷贝到工作内存、如何从工作内存同步到主内存。

操作 说明
lock(锁定) 作用于主内存的变量,把一个变量标记为一条线程独占状态
unlock(解锁)

作用于主内存的变量,把一个处于锁定状态的变量释放出来;

释放后的变量才可以被其他线程锁定

read(读取) 作用于主内存的变量,把一个变量值从主内存传输到线程的工作内存中, 以便随后的load动作使用
load(载入) 作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中
use(使用) 作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎
assign(赋值) 作用于工作内存的变量,它把一个从执行引擎接收到的值赋给工作内存的变量
store(存储) 作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中, 以便随后的write的操作
write(写入) 作用于工作内存的变量,它把store操作从工作内存中的一个变量的值传送到主内存的变量中

并发编程之JMM(Java内存模型)_第5张图片

同步规则分析

  1. 不允许一个线程无原因地(没有发生过任何assign操作)把数据从工作内存同步回主内存中
  2. 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或者assign)的变量。即就是对一个变量实施use和store操作之前,必须先自行assign和load操作。 
  3. 一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。lock和unlock必须成对出现。 
  4. 如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量之前需要重新执行load或assign操作初始化变量的值。
  5. 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁定的变量。 
  6. 对一个变量执行unlock操作之前,必须先把此变量同步到主内存中(执行store和write操作)

并发编程之可见性,有序性与原子性

可见性:可见性指的是当一个线程修改了某个共享变量的值,其他线程是否能够马上得知这个修改的值。

串行程序中不存在可见性问题。

有序性:有序性是指对于单线程的执行代码,我们总是认为代码的执行是按顺序依次执行的。

程序编译成机器码指令后可能会出现指令重排现象,重排后的指令与原指令的顺序未必一致。

原子性:原子性指的是一个操作是不可中断的,即使是在多线程环境下,一个操作一旦开始就不会被其他线程影响。

在java中,对基本数据类型的变量的读取和赋值操作是原子性操作。

JMM如何解决可见性,有序性,原子性问题

可见性问题:volatile关键字保证可见性。当一个共享变量被volatile修饰时,它会保证修改的值立即被其他的线程看到,即修改的值立即更新到主存中,当其他线程需要读取时,它会去内存中读取新值。

synchronized和Lock也可以保证可见性,因为它们可以保证任一时刻只有一个线程能访问共享资源,并在其释放锁之前将修改的变量刷新到内存中。

有序性问题:通过volatile关键字来保证一定的“有序性”。

  • volatile关键字可以保证“一定程度上的有序性”,一定程度上禁止指令重排。
  • synchronized和Lock也可以保证“一定程度上的有序性”,不过与volitile的效果不同,synchronized和Lock保证每个时刻只有一个线程执行同步代码,相当于是让线程顺序执行同步代码,自然就保证了有序性。

原子性问题:除了JVM自身提供的对基本数据类型读写操作的原子性外,可以通过synchronized和Lock实现原子性。因为synchronized和Lock能够保证任一时刻只有一个线程访问该代码块。

你可能感兴趣的:(java并发编程,java,并发编程)