Java内存模型(Java Memory Model,JMM)

Java内存模型简述

为了屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的并发效果,Java虚拟机规范中定义了Java内存模型。

Java内存模型是一种规范,它规范了Java虚拟机与计算机内存是如何协同工作的,它规定了一个线程如何和何时能够看到其他线程修改过的共享变量的值,以及在必须时如何同步的访问共享变量。

了解了Java内存模型是做什么之后,我们具体介绍一下Java内存模型。首先需要先明确JVM内存分配的两个概念,也就是栈(Stack)和堆(Heap)。

Java里的堆是一个运行时的数据区,堆是由垃圾回收来负责的。堆的优势是可以动态的分配内存大小,生存期也不必预先告诉编译器,因为它是在运行时动态分配内存的。java的垃圾回收器会自动收走这些不再使用的数据,但是也有缺点,缺点是由于要在运行时动态分配内存,因此存取速度要慢一些。

栈它的优势是存取速度比堆快,仅次于计算机里的寄存器,栈的数据是可以共享的,但是缺点是存在栈中的数据大小与生存期必须是确定的。缺乏一些灵活性,栈中主要存放一些基本类型的变量和对象剧本。

Java内存模型要求调用栈和本地变量存放在线程栈上(Thread Stack),对象存放在堆上。

一个本地变量可能是指向一个对象的引用,这种情况下引用这个对象的变量它是存放在线程栈上,但是对象本身是存放在堆上的。

一个对象可能包含方法,这些方法可能包含本地变量(Local Variable),这些本地变量仍然是存放在线程栈上的。即使这些方法所属的对象是存放在堆上。

一个对象的成员变量可能会随着这个对象自身存放在堆上,不管这个成员变量是原始类型还是引用类型,静态成员变量跟随着类的定义一起存放在堆上。

存放在堆上的对象可以被所持有对这个对象的引用线程访问,当一个线程可以访问一个对象的时候,它也可以访问这个对象的成员变量,如果两个线程同时调用同一个对象上的同一个方法,它们将会都访问这个对象的成员变量,但是每一个线程都拥有了这个成员变量的私有拷贝。

硬件内存架构

如图是计算机硬件架构的简单图示,这里面是一个多CPU,一个现代计算机通常有两个或者多个CPU,其中一些CPU还有多核,从这一点我们可以看出在一个有两个或者多个CPU的计算机上,同时运行多个线程是非常有可能的,而且每个CPU在某一时刻运行一个线程是肯定没问题的。这意味着如果你的java程序是多线程的,在你的java程序中每个CPU上一个线程是可能同时并发执行的。

接下来介绍CPU寄存器(Registers),每个CPU都包含一系列的寄存器,它们是CPU内存的基础,CPU在寄存器上执行操作的速度远大于在主存上执行的速度。这是因为CPU访问寄存器的速度远大于主存。

然后是高速缓存(Cache),由于计算机的存储设备与处理器的运算速度之间有着几个数量级的差距,所以现代计算机系统都不得不加入一层读写速度尽可能接近于处理器运算速度的高级缓存来作为内存与处理器之间的缓冲,将运算需要使用到的数据复制到缓存中,让运算能快速的进行。当运算结束后,再从缓存同步回内存之中。这样处理器就无须等待缓慢的内存读写了,CPU访问缓存层的速度快于访问主存的速度,但通常比访问内部计算器的速度还是要慢一点。

每个CPU可能有一个CPU的缓存层,一个CPU还有多层缓存,在某一时刻,一个或者多个缓存行可能被读到缓存,一个或者多个缓存行可能再被刷新回主存,同一时间点可能会有很多个操作。

接下来介绍内存,一个计算机还包含一个主存,所有的CPU都可以访问主存,主存通常比CPU中的缓存要大的多。

接下来说说它们之间的运作原理,通常情况下当一个CPU需要读取主存时候,它会将主存的部分读取到CPU缓存中,它甚至可能将缓存的部分内容读到它内部的寄存器中,然后在寄存器中执行操作,当CPU需要将结果回写到主存时,它会将内部寄存器的值刷新到缓存中,然后在某个时间点将值刷新回主存。

关联

接下来看一下Java内存模型与计算机硬件内存架构之间的关联,通过图可以看出Java内存模型与硬件内存架构之间是存在一些差异的,硬件内存架构它没有区分线程栈和堆,对于硬件而言所有的线程栈和堆都分布在主内存里面。部分线程栈和堆可能有时候会出现在CPU缓存中或者CPU内部的寄存器里面。

Java内存模型抽象结构

接下来我们从抽象的角度来看一下线程和主内存之间的关系,线程之间共享变量存储在主内存里面,每个线程都有一个私有的本地内存,本地内存它是java内存模型的一个抽象概念,并不是真实存在的,它涵盖了缓存、写缓存区、寄存器以及其他硬件和编译器的优化。

本地内存它存储了该线程与读或写共享变量的拷贝的一个副本,(比如线程A想使用主内存的变量,那么它先拷贝出来这个变量的副本放在自己的本地内存里面),从更低的层次来说,主内存就是硬件的内存,是为了获取更好的运行速度,虚拟机及硬件系统可能会让工作内存优先存储于寄存器和高速缓存中。

java内存模型中的线程的工作内存是CPU寄存器和高速缓存的抽象描述。而JVM的静态内存存储模型(JVM内存模型),它只是一种对内存的物理划分而已,它只局限在JVM的内存。

线程通信

Java内存模型规定线程之间的通信必须要经过主内存,如果线程A和线程B之间要通信的话,必须要经历以下两个步骤:

  1. 线程A要把本地内存A中更新过的共享变量刷新到主存中
  2. 线程B到主内存中去读取线程A之前已经更新过的共享变量,然后拷贝一份到本地内存B中

同步操作与规则

关于主内存与工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存之类的细节,Java内存模型定义了相应的同步操作和规则。

同步八种操作

lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态
unlock(解锁):作用于主内存的变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定
read(读取):作用于主内存的变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的load动作使用
load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中
use(使用):作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎
assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量
store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write的操作
write(写入):作用于主内存的变量,它把store操作从工作内存中一个变量的值传送到主内存的变量中

同步规则
  1. 如果要把一个变量从主内存中复制到工作内存,就需要按顺寻地执行read和load操作,如果把变量从工作内存中同步回主内存中,就要按顺序地执行store和write操作。即不允许read和load、 store和write操作之一单独出现。但Java内存模型只要求上述操作必须按顺序执行,而没有保证必须是连续执行
  2. 不允许一个线程丢弃它的最近assign的操作,即变量在工作内存中改变了之后必须同步到主内存中
  3. 不允许一个线程无原因地(没有发生过任何assign操作)把数据从工作内存同步回主内存中
  4. 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量。即就是对一个变量实施use和store操作之前,必须先执行过了assign和load操作
  5. 一个变量在同一时刻只允许一条线程对其进行Iock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。lock和unlock必须成对出现
  6. 如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值
  7. 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁定的变量
  8. 对一个变量执行unlock操作之前,必须先把此变量同步到主内存中(执行store和write操作)

你可能感兴趣的:(Java内存模型(Java Memory Model,JMM))