JVM内存模型

(本文谨整理转载,系自己写出来加深印象所用)
之前谈到内存模型的时候总是想到这张图:

JVM内存区域划分

但是这张图其实只是JVM虚拟机中的内存使用分类,即JVM内存在用途上的分类,从概念上这并不是内存模型,参考这篇文章:https://www.jianshu.com/p/76959115d486
即理解上分为这样两类,JVM内存模型干什么的,JVM内存模型的几个分区分别用来做什么事情,第二个方向也就是面试经常问到的问题;

什么是JVM内存模型

Java程序内存的分配是在JVM虚拟机内存分配机制下完成。
Java内存模型(Java Memory Model ,JMM)就是一种符合内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,保证了Java程序在各种平台下对内存的访问都能保证效果一致的机制及规范。

这里就要梳理一下文章中提到的CPU内存和缓存之间的关系,以及重要概念:内存屏障
首先我们先总结一下内存和缓存的关系:
因为计算机CPU计算性能的快速发展,如果一直IO交互从磁盘读会极大Block程序性能,这也是为什么我们写程序的时候强调少交互,在内存中能完成的事情就不要通过多次交互完成,但是主内存的读写速度也是有瓶颈的,它的读取速度依然跟不上现在的CPU的计算速度,所以大家提出了缓存这么一回事儿,即L1,L2,L3三级缓存结构,读取数据时从1到3依次命中,详见这篇文章多三级缓存结构的解释:https://baijiahao.baidu.com/s?id=1598811284058671259&wfr=spider&for=pc

缓存和内存的结构

但是每个CPU都有这样的缓存结构,多CPU之间如何处理呢,其实是通过MESI协议来完成的,即保证了多CPU下的缓存之间的数据一致性,引用下文https://blog.csdn.net/q865165648/article/details/104095453
MESI协议的作用方式如图:

MESI协议的作用

在硬件层面则是提供了读屏障和写屏障来保证这件事,即内存屏障,其作用是:

由于现代操作系统都是多处理器操作系统,每个处理器都会有自己的缓存,可能存再不同处理器缓存不一致的问题,而且由于操作系统可能存在重排序,导致读取到错误的数据,因此,操作系统提供了一些内存屏障以解决这种问题.
简单来说:
1.在不同CPU执行的不同线程对同一个变量的缓存值不同,为了解决这个问题。
2.用volatile可以解决上面的问题,不同硬件对内存屏障的实现方式不一样。java屏蔽掉这些差异,通过jvm生成内存屏障的指令。

cpu执行指令可能是无序的,它有两个比较重要的作用

a.阻止屏障两侧指令重排序
b.强制把写缓冲区/高速缓存中的脏数据等写回主内存,让缓存中相应的数据失效。
对于读屏障:在指令前插入读屏障,可以让高速缓存中的数据失效,强制从主内存取。

简要言之,JMM是JVM的一种规范,定义了JVM的内存模型。它屏蔽了各种硬件和操作系统的访问差异,不像C语言那样直接访问硬件内存,相对安全很多,它的主要目的是解决由于多线程通过共享内存进行通信时,存在的本地内存数据不一致、编译器会对代码指令重排序、处理器会对代码乱序执行等带来的问题。可以保证并发编程场景中的原子性、可见性和有序性。

JVM内存分类

从线程角度来看:分为线程私有内存,线程共享内存,直接内存,此处引出线程间的数据一致性和数据共享问题

直接内存:
直接内存并不是JVM运行时数据区的一部分,但也会被频繁的使用。在JDK 1.4引入的NIO提供了机遇Channel与Buffer的IO方式,它可以使用Native函数库直接分配堆外的内存,然后使用DirectByteBuffer对象作为这块内存的引用进行操作,这样旧避免了Java堆和Native堆来回赋值数据,因此在一些场景中可以显著提高性能。
本机直接内存的分配不会收到Java堆大小的限制,(即不会遵守-Xms、-Xmx等配置)。但仍然是内存,则肯定还是会收到本机总内存大小+寻址空间的限制,因此扩展时也会出现OutOfMemoryError异常。

从数据区域来分:堆内,堆外,这就比较宽泛了,在JAVA中可以引出堆外缓存中间件的使用,后期我会专门写一篇文章讲述Ehcache 3.7中三级缓存的业务使用介绍;
从内存区域来分,分为五大类:方法区,堆,虚拟机栈,程序计数器,本地方法区,下文依次介绍

方法区(Metaspace)

用于存储已被虚拟机加载的类信息、常量、静态变量,如static修饰的变量加载类的时候就被加载到方法区中。

方法区存储的数据:
类型信息:全限定名、直接超类的全限定名、类的类型还是接口类型、访问修饰符、直接超接口的全限定名的有序列表
字段信息:字段名、字段类型、字段的修饰符
方法信息:方法名、方法返回类型、方法参数的数量和类型(按照顺序)、方法的修饰符
其他信息:除了常量以外的所有类(静态)变量、一个指向ClassLoader的指针、一个指向Class对象的指针、常量池(常量数据以及对其他类型的符号引用)

方法区主要有以下几个特点:
1.方法区是线程安全的,由于所有的线程都共享方法区,所以方法区里的数据访问必须被设计成线程安全的。
2、方法区的大小不必是固定的,JVM可根据应用需要动态调整。
3、方法区也可被垃圾收集,当某个类不在被使用(不可触及)时,JVM将卸载这个类,进行垃圾收集。
HotSpot 虚拟机,很多人愿意把方法区称为“永久代”(Permanent Generation)。本质上两者并不等价,仅仅是因为HotSpot 虚拟机的设计团队选择把GC 分代收集扩展至方法区,或者说使用永久代来实现方法区而已。对于其他虚拟机来说是不存在永久代的概念的。
当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。

在1.8中通过下面两个参数进行调节:
-XX:MetaspaceSize=XXM
-XX:MaxMetaspaceSize=XXM

针对常量池下图可以很好的概括:


常量池数据

程序计数器

https://www.jianshu.com/p/0ecf020614cb
程序计数器(Program Counter Register)是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。
如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Natvie方法,这个计数器值则为空(Undefined)。
此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
白话文: 程序计数器 可以从计算机原型中理解,它类似与CPU寄存器;用于记录JVM的各自独立线程的执行指令。当然是线程私有。

你可能感兴趣的:(JVM内存模型)