Java内存模型(Java Memory Model ,JMM)就是一种复核人内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,保证了Java程序在各种平台下对内存的访问都能保证效果一致的机制及规范。
JMM的主要目的是解决由于多线程通过共享内存进行通信时,存在的本地内存数据不一致、编译器会对代码指令重排序、处理器会对代码乱序执行带来的问题。可以保证并发编程场景中的原子性、可见性和有序性。
JVM内存模型主要由堆内存、方法区、程序计数器、虚拟机栈和本地方法栈组成,其组成的结构如下图所示
其中,堆和方法区是所有线程共有的,而虚拟机栈,本地方法栈和程序计数器则是线程私有的。
堆内存是所有线程共有的,可以分为两个部分:年轻代和老年代。在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的u对象都是在这里分配内存。这一点在Java虚拟机规范中的描述是:所有的对象实例以及数据都是在堆中分配
,但是随着JIT(即时编译器)的发展和逃逸分析技术的逐渐成熟,栈上分配、标量替换优化技术将会导致一些微妙的变化发生,所有的对象都分配在堆上也渐渐变得不是那么“绝对了”。
Java堆是垃圾收集器管理的主要区域,因此很多时候也被称作“GC堆”。如果从内存回收的角度看,由于现在收集器基本都是采用的分代手机算法,所以Java堆中还可以细分为:新生代和老年代;再细致一点的有Eden孔金、From Survivor空间、To Survivor空间等。如果从内存分配的角度看,线程共享的Java堆可能划分除多线程私有的分配缓冲区,不过,无论如何让规划,都与存放内容无关,无论哪个区域存储都仍然是对象实例,进一步划分的目的是为了更好的回收内存,或者更快的分配内存。
根据Java虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中
,只要逻辑上是连续的即可,就像我们的磁盘空间一样。在实现时,既可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(通过-Xmx和-Xms控制)。如果在堆中没有内存完成实例分配,并且堆也是无法再扩展时,将会抛出OutOfMemoryError异常。
方法区和堆内存一样,是各个线程共享的区域,它用于存储已经被虚拟机加载的类信息,常量,静态变量,即时编译(JIT)后的代码登数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却又一个别名叫Non-Heap(非堆),目的就是要与java堆区分开来。
由于程序所有的线程共享一个方法区,所以访问方法区的信息必须确保线程是安全的,如果有两个线程同时去加载一个类,那么只能有一个线程被允许去加载这个类,另一个必须等待。
在程序运行时,方法区的大小是可以改变的,程序在运行时可以扩展。同时,方法区里面的对象也可以被垃圾回收,但条件非常严苛,必须在该类没有任何引用的情况下才能被GC回收,以达到方法区最小化。
对于习惯再HotSpot虚拟机再开发和部署程序的开发者来说,很多人愿意把方法区称为“永久代”,本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已。对于其它虚拟机来说是不存在永久代的概念的。即使是HotSpot虚拟机本身,根据官方发布的路线图信息,现在也有放弃永久代并“搬家”至Native Memory来实现方法区的规划了。
java虚拟机规范对这个区域的限制非常宽松,除了和Java堆一样不需要连续的内存和可以选择固定大小或者可扩展外,还可以选择不是先垃圾收集。相对而言,垃圾手机行为这个区域是比较少出现的
,但并非数据进入了方法区就永久代的名字一样“永久”存在了。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载
,条件相当苛刻,但是这部分区域的回收确实是有必要的。在Sun公司的Bug列表中,曾出现过的若干个严重的BUG就是由于低版本的HotSpot虚拟机对此区域未完全回收而导致内存泄漏。
根据Java虚拟机规范的规定,当方法无法满足内存分配需求时,将抛出OutOfMemoryError异常。
程序计数器是一块很小的内存空间,它是线程私有的,可以认为是当前线程的行号指示器。在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,,在一个确定的时刻都只会执行一条线程中的指令,一条线程中有多个指令,为了线程切换可以恢复到正确执行位置,每个线程都需要有独立的一个程序计数器,不同线程之间的程序计数器互不影响,独立存储。
如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Natvie方法,这个计数器值则为空。此内存区域是唯一一个在java虚拟规范中没有规定任何OutOfMemoryError
情况的区域。
与程序计数器一样,Java虚拟机栈也是线程私有的,它的声明周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧用于存储局部变量、操作数栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表存放了编译器可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(指向对象的地址)和returnAddress(指向一条字节码指令的地址)。其中64位长度的long和double类型的数据会占用2个局部变量(slot),其余的数据类型只占用1个。局部变量表所需要的内存空间在编译期
间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
在Java虚拟机规范中,对这个区域规定了两种异常情况:如果线程请求的栈深度大于虚拟机所允许的深度
,将抛出StackOverlfowError异常:如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都是可动态扩展,只不过Java虚拟机规范中也允许固定长度的虚拟机栈),当扩展时无法申请到足够的内存时会抛出OutOfMemoryError异常。
本地方法栈与虚拟机栈发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行Java方法服务(也就是字节码),而本地方法栈则是虚拟机使用到的Native方法服务。
虚拟机规范中对于本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。甚至有的虚拟机(譬如Sun HotSpot虚拟机)直接就把本地方法栈和虚拟机栈合二为一
。与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。
运行时常量池时方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用
,这部分内容将在类加载后存放到方法区的运行时常量池中。
Java虚拟机对Class文件的每一部分的格式都有严格的规定,每一个字节用于存储那种数据都必须符合规范的要求,这样才会被虚拟机认可、装载和执行。但对于运行时常量池,Java虚拟机规范没有做审核细节的要求,不同的提供商实现的虚拟机可以按照自己的需求来实现这个内存区域。不过,一般来说,除了保存Class文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池中。
运行时常量池相对于Class文件常量池
的另外一个重要特征时具备动态性,Java语言并不要求常量一定只能在编译期产生,也就是并非预置入Class文件中常量池的内容才能进入方法区运行常量池,运行期间也可能将新的常量放入池中
,这种特种被开发人员利用得比较多的便是String类的intern()方法。
既然运行时常量池时方法去的一部分,自然会受到方法区内存的限制,当常量池无法申请到内存时会抛出OutOfMemoryError异常
直接内存并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域,到那时这部分内存也被频繁的使用,而且也可能导致OutOfMemoryError异常出现。
在JDK1.4中新加入了NIO类,引入了一种基于通道与缓冲区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个储存在Java堆里面的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。
显然,本机直接内存的分配不会收到Java堆大小的限制,但是,既然是内存,则肯定还是会受到本机总内存的大小及处理器的寻址空间的限制。服务器管理员配置虚拟机参数时,一般会根据实际内训设置-Xmx等参数信息,但经常会忽略掉直接内存,使得各个内存的总和大于物理内训限制,从而导致动态扩展时出现OutOfmemoryError异常。