线程私有,通过改变计数器的值选取下一条需要执行的字节码指令。执行本地方法(native)时计数器的值为空
线程私有,每个方法需要被执行时创建一个栈帧并压入栈顶,执行完毕出栈,调用其他方法时将其他方法的栈帧压入。
栈帧包括局部变量表、操作数栈、动态链接、方法返回地址、附加信息
局部变量表可以存放基本数据类型(boolean、byte、char、short、int、float、long、double),对象引用(reference类型),returnAddress类型(执行一条字节码指令的地址)
这些数据类型在局部变量表中的存储空间以局部变量槽Slot为单位,一个Slot具体大小由虚拟机决定。
跟教科书里栈模拟计算器类似,两数相加则将两数压栈,遇到操作符则取出两数进行相加,将和再压栈。
不过操作数栈结合了局部变量表对变量进行了存储。
public void function(){
int a = 1;
int b = 2;
int c = a + b;
}
流程如下:
具体处理流程看这里
每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用,持有该引用是为了支持方法调用过程中的动态链接(Dynamic Linking)。
Class文件的常量池中存在大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用作为参数。
这些符号引用一部分在类加载阶段或第一次使用时转化为直接引用,这种转化是静态解析。
另一部分在运行期间转化为直接引用,这部分成为动态链接。
有正常完成出口和异常完成出口,如果有返回值则会压入调用方的栈帧。
取决于虚拟机的实现,如虚拟机规范中没有的信息放到其中。
线程私有,与虚拟机栈类似,区别是本地方法栈作用域本地方法,会受到平台的影响。
方法区存储的内容:
已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存。
方法区存在于元空间,元空间不再与堆连续,存在于本地内存,没设置限制参数时只受物理内存限制。元空间不会GC。
存储类和类加载器的元数据信息。
线程共享
存放:
元空间在直接内存,直接内存与NIO有关。
是方法区的一部分。Class文件中有常量池表,用于存放编译器生成的各种字面量和符号引用,这部分将在类加载后存放到方法区的运行时常量池中。
Class文件的符号引用和符号引用翻译出来的直接引用也会存储在运行时常量池中。
运行时常量池是动态的,运行期间也可以放入新的常量。
对象在堆中存储布局可以划分为三部分:对象头、实例数据、对其填充。
对象头包含两部分信息。
一类是存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID,偏向时间戳,被称为Mark Word,这部分数据长度在32位和64位虚拟机中为32比特和64比特。对象头里的信息与对象自身定义数据无关的额外存储成本,是动态的(为了节省空间)。
举例:在32位的HotSpot虚拟机中,对象未被同步锁锁定的状态下,Mark Word32个比特存储空间的25个比特用于存储对象哈希码,4个比特用于存储对象分代年龄,2个比特存储锁标志位,1个比特固定为0.其他状态下(轻量级锁定、重量级锁定、GC标记、可偏向)下的存储内容如下:
存储内容 | 标志位 | 状态 |
---|---|---|
对象哈希码、对象分代年龄 | 01 | 未锁定 |
指向锁记录的指针 | 00 | 轻量级锁定 |
指向重量级锁的指针 | 10 | 膨胀(重量级锁定) |
空,不需要记录 | 11 | GC标记 |
偏向线程ID、翩跹时间戳、对象分代年龄 | 01 | 可偏向 |
另一部分是类型指针,即对象指向他的类型元数据的指针。虚拟机通过该指针判断对象属于哪个类的实例。 |
存储类中定义的各种类型的字段内容。一般情况下父类定义的变量出现在子类之前。
非必须,占位符的作用。HotSpot虚拟机内存管理要求对象起始地址为8字节的整数倍。
寻找对象需要通过虚拟机栈上的对象引用(reference)定位堆中对象的位置,但如何定位由虚拟机实现决定。
两种方式:使用句柄和直接指针
句柄式,Java堆中划分一块内存作为句柄池,对象引用reference中存储的是对象的句柄地址。句柄包含对象的实例数据地址和对象类型地址。
指针式,栈中reference对象引用存储的是对象地址,但无法记录对象类型的地址,所以要在对象数据中有记录对象类型所在的地址。
两者差异:
方法:对象中添加引用计数器,引用该对象计数器加一,失效时减一,为0则该对象未被使用。
优点:原理简单,判定效率高
缺点:占用一定额外内存,难以解决循环引用问题
循环引用问题:两个不再被使用的对象相互引用,造成两个对象的计数器都不为0,无法判定是否存活需要回收。
方法:GC Roots的根对象作为起始节点集,沿着这些对象根据引用关系向下搜索,未被搜索到的对象被视为不可达。
优点:解决了循环引用的问题
缺点:复杂
引用链:沿着引用关系搜索的路径为引用链。
为了能够 内存空间足够时,能保留在内存,垃圾回收后内存仍然紧张则抛弃这些对象 ,JDK1.2后Java对引用进行扩充。下面四种引用强度逐渐减弱。
SoftReference s=new SoftReference("asdf");
可达性分析算法中,至少经过两次标记才能宣告对象死亡。第一次分析后未可达的对象会被第一次标记,随后进行筛选,筛选的条件是对象是否需要执行finalize()方法。
对象没有覆盖finalize()方法或者finalize()方法已经被虚拟机调用过,则这两种情况都被视为不需要执行finalize()方法。
对象被判定需要执行该方法后,对象被放入一个队列中,并在稍后由虚拟机创建的低优先级线程执行队列中对象的finalize()方法,finalize方法是对象逃脱回收的最后一次机会,可以在方法中重新建立引用。
回收队列中对象的finalize方法不一定执行完才结束,为了防止执行缓慢或者死循环使回收系统崩溃。
finalize如今已经被官方声明为不推荐的语法。
假如要现在进行一次只局限于新生代区域内的收集(Minor GC),但新生代中的对象是完全有可 能被老年代所引用的,为了找出该区域中的存活对象,不得不在固定的GC Roots之外,再额外遍历整 个老年代中所有对象来确保可达性分析结果的正确性,反过来也是一样
最开始的疑惑是为什么要额外遍历整个老年代的对象,后来才猜测只局限新生代的收集时不会遍历整个GC Roots,只会遍历包含新生代引用的GC Roots,这时新生代里若有老年代的引用,这次垃圾收集会漏掉这些对象,所以要遍历一次老年代的对象。
解决跨代引用问题的方法:在新生代上建立全局的数据结构(记忆集Remembered Set),将老年代划分成若干块,标识有跨代引用的块,以后发生Minor GC时,将包含跨代引用的块的对象加入GC Roots扫描
在3.2.3垃圾回收器节可以看到,新生代的回收器都是采用的标记-复制算法,回收时将80%的Eden和10%的Survivor回收后存活的对象复制到另一个10%的Survivor中
解释 | 优点 | 缺点 | 相关收集器 | |
---|---|---|---|---|
标记-清除(sweep)算法 | 可达性分析判定是否是垃圾,然后清除 | 简单 | 1. 空间碎片化,空间不连续可能导致额外触发垃圾回收 2. 效率不稳定,回收时间随着垃圾数量增多而变长 |
CMS |
标记-复制(copying)算法 | 内存分两部分,将一部分空间存活的对象移动到另一部分,并清除整个当前空间 | 高效且无碎片化问题 | 1. 空间利用率不高 2. 存活对象多时,复制开销大 |
新生代的收集器 |
标记-整理(compact)算法 | 将存活的对象移动到内存的一端,清除掉边界以外的内存 | 空间利用率高,无碎片化问题 | 存活对象多时,移动开销大 | Parallel Old、Serial Old |
使用位置 | 搭配 | 算法 | 多/单线程 | 目标 | 版本 | |
---|---|---|---|---|---|---|
Serial | 新生代 | CMS、Serial Old | 标记复制算法 | 单线程 | 停顿时间短 | JDK1-JDK2唯一的新生代收集器 |
ParNew | 新生代 | CMS、Serial Old | 标记复制算法 | 多线程 | 停顿时间短 | |
Parallel Scavenge | 新生代 | Serial Old、Parallel Old | 标记复制算法 | 多线程 | 吞吐量优先 | JDK5-JDK8的默认新生代收集器 |
G1 | 新生代+老年代 | 无 | 标记整理(整体)+标记复制(局部) | 多线程 | 停顿时间短 | JDK9-JDK19的默认收集器 |
CMS | 老年代 | Serial、ParNew | 标记清除算法 | 多线程 | 停顿时间短 | JDK5出现 |
Serial Old | 老年代 | Serial、ParNew、Parallel Scavenge | 标记整理算法 | 单线程 | 停顿时间短 | JDK5-JDK8的默认老年代收集器 |
Parallel Old | 老年代 | Parallel Scavenge | 标记整理算法 | 多线程 | 吞吐量优先 | JDK6出现 |
ZGC | 新生代+老年代 | 无 | JDK11引入,JDK15可以正式使用 |
Parallel Scavenge除了关注吞吐量外,自适应调节策略是区别ParNew的重要特性。
自适应调节策略: 开启自适应策略参数后,虚拟机能够根据系统运行情况,动态调节新生代大小、晋升老年代对象大小等参数,达到最适合的停顿时间或者吞吐量。
如名称含义CMS(Concurrent Mark Swap)是并发且基于标记清除算法实现的。目标是低停顿时间。
四个阶段 | 目标 | 时间 | 是否需要暂停用户线程(STW) |
---|---|---|---|
初始标记 | 标记GC Roots能直接关联到的对象 | 时间短 | 是 |
并发标记 | 从GC Roots直接关联到的对象遍历整个对象图 | 时间长 | 否 |
重新标记 | 修正并发标记期间用户线程造成对象变动 | 比初始标记时间长,比并发标记时间短 | 是 |
并发清除 | 清除掉标记判断死亡的对象 | 时间长 | 否 |
缺点:
介绍:
将整个堆划分成多个相等的区域(Region)每个区域可以是Eden、Survivor、Old。有一种特殊的区域是Humongous,用于存储大对象。当对象超过Region一半时,将会把它放到多个连续的Humongous中,可以看做老年代一部分。
四个阶段:
四个阶段 | 目标 | 时间 | 是否需要暂停用户线程(STW) |
---|---|---|---|
初始标记 | 标记GC Roots能直接关联到的对象 | 时间短(借用Minor GC同步完成,无额外停顿) | 是 |
并发标记 | 从GC Roots直接关联到的对象遍历整个对象图 | 时间长 | 否 |
最终标记 | 修正并发标记期间用户线程造成对象变动 | 比初始标记时间长,比并发标记时间短 | 是 |
筛选回收 | 按照回收价值和成本排序,回收一部分区域。 | 时间短 | 是 |
两者比较相似,但又有许多不同的地方。
G1对比CMS的
优点: G1可以指定最大停顿时间、分Region的内存布局、按收益动态确定回收集、不会产生空间碎片。
缺点: G1无论是为了垃圾收集产生的内存占用(Footprint)还是程序运行时的额外执行负载(Overload)都要比CMS要高。
所有收集器在进行根节点枚举时都要暂停用户线程,否则分析过程中根节点集合的对象引用还在变化,无法保证分析准确性。
有一个OopMap的数据结构可以维护存放对象引用的位置
HotSpot没有为每条指令生成OopMap,在特定的位置记录这些信息,被称为安全点。用户线程在指令到达安全点后才能暂停。
两种在垃圾回收时让所有线程跑到安全点后停顿的方式:
使用安全点的设计似乎已经完美解决如何停顿用户线程,让虚拟机进入垃圾回收状态的问题了, 但实际情况却并不一定。安全点机制保证了程序执行时,在不太长的时间内就会遇到可进入垃圾收集 过程的安全点。但是,程序“不执行”的时候呢?所谓的程序不执行就是没有分配处理器时间,典型的 场景便是用户线程处于Sleep状态或者Blocked状态,这时候线程无法响应虚拟机的中断请求,不能再走 到安全的地方去中断挂起自己,虚拟机也显然不可能持续等待线程重新被激活分配处理器时间。对于 这种情况,就必须引入安全区域(Safe Region)来解决。 安全区域是指能够确保在某一段代码片段之中,引用关系不会发生变化,因此,在这个区域中任 意地方开始垃圾收集都是安全的。我们也可以把安全区域看作被扩展拉伸了的安全点。 当用户线程执行到安全区域里面的代码时,首先会标识自己已经进入了安全区域,那样当这段时 间里虚拟机要发起垃圾收集时就不必去管这些已声明自己在安全区域内的线程了。当线程要离开安全 区域时,它要检查虚拟机是否已经完成了根节点枚举(或者垃圾收集过程中其他需要暂停用户线程的 阶段),如果完成了,那线程就当作没事发生过,继续执行;否则它就必须一直等待,直到收到可以 离开安全区域的信号为止。
可达性分析算法要求全过程基于一个能保障一致性的快照中才能够进行分析,意味着过程必须暂停用户线程。
根节点枚举的过程中,对象数量相对堆较少,且有优化方式(OopMap),其带来的停顿短暂且固定。
在堆中遍历对象其停顿时间和堆容量成正比。
三色标记:
收集器在对象图上标记颜色同时用户线程修改引用关系,可能出现两种情况:
确保Classs文件的字节流中包含信息符合规范要求,防止危害虚拟机安全。
验证阶段会进行下面四个验证动作。
将类中定义的静态变量分配内存并设置初始值。(JDK7在方法区,JDK8在堆)
public static int value = 123;
在准备时会被设置初始值0,在初始化阶段才会设置为123
有两个前提:
如
static int a = 1; // 准备阶段赋值
static int a = getA(); // 初始化阶段赋值
将常量池内的符号引用转换为直接引用。
常量池:
class文件解析出的二进制字节码里定义了常量池,字节码被加载到方法区后,该常量池变成了运行时常量池。常量池是class文件的一部分,保存编译时确定的数据。
常量池包含的内容:
符号引用:
用符号代表所引用的目标,类、方法、变量等完全限定名都可以被当做符号引用。
直接引用:
直接指向目标的指针、相对偏移量、间接定位到目标的句柄
启动类加载器(Bootstrap Class Loader)
用户自定义类加载器
工作过程:
一秒内服务端平均能相应的请求总数,和并发能力密切相关
计算机的存储设备和处理器的运算速度有几个数量级的操作,IO操作让处理器等待数据,会影响整体速度。
将运算的数据从内存复制到缓存中,处理器和缓存之间的IO比内存之间的IO时间小,整体处理速度快。当运算结束后再从缓存同步到内存中
多路处理器系统中,每个处理器有自己的高速缓存,且共享同一主存。当这些处理器运算都设计到同一个主存区域时,对主存中的同一个数据可能在各自的缓存中不相同,这时无法判断以谁的缓存数据为准。
原因: 一个线程修改主内存的值后,其它线程可能还在使用工作内存的副本,导致无法感知值的变化,进而产生bug。
**思路:**需要保证其它线程在主内存的值改变时删掉工作内存该值的缓存,从主内存获取数据。
措施:
原因: JVM存在指令重排,实际执行的顺序可能与代码顺序不同,在多线程情况下会有影响。
如何保证有序性:
含义: 一个或多个操作全都执行且不被其它操作影响,或者全部不执行
保证原子性:
概念: 内存屏障是一条指令,可以对编译器和硬件的指令重排序进行限制。
屏蔽硬件和操作系统的内存访问差异,在各个平台下达到一致的内存访问效果
关注在虚拟机中,将变量存储和取出内存的细节
为了更好的执行效率,Java内存模型没有限制执行引擎使用处理器的特定寄存器或缓存来和主内存进行交互,也没有限制即时编译器对代码执行顺序的优化
JDK5之后才成熟
特点:
Java内存模型规定所有变量存储在主内存。
每条线程有自己的工作内存,工作内存保存了该内存使用的变量的主内存副本。
线程对变量的所有操作必须在工作内存中进行,不能直接读写主内存中的数据。
不同线程无法直接访问对方的工作内存的变量。
线程间变量传递需要通过主内存完成
主内存、工作内存和虚拟机之间的对应关系关系:
讲述了一个变量从主内存到工作内存到计算再到回到主内存的过程
Java内存模型定义了八种操作,每种操作都是原子的、不可再分的
作用位置 | 功能 | |
---|---|---|
lock锁定 | 主内存 | 把主内存的变量标识为一个线程独占的状态 |
unlock解锁 | 主内存 | 把主内存的变量解锁 |
read读取 | 主内存 | 把变量的值从主内存传输到工作内存中 |
load载入 | 工作内存 | 将工作内存中read获取的值放入变量副本中 |
use使用 | 工作内存 | 将工作内存中变量的值传给执行引擎(虚拟机遇到需要使用变量值的字节码指令时执行,加减乘除等) |
assign赋值 | 工作内存 | 将执行引擎上的值赋值给工作内存的变量 |
store存储 | 工作内存 | 将工作内存变量的值传送到主内存中 |
write写入 | 主内存 | 将主内存中,store操作获取的值放入主内存的变量里 |
操作的一些规则:
不允许read和load,store和write的操作之一单独出现
工作内存的数据发生变化前(没有assign操作)不应该将数据同步回主存
不允许线程对其最近的assign操作,即变量在工作内存改变后必须同步回主内存(不太理解)
不允许在工作内存中使用(use或store操作)未被初始化的变量(load或assign可以初始化变量),
同一个变量同一时刻只允许一个线程对其lock操作,lock可以被同一个线程重复执行多次,多次lock需要同样次数的unlock才可以解锁
一个主内存中变量被lock后,所有工作内存中该变量的副本值都会被清除,在执行引擎使用这个变量前,需要重新执行load或assign操作来初始化这个变量
无法unlock没被lock的变量,也无法unlock被其线程锁定的变量
unlock之前必须先将变量同步回主内存中
插一个想法,一个线程在一个变量上加锁后,其他线程还可以改变这个变量,只要访问变量的时候不去获取它的锁
volatile变量的两个特性:
volatile在三种特性上的体现:
volatile读-写的内存语义:
volatile实现原理:
并发时,该变量参与的代码也有可能线程不安全,通过下面两点保证原子性
比较普遍的就是 i++
指令重排序:
程序运行时,编译器和CPU可能对指令优化,重新排序
性能:
Java内存模型对volatile变量的规则:
设T为线程,V和W为两个volatile变量,在进行操作时要满足一些规则
这一块没明白,见书中12.3.3
允许虚拟机对没有被volatile修饰的64位数据分两次32位的操作进行,导致long和double的操作可能非原子性