JVM(Java Virtual Machine)是运行Java字节码的虚拟机,其包括一套字节码指令集,一组寄存器,一个栈,一个垃圾回收堆和一个存储方法域。JVM有针对不同系统的特定实现(Windows,Linux,macOS),将Java字节码(.class文件)编译成机器码,因此字节码和JVM共同造就了Java语言“一次编译,到处运行”的特点。
当一个程序开始运行,虚拟机就开始实例化了,多个程序启动就会存在多个虚拟机实例。程序退出或者关闭,虚拟机实例消亡,多个虚拟机之间数据不能共享。
线程私有数据区域生命周期与线程相同,依赖用户线程的启动/结束 而 创建/销毁
线程共享区域随虚拟机的启动/关闭 而 创建/销毁
当前线程所执行的字节码的行号指示器,若线程正在执行java方法的话,计数器记录的是虚拟机字节码指令的地址(当前指令的地址),若执行的是native方法则为空(此内存区域是唯一一个在JVM中没有规定任何OOM情况的区域)
是描述Java方法执行的模型,每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
局部变量表存放编译期可知的各种基本数据类型、对象引用和returnAddress类型,其所需的内存空间在编译期间是完全确定的,方法运行期间不会改变局部变量表的大小。
Native Method Stask与虚拟机栈的作用类似,其主要为Native方法服务,同样有StackOverflowError异常和OutOfMemoryError异常
几乎所有的对象实例和数组都在堆上分配,同时也是垃圾收集器管理的主要区域,故也叫GC堆。
从内存回收的角度看,由于现代VM采用分代收集算法,故可细分为新生代(Eden空间、From Survivor空间、To Survivor空间)和老年代
从内存分配的角度看,堆中可能划分多个线程私用的分配缓冲区(TLAB)
(Permanent Generation)存储被JVM加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
该区域的内存回收目标主要是针对常量池的回收和对类型的卸载(收益较小)
(Runtime Constant Pool)是方法区的一部分,用于存放字节码文件编译期间生成的各种字面量和符号引用,
运行期间也可能将新的常量放入池中。
用来存放新生的对象。一般占据堆的1/3空间。由于频繁创建对象,故会频繁触发MinorGC进行垃圾回收。新生代分为以下三个区:
上一次GC的幸存者,作为这一次GC的被扫描者。
保留了一次MinorGC过程中的幸存者。
Step1:eden servivorFrom 复制到 servivorTo,年龄+1
首先把Eden和servivorFrom区域中存活的对象复制到servivorTo区域,同时把这些对象年龄+1(若有对象年龄到达老年代的标准,默认年龄是15,或者servivorTo空间不足则放到老年代)
Step2:清空eden servivorFrom
Step3:servivorTo 和 servivorFrom 互换
主要存放应用程序中周期长的内存对象。
MajorGC触发条件:
A.MinorGC后有新生代的对象晋身入老年代,导致空间不够用。
B.没有足够大的连续空间分配给新创建的较大的对象
首先扫描一次所有老年代,标记出存活的对象,然后回收没有标记的对象,故耗时较长,易产生内存碎片。
主要存放Class和Meta(元数据),类加载时放入,GC不会对永久区进行清理
Java8后被一称为"元数据区"的区域取代。元空间不在虚拟机中而使用本地内存
如果JVM堆内存是规整的,堆内存被指针一分为二,指针左边被塞满了对象,指针右边是未使用的区域。每有一次新的对象创建,指针就会向右移动一个对象size的距离。
如果JVM堆内存并不是规整的,JVM须维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例并更新表上的记录
问题:并发情况下,线程1正在给对象A创建对象,线程2正在给对象B创建对象,指针还未来得及修改指向。
解决方案:
A.对分配内存空间的动作进行同步处理--实际上虚拟机采用CAS配上失败重试的方法保证更新操作的原子性
B.本地线程分配缓冲(Thread Local Allocation Buffer TLAB):线程在初始化时,会申请一块指定大小的内存区域,只给当前线程分配内存,提高分配效率。TLAB只是让每个线程有私有的分配指针,其内存空间是可被其他线程访问的。
Reference Counting表示对象如果没有任何与之关联的引用,即他们的引用计数都不为0,则说明对象不太可能再被用到,那么这个对象就是可回收对象。(循环引用问题)
Reachability Analysis表示通过一系列的称为"GC Roots"的对象作为起始点开始搜索,搜索走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可达的。
不可达对象至少要经过两次标记过程才会变为可回收对象。
两个阶段,标注和清除,缺点是内存碎片化严重
按内存容量将内存划分为大小相等的两块。每次只使用其中一块,当一块内存满后将尚存活的对象复制到另一块上去,清理原有的。缺点是可用内存变为原来的一半
标记后不是清理对象,而是将存活对象移向内存的一端,然后清除端边界外的对象
代码中普遍存在的,把一个对象赋给一个引用变量。当一个对象被强引用变量引用时,其永远不可能被GC回收,是造成内存泄露的主要原因。
对于只有软引用的对象来说,发生GC后系统内存足够时不会被回收,发生GC后系统内存空间不足时会被回收。
对于只有弱引用的对象来说,只要发生GC,不管JVM内存空间是否足够,都会被回收。
主要作用是跟踪对象被垃圾回收的状态
工作时需暂停其他工作线程,是JVM运行在client模式下默认的新生代垃圾收集器。
工作时需暂停其他工作线程,是Serial的多线程版本,是很多JVM运行在server模式下新生代默认的垃圾收集器。
其重点关注程序达到一个可控制的吞吐量(CPU运行用户代码时间/运行用户代码时间+垃圾收集时间),拥有自适应调节策略。
是Serial垃圾收集器年老代版本,是JVM运行在client模式下默认的年老代垃圾收集器。
是Parallel Scavenge垃圾收集器的年老代版本,在年老代提供吞吐量优先。
Concurrent Mark Sweep主要目标是获取最短垃圾回收停顿时间。
Step1:初始标记
标记GC Roots能直接关联的对象,速度很快,但仍然需要暂停工作线程。
Step2:并发标记
进行GC Roots跟踪的过程,和用户线程一起工作,不需要暂停工作线程。
Step3:重新标记
为修正并发标记期间,因用户程序继续运行而导致标记变动的记录,仍需暂停工作线程。
Step4:并发清除
清除GC Roots不可达对象,不需要暂停工作线程。
由于并发标记和并发清除消耗时间最长且和工作线程一起工作,故总体上看CMS收集器的内存回收是和用户线程一起并发执行。
基于标记整理算法,不产生内存碎片。
避免全区域垃圾收集,其把堆内存划分为大小固定的几个独立区域,优先回收垃圾最多的区域。
加载是类加载过程中的一个阶段,JVM主要完成以下三件事:
1.通过类的全限定名来获取定义此类的二进制字节流(ZIP包、运行时计算生成(动态代理)、其他文件(JSP转化成class文件));
2.将字节流的静态存储结构转化为方法区的运行时数据结构;
3.在内存中生成一个代表这个类的class对象,作为方法区这个类的各种数据的访问入口。
确保Class文件的字节流中包含的信息是否符合当前虚拟机的要求-->安全性
为类变量分配内存并设置类变量的初始值。
例: public static int v = 8080; 准备阶段初始值为0;
public static final int v = 8080; 准备阶段初始值为8080;
虚拟机将常量池中的符号引用替换为直接引用的过程。
以一组符号来描述所引用的目标,各种虚拟机实现的内存布局可以各不相同,引用的目标不一定加载到内存中。
可以是直接指向目标的指针、相对偏移量或者是一个能间接定位到目标的句柄。直接引用的目标其内存必定在内存中存在。
初始化阶段是执行类构造器
以下几种情况不会执行类初始化:
负责加载JAVA_HOME\lib目录中,或通过-Xbootclasspath 参数制定路径中的,且被JVM认可的类。
负责加载JAVA_HOME\lib\ext目录中的,或通过java.ext.dirs系统变量指定路径中的类库。
负责加载用户路径(classpath)上的类库
当一个类收到了类加载请求,他首先不会尝试自己去加载这个类,而是把这个请求委派给父类去完成,只有当父类加载器反馈自己无法完成这个请求的时候(在其加载路径下没有找到所需加载的class),子类加载器才尝试自己去加载。
双亲委派的一个好处是,加载rt.jar包中的java.lang.Object类,使用不同的加载器最终得到的都是同一个Object。