《深入理解Java虚拟机》----JVM学习笔记整理

基本概念

    JVM(Java Virtual Machine)是运行Java字节码的虚拟机,其包括一套字节码指令集,一组寄存器,一个栈,一个垃圾回收堆和一个存储方法域。JVM有针对不同系统的特定实现(Windows,Linux,macOS),将Java字节码(.class文件)编译成机器码,因此字节码和JVM共同造就了Java语言“一次编译,到处运行”的特点。

运行过程

  • Java源文件 -> 编译器 ->字节码文件
  • 字节码文件 -> JVM解释器 -> 机器码

   当一个程序开始运行,虚拟机就开始实例化了,多个程序启动就会存在多个虚拟机实例。程序退出或者关闭,虚拟机实例消亡,多个虚拟机之间数据不能共享。

 

JVM内存区域

《深入理解Java虚拟机》----JVM学习笔记整理_第1张图片

 

《深入理解Java虚拟机》----JVM学习笔记整理_第2张图片

线程私有数据区域生命周期与线程相同,依赖用户线程的启动/结束 而 创建/销毁

线程共享区域随虚拟机的启动/关闭 而 创建/销毁

程序计数器(线程私有)

    当前线程所执行的字节码的行号指示器,若线程正在执行java方法的话,计数器记录的是虚拟机字节码指令的地址(当前指令的地址),若执行的是native方法则为空(此内存区域是唯一一个在JVM中没有规定任何OOM情况的区域)

虚拟机栈(线程私有)

    是描述Java方法执行的模型,每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。

    局部变量表存放编译期可知的各种基本数据类型、对象引用和returnAddress类型,其所需的内存空间在编译期间是完全确定的,方法运行期间不会改变局部变量表的大小。

  • StackOverflowError异常:线程请求的虚拟机栈深度大于虚拟机所允许的深度
  • OutOfMemoryError异常:虚拟机栈可动态扩展但扩展时无法申请到足够的内存

本地方法栈(线程私有)

    Native Method Stask与虚拟机栈的作用类似,其主要为Native方法服务,同样有StackOverflowError异常和OutOfMemoryError异常

Java堆(线程共享)

几乎所有的对象实例和数组都在堆上分配,同时也是垃圾收集器管理的主要区域,故也叫GC堆。

从内存回收的角度看,由于现代VM采用分代收集算法,故可细分为新生代(Eden空间、From Survivor空间、To Survivor空间)和老年代

从内存分配的角度看,堆中可能划分多个线程私用的分配缓冲区(TLAB)

方法区/永久代(线程共享)

(Permanent Generation)存储被JVM加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

该区域的内存回收目标主要是针对常量池的回收和对类型的卸载(收益较小)

运行时常量池

(Runtime Constant Pool)是方法区的一部分,用于存放字节码文件编译期间生成的各种字面量和符号引用,

运行期间也可能将新的常量放入池中。

 

JVM共享内存划分(GC角度)

《深入理解Java虚拟机》----JVM学习笔记整理_第3张图片

新生代

用来存放新生的对象。一般占据堆的1/3空间。由于频繁创建对象,故会频繁触发MinorGC进行垃圾回收。新生代分为以下三个区:

Eden:

Java新对象的出生地(若新创建的对象占用内存很大,则直接分配到老年代),当Eden区内存不够时会触发MinorGC进行垃圾回收。

ServivorFrom:

上一次GC的幸存者,作为这一次GC的被扫描者。

ServivorTo:

保留了一次MinorGC过程中的幸存者。

MinorGC的过程(复制->清空->互换) 复制算法

Step1:eden servivorFrom 复制到 servivorTo,年龄+1

首先把Eden和servivorFrom区域中存活的对象复制到servivorTo区域,同时把这些对象年龄+1(若有对象年龄到达老年代的标准,默认年龄是15,或者servivorTo空间不足则放到老年代)

Step2:清空eden servivorFrom

Step3:servivorTo 和 servivorFrom 互换

老年代

主要存放应用程序中周期长的内存对象。

MajorGC触发条件:

A.MinorGC后有新生代的对象晋身入老年代,导致空间不够用。

B.没有足够大的连续空间分配给新创建的较大的对象

MajorGC的过程 标记清除法

首先扫描一次所有老年代,标记出存活的对象,然后回收没有标记的对象,故耗时较长,易产生内存碎片。

永久代

主要存放Class和Meta(元数据),类加载时放入,GC不会对永久区进行清理

Java8后被一称为"元数据区"的区域取代。元空间不在虚拟机中而使用本地内存

 

为对象分配内存空间的两种方式

指针碰撞(Bump the Pointer)

     如果JVM堆内存是规整的,堆内存被指针一分为二,指针左边被塞满了对象,指针右边是未使用的区域。每有一次新的对象创建,指针就会向右移动一个对象size的距离。

空闲列表(Free List)

    如果JVM堆内存并不是规整的,JVM须维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例并更新表上的记录

若创建对象特别频繁?

问题:并发情况下,线程1正在给对象A创建对象,线程2正在给对象B创建对象,指针还未来得及修改指向。

解决方案:

A.对分配内存空间的动作进行同步处理--实际上虚拟机采用CAS配上失败重试的方法保证更新操作的原子性

B.本地线程分配缓冲(Thread Local Allocation Buffer TLAB):线程在初始化时,会申请一块指定大小的内存区域,只给当前线程分配内存,提高分配效率。TLAB只是让每个线程有私有的分配指针,其内存空间是可被其他线程访问的。

 

垃圾回收与算法

《深入理解Java虚拟机》----JVM学习笔记整理_第4张图片

 

如何确定垃圾

引用计数法

    Reference Counting表示对象如果没有任何与之关联的引用,即他们的引用计数都不为0,则说明对象不太可能再被用到,那么这个对象就是可回收对象。(循环引用问题)

可达性分析

    Reachability Analysis表示通过一系列的称为"GC Roots"的对象作为起始点开始搜索,搜索走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可达的。
不可达对象至少要经过两次标记过程才会变为可回收对象。

可作为GC Roots的对象包括:

  • 虚拟机栈(栈帧中的本地变量表)中引用的对象。
  • 方法区中类静态属性引用的对象。
  • 方法区中常量引用的对象。

标记清除算法(Mark-Sweep

两个阶段,标注和清除,缺点是内存碎片化严重

《深入理解Java虚拟机》----JVM学习笔记整理_第5张图片

复制算法(Copying

按内存容量将内存划分为大小相等的两块。每次只使用其中一块,当一块内存满后将尚存活的对象复制到另一块上去,清理原有的。缺点是可用内存变为原来的一半

《深入理解Java虚拟机》----JVM学习笔记整理_第6张图片

标记整理算法(Mark-Compact

标记后不是清理对象,而是将存活对象移向内存的一端,然后清除端边界外的对象

《深入理解Java虚拟机》----JVM学习笔记整理_第7张图片

引用类型

强引用(Strong Reference)

代码中普遍存在的,把一个对象赋给一个引用变量。当一个对象被强引用变量引用时,其永远不可能被GC回收,是造成内存泄露的主要原因。

软引用(Soft Reference)

对于只有软引用的对象来说,发生GC后系统内存足够时不会被回收,发生GC后系统内存空间不足时会被回收。

弱引用(Weak Reference)

对于只有弱引用的对象来说,只要发生GC,不管JVM内存空间是否足够,都会被回收。

虚引用(Phantom Reference)

主要作用是跟踪对象被垃圾回收的状态

 

GC垃圾收集器

《深入理解Java虚拟机》----JVM学习笔记整理_第8张图片

 

Serial垃圾收集器(单线程、复制算法)

工作时需暂停其他工作线程,是JVM运行在client模式下默认的新生代垃圾收集器。

ParNew垃圾收集器(Serial + 多线程)

工作时需暂停其他工作线程,是Serial的多线程版本,是很多JVM运行在server模式下新生代默认的垃圾收集器。

Parallel Scavenge垃圾收集器(多线程复制算法、高效)

其重点关注程序达到一个可控制的吞吐量(CPU运行用户代码时间/运行用户代码时间+垃圾收集时间),拥有自适应调节策略。

Serial Old垃圾收集器(单线程标记整理算法)

是Serial垃圾收集器年老代版本,是JVM运行在client模式下默认的年老代垃圾收集器。

Parallel Old垃圾收集器(多线程标记整理算法)

是Parallel Scavenge垃圾收集器的年老代版本,在年老代提供吞吐量优先。

CMS垃圾收集器(多线程标记清除算法)

Concurrent Mark Sweep主要目标是获取最短垃圾回收停顿时间。

Step1:初始标记

标记GC Roots能直接关联的对象,速度很快,但仍然需要暂停工作线程。

Step2:并发标记

进行GC Roots跟踪的过程,和用户线程一起工作,不需要暂停工作线程。

Step3:重新标记

为修正并发标记期间,因用户程序继续运行而导致标记变动的记录,仍需暂停工作线程。

Step4:并发清除

清除GC Roots不可达对象,不需要暂停工作线程。

由于并发标记和并发清除消耗时间最长且和工作线程一起工作,故总体上看CMS收集器的内存回收是和用户线程一起并发执行。

G1收集器

基于标记整理算法,不产生内存碎片。

避免全区域垃圾收集,其把堆内存划分为大小固定的几个独立区域,优先回收垃圾最多的区域。

 

JVM类加载机制

《深入理解Java虚拟机》----JVM学习笔记整理_第9张图片

加载

加载是类加载过程中的一个阶段,JVM主要完成以下三件事:

1.通过类的全限定名来获取定义此类的二进制字节流(ZIP包、运行时计算生成(动态代理)、其他文件(JSP转化成class文件));

2.将字节流的静态存储结构转化为方法区的运行时数据结构;

3.在内存中生成一个代表这个类的class对象,作为方法区这个类的各种数据的访问入口。

验证

确保Class文件的字节流中包含的信息是否符合当前虚拟机的要求-->安全性

准备

为类变量分配内存并设置类变量的初始值。

: public static int v = 8080; 准备阶段初始值为0;

     public static final int v = 8080; 准备阶段初始值为8080;

解析

虚拟机将常量池中的符号引用替换为直接引用的过程。

符号引用

以一组符号来描述所引用的目标,各种虚拟机实现的内存布局可以各不相同,引用的目标不一定加载到内存中。

直接引用

可以是直接指向目标的指针、相对偏移量或者是一个能间接定位到目标的句柄。直接引用的目标其内存必定在内存中存在。

初始化

初始化阶段是执行类构造器()方法的过程。

  • ()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块中的语句合并而成。
  • ()方法与类的构造函数不同,它不需要显式地调用父类构造器,虚拟机会保证父类与子类clinit方法的调用先后顺序。
  • 如果一个类中没有静态语句块,也没有堆变量的赋值操作,编译器可以不为这个类生成()方法

 

以下几种情况不会执行类初始化:

  1. 通过子类引用父类的静态字段,只会触发父类的初始化,不会触发子类的初始化
  2. 定义对象数组,不会触发该类的初始化
  3. 常量在编译期间会存入调用类的常量池中,本质上并没有直接引用定义常量的类,不会触发定义常量所在类的初始化
  4. 通过类名获取Class对象
  5. 通过Class.forName加载指定类时,如果制定参数initialize为false时 也不会触发类初始化
  6. 通过ClassLoader调用默认的loadClass方法

 

类加载器

启动类加载器(Bootstrap ClassLoader)

负责加载JAVA_HOME\lib目录中,或通过-Xbootclasspath 参数制定路径中的,且被JVM认可的类。

扩展类加载器(Extension Classloader)

负责加载JAVA_HOME\lib\ext目录中的,或通过java.ext.dirs系统变量指定路径中的类库。

应用程序类加载器(Application ClassLoader)

负责加载用户路径(classpath)上的类库

《深入理解Java虚拟机》----JVM学习笔记整理_第10张图片

双亲委派模型

    当一个类收到了类加载请求,他首先不会尝试自己去加载这个类,而是把这个请求委派给父类去完成,只有当父类加载器反馈自己无法完成这个请求的时候(在其加载路径下没有找到所需加载的class),子类加载器才尝试自己去加载。

    双亲委派的一个好处是,加载rt.jar包中的java.lang.Object类,使用不同的加载器最终得到的都是同一个Object。

《深入理解Java虚拟机》----JVM学习笔记整理_第11张图片

你可能感兴趣的:(面试基础知识,JVM)