JVM基础扫盲

什么是JVM

JVMJava设计者用于屏蔽多平台差异,基于操作系统之上的一个"小型虚拟机",正是因为JVM的存在,使得Java应用程序运行时不需要关注底层操作系统的差异。使得Java程序编译只需编译一次,在任何操作系统都可以以相同的方式运行。

JVM基础扫盲_第1张图片

JVM运行时区域划分

方法区

这里的方法区指的不是存放Java方法的区域,它主要存放的是元数据信息,例如:类信息、常量、静态变量、以及class文件在类加载时也会数据也会存放到方法区中。

堆区

堆区存储的则是对象实例,数组等。例如我们日常的new 操作就是在堆区分配一个空间存放对象实例。因为堆区是线程共享区域的,所以多线程情况下操作相同对象可能存在线程安全问题。

虚拟机栈和本地方法栈

虚拟机栈

我们日常对象实例的方法调用都是在虚拟机栈上运行的,它是Java方法执行的内存模型,存储着被执行方法的局部变量表、动态链表、方法入口、栈的操作用(入栈和出栈)。

由于虚拟机栈是栈结构所以方法调用按顺序压入栈中,就会倒序弹出虚拟机栈,例如我们的下面这段代码:

public void a(){
b();
}
public void b(){
c();
}

public void c(){
}

当线程调用a方法时,优先为a产生一个栈帧A压入栈中,发现a方法调用了b方法,再为b产生一个栈帧B压入栈中,然后b再调用c方法,再为c产生一个栈帧C方法压入栈中。

JVM基础扫盲_第2张图片

c执行结束,优先弹出栈,然后是b,最后是a。

JVM基础扫盲_第3张图片

由上可以在Java中方法是可以嵌套调用的,但这并不意味方法可以无线层次的嵌套调用,当方法嵌套调用深度超过了虚拟机栈规定的最大深度,就会抛出StackOverflowError,而这个错误也常常发生在我们编写的无终止条件的递归代码中。

虚拟机栈属于线程独享,所以也就没有什么生命周期的概念,每个方法随着调用的结束栈空间也随之释放,所以栈的生命周期也可以理解为和线程生命周期是一致的。

这就使得我们虚拟机栈中的局部变量表可以被复用,例如某个虚拟机栈当前局部变量表被使用的索引为0-n,一旦虚拟栈执行的代码超过n位置,那么n之前的内存空间就可以被再次复用。

JVM基础扫盲_第4张图片

小结一下虚拟栈的特点:

  1. 是方法执行时的内存模型。
  2. 方法调用以栈帧形式压入栈中。
  3. 方法嵌套调用并将栈帧压入栈帧时,深度操作虚拟机栈最大深度会报StackOverflowError
  4. 虚拟机栈的局部变量表随着变量使用的完结,之前的内存区域可被复用。
  5. 栈的生命周期跟随线程,线程调用结束栈即可被销毁。
本地方法栈

下面这个带有native关键字的方法就是在本地方法,它就是本地方法栈管理的方法,其工作机制和特点是虚拟机栈是差不多的,所以这里就不多做介绍了。

private native void start0();

程序计数器

程序计数器和我们操作系统学习的程序计数器概念差不多,记录着当前线程下一条要执行的指令的地址,因为是线程独享的,所以程序计数器也是线程安全的。
需要注意的是程序计数器只有在记录虚拟机栈的方法时才会有值,对于native方法,程序计数器是不工作的。

小结

上文对运行时数据区域做了一个简单的介绍,这里我们就用一张图总结一下JVM运行时区域的结构。

JVM基础扫盲_第5张图片

类加载器

什么是类加载器

类加载器实现将编译后的class文件加载到内存,并转为为运行时区域划分的运行时数据结构,注意类加载器只能决定类加载,至于能不能运行则是由 Execution Engine 来决定。

JVM基础扫盲_第6张图片

类加载器的工作流程

类加载器工作顺序为:加载、验证、准备、解析、初始化、使用、卸载。其中验证、准备、解析这三个步骤统称为连接。

加载
  1. 将编译后class文件加载到内存。
  2. 将静态数据结构转换成方法区中运行时数据结构。
  3. 在堆区创建一个 java.lang.Class对象作为数据访问的入口。
连接
  1. 验证:验证这个class的类的方法是否会做出危害JVM的事情。
  2. 准备:在方法区为静态变量常见空间,并对其进行初始化,例如private static int a=3;,在此阶段就会在方法区完成创建,并初始默认值0。
  3. 解析:虚拟机将常量池内的符号引用转为直接引用,例如import java.util.ArrayList在此阶段就会直接转为指针或者对象地址。
初始化

将方法区中准备好的值,通过调用完成初始化工作。会收集好所有的赋值动作,例如上文的private static int a=3就是这时候完成赋值的。

卸载

当对象使用完成后,GC将无用对象从内存中卸载。

类加载器的加载顺序

其实类加载器并非只有一个,按照分类我们可以将其分为:

BootStrap ClassLoader:rt.jar
Extention ClassLoader: 加载扩展的jar包
App ClassLoader:指定的classpath下面的jar包
Custom ClassLoader:自定义的类加载器

所以,为了保证JDK自带rt.jar的类能够正常加载,就出现了一种名为双亲委派的类加载机制。
举个例子,JDK自带的包中有一个名为String的类,而我们自定义的代码中也有一个String类,我们自己的类肯定是由App ClassLoader完成加载,如果我们的类加载器优先执行,那么JDK自带的String类就无法被使用到。

JVM基础扫盲_第7张图片

所以双亲委派机制就规定了类加载优先由BootStrap ClassLoader先加载,只有根加载器加载不到需要的类,才会交由下层类完成加载。
正是因为双亲委派机制的存在,jdk自带的String类才能够正常的使用,而我们也无法通过自定义String类进行重写。

小结

类加载器的工作流程为:

  1. 加载class文件到方法区并转为运行时数据结构,并在堆区创建一个Class对象作为入口
  2. 验证class的类方法是否由危害JVM的行为
  3. 准备阶段初始化静态变量数据
  4. 解析阶段将符号引用转为可以可直接导向对象地址的直接引用
  5. 初始化阶段通过cinit方法初始化对象实例变量等数据
  6. 使用完成后该类就会被卸载。

用一段代码解释Java文件是如何被运行的

如下所示,我们编写一个Student 类,他有name这个成员属性。

/**
 * 学生类
 */
public class Student {
    private String name;

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }
}

然后我们编写一个main方法,调用student类,完成属性赋值。




public class Main {



    public static void main(String[] args) throws InterruptedException {
        Student student = new Student();
        student.setName("小明");
   

    }

   
}



  1. 首先编译得到Main.class文件后,系统会启动一个JVM进程,从classpath中找到这个class的二进制文件,将在到方法区的运行时数据区域。

JVM基础扫盲_第8张图片

然后发现有个主入口main方法,将main方法压入栈中。

JVM基础扫盲_第9张图片

main方法中需要new Student();,JVM发现方法区中没有Student类的信息,于是开始加载这个类,将这个类的信息存放到方法区,并在堆区创建一个Class对象作为方法区信息的入口。

JVM基础扫盲_第10张图片

new Student();在此时就会根据类元信息获取创建student对象所需要的空间大小,在堆区申请并开辟一个空间调用构造函数创建Student实例。

JVM基础扫盲_第11张图片

main方法调用setNamestudent 的引用找到堆区的Student,通过其引用找到方法区中Student 类的方法表得到方法的字节码地址,从而完成调用。

JVM基础扫盲_第12张图片

上述步骤完成后,方法按照入栈顺序后进先出的弹出,虚拟机栈随着线程一起销毁。

虚拟机堆

区域划分

JVM将堆内存分为年轻代和老年代。以及非堆内存区域,我们称为永久代,这里所说的永久代只有在Java8之前才会出现。在Java8之后因为兼容性原因,永久代的东西都被放置到元空间,元空间所使用的内存都是本地内存,这里的本地内存说的就是我们物理机上的内存,所以理论上物理机内存多大,元空间内存就可以分配多大,元空间大小分配和JVM从物理机上分配的内存大小没有任何关系。

补充元空间两个参数:

	MetaspaceSize:初始化元空间大小,控制发生GC
    MaxMetaspaceSize:限制元空间大小上限,防止占用过多物理内存。

JVM基础扫盲_第13张图片

年轻代

了解整体空间之后,我们再来聊聊年轻代,年轻又可以分为EdenSurvivor区,Survivor区又被平均分为两块。所以年代整体比例为8:1:1。当然这个值也可以通过-XX:+UsePSAdaptiveSurvivorSizePolicy来调整。

任何对象刚刚创建的时候都会放在Eden区。我们都知道堆区内存是共享的,所以Eden区的空间也是多线程共享的,但是为了确保多线程彼此之间相对独立(注意是线程之间彼此独立而不是操作Eden区对象独立),Eden区会专门划出一块连续的空间给每个线程分配一个独立空间,这个空间叫做TLAB空间。每个线程都可以操作自己的TLAB空间和读取其他线程的TLAB空间。

JVM基础扫盲_第14张图片

一旦Eden区满了之后,就会触发第一次Minor GC,就会将存活的对象从Eden区放到Survivor区。

Survivor区就比较特别了,它分为Survivor0和Survivor1区。JVM使用from和to两个指针管理这两块区域,其中from指针指向有对象的区域空间,to指针指向空闲区域的Survivor空间。

JVM基础扫盲_第15张图片

从Eden区中存活下来首先会在Survivor0区(此时from指针在Survivor0),一旦下一次Eden区空间满了之后就再次触发 Minor GC 将Eden区和Survivor0区存活的对象复制到Survivor1区,然后from指针指向Survivor1,结束一次minor GC。

JVM基础扫盲_第16张图片

经过15次之后还活着的对象就会被存放到老年代,这里是15是由-XX:MaxTenuringThreshold指定的, -XX:MaxTenuringThreshold 占4位,默认配置为15
这里补充一下,同样会将Survivor存放到老年代的第2个条件,当Survivor区对象比例达到XX:TargetSurvivorRatio时,也会将存活的对象放到老年区。

老年代

老年代存放的都是经历过无数次GC的老对象,一旦这个空间满了之后就会出现一次Full GCFull GC期间所有线程都会停止手头工作等待Full GC完成,所以在此期间,系统可能会出现卡顿现象。
这就意味着在高并发多对象创建场景的情况下,我们需要合理分配老年区的内存。一旦Full GC后还是无法容纳新对象,就会报OOM问题。

JVM如何判断对象是否需要被销毁

引用计数器法

这种了解就好了,一个对象被引用时+1,被解除引用时-1。我们根据引用计数结果决定是否GC,但是这种方式无法解决两个对象互相引用的情况。例如我们栈区没有一个引用指向当前两个对象,可堆区两个对象却互相引用对方。

JVM基础扫盲_第17张图片

可达性分析法

将一系列的GC ROOTS作为起始的存活对象集,查看是否有任意一个GC ROOTS可以到达这个对象,都不可达就说明这个对象要被回收了。

而以下几种可以作为GC ROOTS:

  1. 虚拟机栈中的局部变量等,被该变量引用的对象不可回收。
  2. 方法区的静态变量,被该变量引用的对象不可回收。
  3. 方法区的常量,被该变量引用的对象不可回收。
  4. 本地方法栈(即native修饰的方法),被该变量引用的对象不可回收。
  5. 未停止且正在使用该对象的线程,被该线程引用的对象不可回收。

JVM基础扫盲_第18张图片

判断对象是否需要真正回收

判断对象是否被回收需要经过两个阶段:

  1. 经过上文介绍的可达性分析法发现不可达的对象后,就将其第一次标记一下,然后判断该对象的是否要执行finalize()方法,若确定则将其存到F-Queue中。
  2. F-Queue中的对象调用finalize(),若此时还是没有任何引用链引用,则说明这个对象要被回收了。

垃圾回收算法(重点)

标记清除法

如下图,这种算法很简单,标记出需要被回收的对象的空间,然后直接清除。同样的缺点也很明显,容易造成内存碎片,内存碎片也很好理解,回收的对象空间都是一小块一小块的,当我们需要创建一个大对象时就没有一块连续大空间供其使用。

JVM基础扫盲_第19张图片

复制算法

这种算法和上文说的survivor一样,将空间一分为二,from存放当前活着的对象,to作为空闲空间。在进行回收时,将没有被标记回收的对象挪到另一个空间,然后from指向另一个空间。这种算法缺点也很明显,可利用空间就一半。

JVM基础扫盲_第20张图片

标记整理

这种算法算是复制算法的改良版,将存活对象全部挪动到一段,确保空闲和对象空间都是连续的,且空间利用率100%。

JVM基础扫盲_第21张图片

分代收集算法(综合算法)

这种算法就是上面算法的组合,即年轻代存活率低,采用复制算法。老年代存活率高,采用标记清除算法或者标记整理算法

JVM常见工具介绍

jinfo(查看配置信息)

查看Java应用程序配置参数或者JVM系统属性,相关命令详情我们可以使用-help或者man命令查看,如下所示:

[root@xxxxxtmp]# jinfo -help
Usage:
    jinfo [option] <pid>
        (to connect to running process)
    jinfo [option] <executable <core>
        (to connect to a core file)
    jinfo [option] [server_id@]<remote server IP or hostname>
        (to connect to remote debug server)

where <option> is one of:
    -flag <name>         to print the value of the named VM flag
    -flag [+|-]<name>    to enable or disable the named VM flag
    -flag <name>=<value> to set the named VM flag to the given value
    -flags               to print VM flags
    -sysprops            to print Java system properties
    <no option>          to print both of the above
    -h | -help           to print this help message

为了演示,笔者在服务器上开启了一个Java应用,我们可以使用jps命令查看其进程id,可以看到笔者服务器中有一个pid19946的Java进程。

[root@iZ8vb7bhe4b8nhhhpavhwpZ tmp]# jps
20104 Jps
19946 jar


查看当前应用所有的配置参数以及系统配置属性命令为jinfo pid如下所示:

[root@xxxxx tmp]# jinfo 19946
Attaching to process ID 19946, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 25.202-b08
Java System Properties:

java.runtime.name = Java(TM) SE Runtime Environment
java.vm.version = 25.202-b08
sun.boot.library.path = /root/jdk8/jre/lib/amd64
java.protocol.handler.pkgs = org.springframework.boot.loader
java.vendor.url = http://java.oracle.com/
java.vm.vendor = Oracle Corporation
path.separator = :
file.encoding.pkg = sun.io
java.vm.name = Java HotSpot(TM) 64-Bit Server VM
sun.os.patch.level = unknown
sun.java.launcher = SUN_STANDARD
user.country = US
user.dir = /tmp


......

如果我们希望查看当前Java应用是否有配置某些信息,可以使用命令jinfo -flag 配置选项 pid,例如我们想查看当前应用是否有开启gc选项,可以使用下面这段命令

可以看到输出结果为-XX:-PrintGC,因为PrintGC前面是减号,这说明该选项并没有开启。

[root@xxx tmp]# jinfo -flag PrintGC 19946
-XX:-PrintGC

如果我们希望将这个选项开启,我们只需在参数前面加个+号即可,例如我们希望开启gc选项,我们只需键入如下命令

[root@xxxxxtmp]# jinfo -flag +PrintGC 19946

再次查看可以发现,选项生效了

[root@xxxx tmp]# jinfo -flag PrintGC 19946
-XX:+PrintGC

有些参数是键值对的形式,例如我们想配置dump日志的路径,我们也可以使用jinfo进行配置,命令格式为jinfo -flag 参数=值 Java进程id

jinfo -flag HeapDumpPath=/tmp/dump.log 19946

打印JVM选项信息

jinfo -flags 4854
Attaching to process ID 4854, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 25.202-b08
Non-default VM flags: -XX:CICompilerCount=2 -XX:HeapDumpPath=null -XX:InitialHeapSize=33554432 -XX:MaxHeapSize=511705088 -XX:MaxNewSize=170524672 -XX:MinHeapDeltaBytes=196608 -XX:NewSize=11141120 -XX:OldSize=22413312 -XX:+PrintGC -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseFastUnorderedTimeStamps
Command line:

查看应用属性,命令格式jinfo -sysprops Java进程id

jinfo -sysprops 2341

jmap(查看堆区信息、对象信息等)

jmap作用:

  1. 查看使用的GC算法,堆的配置信息以及各个内存区域的内存使用情况
  2. 显示堆对象的统计信息,包括每一个Java类、对象数量、内存大小、类名称等
  3. 打印等会回收的对象的信息
  4. 生成dump文件,配合jhat使用

查看堆内存使用情况 jmap -heap Java进程id

[root@iZ8vb7bhe4b8nhhhpavhwpZ tmp]# jmap -heap 25534
Attaching to process ID 25534, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 25.202-b08

using thread-local object allocation.
Mark Sweep Compact GC

Heap Configuration:
   MinHeapFreeRatio         = 40
   MaxHeapFreeRatio         = 70
   MaxHeapSize              = 511705088 (488.0MB)
   NewSize                  = 11141120 (10.625MB)
   MaxNewSize               = 170524672 (162.625MB)
   OldSize                  = 22413312 (21.375MB)
   NewRatio                 = 2
   SurvivorRatio            = 8
   MetaspaceSize            = 21807104 (20.796875MB)
   CompressedClassSpaceSize = 1073741824 (1024.0MB)
   MaxMetaspaceSize         = 17592186044415 MB
   G1HeapRegionSize         = 0 (0.0MB)

查看存活的Java对象(文档说明:to print histogram of java object heap; if the “live” suboption is specified, only count live objects),命令格式: jmap -histo:live Java进程id

[root@xxxtmp]# jmap -histo:live 25534

 num     #instances         #bytes  class name
----------------------------------------------
   1:         48676        7974952  [C
   2:          7762        1873312  [I
   3:         47785        1146840  java.lang.String
   4:         12737        1120856  java.lang.reflect.Method
   5:          8773         968912  java.lang.Class
   6:         25572         818304  java.util.concurrent.ConcurrentHashMap$Node
   7:         14108         564320  java.util.LinkedHashMap$Entry
   8:          2712         509536  [B
   9:          9308         494936  [Ljava.lang.Object;
  10:          6345         493128  [Ljava.util.HashMap$Node;
  11:          7001         392056  java.util.LinkedHashMap
  12:         11255         360160  java.util.HashMap$Node
  13:         15946         354528  [Ljava.lang.Class;
  14:         18176         290816  java.lang.Object
  15:          3447         248184  java.lang.reflect.Field
  16:           124         192320  [Ljava.util.concurrent.ConcurrentHashMap$Node;
  1. 打印正在被回收的类**(文档说明:to print information on objects awaiting finalization)**,命令格式:jmap -finalizerinfo Java进程id
[root@xxxtmp]# jmap -finalizerinfo 25534
Attaching to process ID 25534, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 25.202-b08
Number of objects pending for finalization: 0

将存活的对象的信息存到二进制文件中

 jmap -dump:live,format=b,file=/tmp/heap.bin 25534
Dumping heap to /tmp/heap.bin ...
Heap dump file created

此时就可以使用jhat打开该文件,如下所示jhat 文件名,这时候我们就可以通过7000端口查看详情了。

[root@xxxtmp]# jhat heap.bin
Reading from heap.bin...
Dump file created Wed Nov 02 20:21:18 CST 2022
Snapshot read, resolving...
Resolving 346825 objects...
Chasing references, expect 69 dots.....................................................................
Eliminating duplicate references.....................................................................
Snapshot resolved.
Started HTTP server on port 7000
Server is ready.

jstat(常用,监控运行时状态信息)

jstat用于监控虚拟机各种运行状态信息,显示虚拟机进程中装在、内存、垃圾收集、JIT编译等运行数据。

查看类加载信息,命令格式jstat -class Java进程id

[root@iZ8vb7bhe4b8nhhhpavhwpZ tmp]# jstat -class 2341
Loaded  Bytes  Unloaded  Bytes     Time
  8221 14604.3        1     0.9      12.74
[root@iZ8vb7bhe4b8nhhhpavhwpZ tmp]#

查看编译统计信息jstat -compiler Java进程id


[root@xxxtmp]# jstat -compiler 2341
Compiled Failed Invalid   Time   FailedType FailedMethod
    4177      0       0    17.68          0
[root@iZ8vb7bhe4b8nhhhpavhwpZ tmp]#

查看gc统计信息

[root@iZ8vb7bhe4b8nhhhpavhwpZ tmp]# jstat -gc 2341
 S0C    S1C    S0U    S1U      EC       EU        OC         OU       MC     MU    CCSC   CCSU   YGC     YGCT    FGC    FGCT     GCT
1408.0 1408.0  0.0   1020.3 11840.0   7493.1   29268.0    22168.5   42840.0 40613.5 5760.0 5311.9     65    0.401   2      0.213    0.613
[root@iZ8vb7bhe4b8nhhhpavhwpZ tmp]#

每个表头的含义如下

1. S0C :年轻代中第一个survivor(幸存区)的容量 (字节)
2. S1C :年轻代中第二个survivor(幸存区)的容量 (字节)
3. S0U:年轻代中第一个survivor(幸存区)目前已使用空间 (字节)
4. S1U:年轻代中第二个survivor(幸存区)目前已使用空间 (字节)
5. EC:年轻代中Eden(伊甸园)的容量 (字节)
6. EU:年轻代中Eden(伊甸园)目前已使用空间 (字节)
7. OC:Old代的容量 (字节)
8. OU:Old代目前已使用空间 (字节)
9. PC:Perm(持久代)的容量 (字节)
10. PU:Perm(持久代)目前已使用空间 (字节)
11. YGC:从应用程序启动到采样时年轻代中gc次数
12. YGCT:从应用程序启动到采样时年轻代中gc所用时间(s)
13. FGC:从应用程序启动到采样时old代(全gc)gc次数
14. FGCT:从应用程序启动到采样时old代(全gc)gc所用时间(s)
15. GCT:从应用程序启动到采样时gc用的总时间(s)

查看gc内存容量和元空间容量

[root@xxxtmp]# jstat -gccapacity 2341
 NGCMN    NGCMX     NGC     S0C   S1C       EC      OGCMN      OGCMX       OGC         OC       MCMN     MCMX      MC     CCSMN    CCSMX     CCSC    YGC    FGC
 10880.0 166528.0  14656.0 1408.0 1408.0  11840.0    21888.0   333184.0    29268.0    29268.0      0.0 1087488.0  42840.0      0.0 1048576.0   5760.0     65     2

查看年轻代统计信息

[root@xxxxtmp]# jstat -gcnew 2341
 S0C    S1C    S0U    S1U   TT MTT  DSS      EC       EU     YGC     YGCT
1408.0 1408.0    0.0 1020.3  2  15  704.0  11840.0   7652.5     65    0.401
[root@iZ8vb7bhe4b8nhhhpavhwpZ tmp]#

参数详情

1. S0C:年轻代中第一个survivor(幸存区)的容量 (字节)
2. S1C:年轻代中第二个survivor(幸存区)的容量 (字节)
3. S0U:年轻代中第一个survivor(幸存区)目前已使用空间 (字节)
4. S1U:年轻代中第二个survivor(幸存区)目前已使用空间 (字节)
5. TT:持有次数限制
6. MTT:最大持有次数限制
7. EC:年轻代中Eden(伊甸园)的容量 (字节)
8. EU:年轻代中Eden(伊甸园)目前已使用空间 (字节)
9. YGC:从应用程序启动到采样时年轻代中gc次数
10. YGCT:从应用程序启动到采样时年轻代中gc所用时间(s)

补充

Minor GC、Major GC 和 Full GC 之间的区别

Minor GC,MajorGC、Full GC

minor gc 会发生stop the world 现象吗? - 红色的红的回答 - 知乎
https://www.zhihu.com/question/29114369/answer/2287094858

参考文献

大白话带你认识JVM

Java 性能调优实战

MaxTenuringThreshold 和 TargetSurvivorRatio参数说明

Java 堆内存是线程共享的!面试官:你确定吗?

Java8中的JVM元空间是不是方法区?

JVM中新生代为什么要有两个Survivor

jstat命令详解

JVM基础(三)一个对象的创建过程

你可能感兴趣的:(1024程序员节,Java,jvm)