狂神说JVM笔记

面试题:https://thinkwon.blog.csdn.net/article/details/104390752

文章目录

    • 1.JVM的位置
    • 2.JVM的体系结构
    • 3.类加载器
    • 4.Java历史-沙箱安全机制(了解)
    • 5.Native
    • 6.PC程序计数器(了解)
    • 7.方法区(Method Area)
    • 8.栈
    • 9.堆(重点)
    • 10.使用`JPofiler`工具分析`OOM`原因
    • 11.常见JVM调优参数
    • 12.常见垃圾回收算法
      • 1.引用计数算法
      • 2.复制算法
      • 3.标记-清除算法
      • 4.标记-压缩算法
    • 13.分代回收策略
    • 14.垃圾收集器
      • 1.串行收集器(Serial)
      • 2.并行收集器(ParNew)
      • 3.Parallel Scavenge 收集器
      • 4.Serial Old 收集器
      • 5.Parallel Old 收集器
      • 6.CMS 收集器(Concurrent Mark Sweep)
      • 7.G1 收集器
    • 15.JMM

1.JVM的位置

狂神说JVM笔记_第1张图片
程序通过java XX.class运行,这个命令是JRE的命令,JRE中包括JVM,而JRE是建立在操作系统上使用的,操作系统又是基于硬件为基础的。

2.JVM的体系结构

简化图:
狂神说JVM笔记_第2张图片

原图连接:https://www.processon.com/diagraming/606cfaaae401fd130055b020
狂神说JVM笔记_第3张图片

3.类加载器

狂神说JVM笔记_第4张图片
类加载器作用:加载.class文件

类加载流程(三个阶段)
1.加载阶段

  • 将编译好的class文件加载到内存中(方法区),然后会生成一个代表这个类的Class对象。

2.链接阶段

  • 会为静态变量分配内存并设置默认值。

3.初始化阶段

  • 执行类构造器()进行初始化赋值。

java自带的类加载器:

  • 启动类加载器(Bootstrap ClassLoader):又名根类加载器或引导类加载器,负责加载%JAVA_HOME%\bin目录下的所有jar包,或者是-Xbootclasspath参数指定的路径,例:rt.jar

  • 拓展类加载器(Extension ClassLoader):负责加载%JAVA_HOME%\bin\ext目录下的所有jar包,或者是java.ext.dirs参数指定的路径

  • 系统类加载器(Application ClassLoader):又名应用类加载器,负责加载用户类路径上所指定的类库,如果应用程序中没有自定义加载器,那么次加载器就为默认加载器

双亲委派机制
狂神说JVM笔记_第5张图片

//类加载器收到加载请求
//1.不会自己先去加载,把请求委托给父类加载器,如果父类加载器还存在其父类加载器,则进一步向上委托,最终将到达顶层的启动类加载器
//2.如果父类可以完成加载任务,就成功返回
//3.如果完不成,子加载器才会尝试自己去加载

优点:避免重复加载 + 避免核心类篡改

4.Java历史-沙箱安全机制(了解)

Java安全模型的核心就是Java沙箱(sandbox) ,  什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。  沙箱主要限制系统资源访问,那系统资源包括什么? CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。  所有的Java程序运行都可以指定沙箱,可以定制安全策略。  在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱Sandbox)机制。
狂神说JVM笔记_第6张图片
组成沙箱的基本组件:

1.字节码校验器(bytecode verifier) :确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。

2.类裝载器(class loader) :其中类装载器在3个方面对Java沙箱起作用

  • 它防止恶意代码去干涉善意的代码;

  • 它守护了被信任的类库边界;

  • 它将代码归入保护域,确定了代码可以进行哪些操作。

5.Native

程序中使用:private native void start0();

1.凡是带了native关键字的,说明java的作用范围达不到了,回去调用底层c语言的库!
2.会进入本地方法栈,然后去调用本地方法接口将native方法引入执行

本地方法栈(Native Method Stack)

内存区域中专门开辟了一块标记区域: Native Method Stack,负责登记native方法,在执行引擎( Execution Engine )执行的时候通过本地方法接口(JNI)加载本地方法库中的方法

本地方法接口(JNI)

本地接口的作用是融合不同的编程语言为Java所用,它的初衷是融合C/C++程序, Java在诞生的时候是C/C++横行的时候,想要立足,必须有调用C、C++的程序,然后在内存区域中专门开辟了一块标记区域: Native Method Stack,负责登记native方法,在执行引擎( Execution Engine )执行的时候通过本地方法接口(JNI)加载本地方法库中的方法

6.PC程序计数器(了解)

程序计数器: Program Counter Register

每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向像一条指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略不计

为什么需要程序计数器?记录要执行的代码位置,防止线程切换重新执行
字节码执行引擎修改程序计数器的值

7.方法区(Method Area)

方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间。

静态变量(static)、常量(final)、类信息(构造方法、接口定义)(Class)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关

8.栈

栈:后进先出,每个线程都有自己的栈,栈内存主管程序的运行,生命周期和线程同步,线程结束,栈内存也就是释放。

对于栈来说,不存在垃圾回收问题,一旦线程结束,栈就结束.

栈内存中运行:8大基本类型+对象引用+实例的方法.

栈运行原理:栈桢

栈满了:StackOverflowError

队列:先进先出(FIFO:First Input First Output)

狂神说JVM笔记_第7张图片
栈细分为4部分:
狂神说JVM笔记_第8张图片

例:int a=7;

局部变量表:存放局部变量(a)
操作数栈:存放操作数(7)
动态链接:将符号引用转成直接引用(符号引用就是你知道调用了谁,直接引用就是你拿到可要调用的方法的地址)
方法出口:方法结束

javap -c xxx.class 反汇编

9.堆(重点)

一个JVM只有一个堆内存,堆内存的大小是可以调节的,类加载器读取类文件后,一般会把类,方法,常量,变量,我们所有引用类型的真实对象,放入堆中。

堆内存细分为三个区域:

  • 新生区(伊甸园区):Young/New

  • 养老区old

  • 永久区Perm
    狂神说JVM笔记_第9张图片

新生区:类的诞生,成长和死亡的地方
分为:

  • 伊甸园区:所有对象都在伊甸园区new出来
  • 幸存0区和幸存1区:轻GC之后存下来的

老年区(养老区):多次轻GC存活下来的对象放在老年区

真理:经过研究,99%的对象都是临时对象!

永久区
狂神说JVM笔记_第10张图片
注意:

元空间:逻辑上存在,物理上不存在 ,因为:存储在本地磁盘内,不占用虚拟机内存

狂神说JVM笔记_第11张图片
默认情况下,JVM使用的最大内存为电脑总内存的四分之一,JVM使用的初始化内存为电脑总内存的六十四分之一.

总结:

  • 栈:基本类型的变量,对象的引用变量,实例对象的方法
  • 堆:存放由new创建的对象和数组
  • 方法区:Class对象,static变量,常量池(常量)

10.使用JPofiler工具分析OOM原因

常用调优工具:jvisualVM Arthas(阿里的,常用!!!)

测试:OutOfMemoryError

public class Test2 {
    static String a="111111111111";

    public static void main(String[] args) {
        while (true){
            a=a+ new Random().nextInt(99999999)+new Random().nextInt(99999999);
        }
    }
}

下载地址:https://www.ej-technologies.com/download/jprofiler/version_92

安装完成后,需要在IDEA中安装插件。

添加参数运行程序:
-Xms1m -Xmx1m -XX:+HeapDumpOnOutOfMemoryError:当出现OOM错误,会生成一个dump文件(进程的内存镜像)
狂神说JVM笔记_第12张图片
在项目目录下找到dump文件,双击打开
狂神说JVM笔记_第13张图片
可以看到什么占用了大量的内存
狂神说JVM笔记_第14张图片
这里可以看到哪一行代码出现问题

11.常见JVM调优参数

配置参数 功能
-Xms 初始堆大小。如:-Xms256m
-Xmx 最大堆大小。如:-Xmx512m
-Xmn 新生代大小。通常为 Xmx 的 1/3 或 1/4。新生代 = Eden + 2 个 Survivor 空间。实际可用空间为 = Eden + 1 个 Survivor,即 90%
-XX:NewRatio 新生代与老年代的比例,如 –XX:NewRatio=2,则新生代占整个堆空间的1/3,老年代占2/3
-XX:SurvivorRatio 新生代中 Eden 与 Survivor 的比值。默认值为 8。即 Eden 占新生代空间的 8/10,另外两个 Survivor 各占 1/10
-XX:+PrintGCDetails 打印 GC 信息
-XX:+HeapDumpOnOutOfMemoryError 让虚拟机在发生内存溢出时 Dump 出当前的内存堆转储快照,以便分析用

12.常见垃圾回收算法

1.引用计数算法

原理是此对象有一个引用,即增加一个计数,删除一个引用则减少一个计数。垃圾回收时,只用收集计数为 0 的对象。此算法最致命的是无法处理循环引用的问题。

2.复制算法

此算法把内存空间划为两个相等的区域,每次只使用其中一个区域。垃圾回收时,遍历当前使用区域,把正在使用中的对象复制到另外一个区域中。此算法每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去以后还能进行相应的内存整理。

优点:不会出现碎片化问题
缺点:需要两倍内存空间,浪费
狂神说JVM笔记_第15张图片

3.标记-清除算法

此算法执行分两阶段。第一阶段从引用根节点开始标记可回收对象,第二阶段遍历整个堆,把未标记的对象清除。

优点:不会浪费内存空间
缺点:此算法需要暂停整个应用,同时,会产生内存碎片
狂神说JVM笔记_第16张图片

4.标记-压缩算法

此算法结合了“标记-清除”和“复制”两个算法的优点。也是分两阶段,第一阶段从根节点开始标记所有可回收对象,第二阶段遍历整个堆,清除未标记对象并且把存活对象“压缩”到堆的其中一块,按顺序排放。
此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问题。
狂神说JVM笔记_第17张图片

13.分代回收策略

狂神说JVM笔记_第18张图片

1.绝大多数刚刚被创建的对象会存放在Eden区
2.当Eden区第一次满的时候,会触发MinorGC(轻GC)。首先将Eden区的垃圾对象回收清除,并将存活的对象复制到S0,此时S1是空的。
3.下一次Eden区满时,再执行一次垃圾回收,此次会将Eden和S0区中所有垃圾对象清除,并将存活对象复制到S1,此时S0变为空。
4.如此反复在S0和S1之间切换几次(默认15次)之后,还存活的对象将他们转移到老年代中。
5.当老年代满了时会触发FullGC(全GC)

MinorGC

  • 使用的算法是复制算法
  • 年轻代堆空间紧张时会被触发
  • 相对于全收集而言,收集间隔较短

FullGC

  • 使用的算法一般是标记压缩算法
  • 当老年代堆空间满了,会触发全收集操作
  • 可以使用 System.gc()方法来显式的启动全收集
  • 全收集非常耗时

14.垃圾收集器

垃圾回收器的常规匹配:
狂神说JVM笔记_第19张图片

1.串行收集器(Serial)

Serial 收集器是 Hotspot 运行在 Client 模式下的默认新生代收集器, 它的特点是:单线程收集, 但它却简单而高效
狂神说JVM笔记_第20张图片

2.并行收集器(ParNew)

ParNew 收集器其实是前面 Serial 的多线程版本
狂神说JVM笔记_第21张图片

3.Parallel Scavenge 收集器

与 ParNew 类似, Parallel Scavenge 也是使用复制算法, 也是并行多线程收集器. 但与其
他收集器关注尽可能缩短垃圾收集时间不同, Parallel Scavenge 更关注系统吞吐量:
系统吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)

4.Serial Old 收集器

Serial Old 是 Serial 收集器的老年代版本, 同样是单线程收集器,使用“标记-整理”算法

5.Parallel Old 收集器

Parallel Old 是 Parallel Scavenge 收集器的老年代版本, 使用多线程和“标记-整理”算
法, 吞吐量优先

6.CMS 收集器(Concurrent Mark Sweep)

CMS是一种以获取最短回收停顿时间为目标的收集器(CMS又称多并发低暂停的收集器),
基于”标记-清除”算法实现, 整个 GC 过程分为以下 4 个步骤:

  1. 初始标记(CMS initial mark)
  2. 并发标记(CMS concurrent mark: GC Roots Tracing 过程)
  3. 重新标记(CMS remark)
  4. 并发清除(CMS concurrent sweep: 已死对象将会就地释放, 注意:此处没有压缩)

7.G1 收集器

G1将堆内存“化整为零”,将堆内存划分成多个大小相等独立区域(Region),每一个Region都可以根据需要,扮演新生代的Eden空间、Survivor空间,或者老年代空间。收集器能够对扮演不同角色的Region采用不同的策略去处理,这样无论是新创建的对象还是已经存活了一段时间、熬过多次收集的旧对象都能获取很好的收集效果。

为什么要垃圾回收时要设计STW(stop the world)?

如果不设计STW,可能在垃圾回收时用户线程就执行完了,堆中的对象都失去了引用,全部变成了垃圾,索性就设计了STW,快速做完垃圾回收,再恢复用户线程运行。

15.JMM

JMM(java内存模型)Java Memory Model,本身是一个抽象的概念,不是真实存在的,它描述的是一组规则或规范,通过这组规范定义了程序中各个变量(包括实例字段、静态字段和构成数组对象的元素)的访问方式。

狂神说JVM笔记_第22张图片
JMM定义了线程和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory),本地内存中存储了该线程读/写共享变量的副本。

JMM内存模型三大特性

1、原子性

  • 使用 synchronized 互斥锁来保证操作的原子性

2、可见性:

  • volatile,会强制将该变量自己和当时其他变量的状态都刷出缓存。
  • synchronized,对一个变量执行 unlock 操作之前,必须把变量值同步回主内存。
  • final,被 final 关键字修饰的字段在构造器中一旦初始化完成,并且没有发生 this 逃逸(其它线程通过 this 引用访问到初始化了一半的对象),那么其它线程就能看见 final 字段的值。

3、有序性

  • 源代码 -> 编译器优化的重排 -> 指令并行的重排 -> 内存系统的重排 ->最终执行的命令

  • 重排序过程不会影响到单线程程序的执行,却会影响到多线程并发执行的正确性

处理器在进行重排时必须考虑数据的依赖性,多线程环境线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的。

你可能感兴趣的:(jvm,jvm,java)