Java面试八股文-JVM篇

目录

1、JVM的基本结构

2、JVM的类加载过程、机制,每个过程的作用

3、JVM中哪些结构是线程独有和共有的

4、JVM内存模型

5、说说Java里面的GC机制

6、为什么需要垃圾回收呢?

7、垃圾回收算法

8、HotSpot 为什么要分为新生代和老年代?

9、常用的垃圾回收器有哪些?/详细介绍下CMS

10、JVM怎么判断一个对象是否是垃圾对象?/如何判断对象已经死亡?

11、如何判断一个常量是废弃常量?

12、如何判断一个类是无用的类?

13、什么情况下老年代会发生GC?/什么时候会触发Full GC?

14、说一说四种引用类型


1、JVM的基本结构

  • JVM由三个主要的子系统构成:

    • 类加载器子系统

    • 运行时数据区(内存结构)

      • 方法区

      • 虚拟机栈

      • 本地方法栈

      • 程序计数器:记住下一条JVM指令的执行地址

    • 执行引擎

2、JVM的类加载过程、机制,每个过程的作用

  • 系统加载 Class 类型的文件主要有三步:加载->连接->初始化。连接过程又可分为三步:验证->准备->解析

  • 加载:加载指的是将类的class文件读入到内存,并为之创建一个java.lang.Class对象。主要完成下面3 件事情:

    • 通过全类名获取定义此类的二进制字节流

    • 将字节流所代表的静态存储结构转换为方法区的运行时数据结构

    • 在内存中生成一个代表该类的 Class 对象,作为方法区这些数据的访问入口

  • 连接

    • 当类被加载之后,系统为之生成一个对应的Class对象,接着将会进入连接阶段,连接阶段负责把类的二进制数据合并到JRE中。类连接又可分为如下3个阶段。

    • 验证

      • 验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。

      • Java面试八股文-JVM篇_第1张图片

    • 准备

      • 准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中分配。

    • 解析

      • 解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符7 类符号引用进行。

  • 初始化

    • 初始化阶段是执行初始化方法 ()方法的过程,是类加载的最后一步,这一步 JVM 才开始真正执行类中定义的 Java 程序代码(字节码)。

3、JVM中哪些结构是线程独有和共有的

  • 虚拟机栈、本地方法栈、程序计数器是线程独有的

  • 堆、方法区、直接内存是线程共享的

4、JVM内存模型

  • JVM内存结构有程序计数器、虚拟机栈、本地方法栈、堆、方法区

  • 程序计数器

    • 程序计数器是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。主要有两个作用:

      • 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制,如:顺序执行、选择、循环、异常处理。

      • 在多线程的情况下,程序计数器用于记录当前线程执行的位置,从而当线程被切换回来的时候能够知道该线程上次运行到哪里了。

    • 注意:程序计数器是唯一一个不会出现OutOfMemoryError的内存区域,它的生命周期随着线程的创建而创建,随着线程的结束而死亡。

  • 虚拟机栈

    • 与程序计数器一样,Java 虚拟机栈也是线程私有的,它的生命周期和线程相同,随着线程的创建而创建,随着线程的死亡而死亡。

    • 栈是 JVM 运行时数据区域的一个核心,除了一些 Native 方法调用是通过本地方法栈实现的,其他所有的 Java 方法调用都是通过栈来实现的。

    • 方法调用的数据需要通过栈进行传递,每一次方法调用都会有一个对应的栈帧被压入栈中,每一个方法调用结束后,都会有一个栈帧被弹出。

    • 栈由一个个栈帧组成,而每个栈帧中都拥有:局部变量表、操作数栈、动态链接、方法返回地址。和数据结构上的栈类似,两者都是先进后出的数据结构,只支持出栈和入栈两种操作。

    • 程序运行中栈可能会出现两种错误:

      • StackOverFlowError:若栈的内存大小不允许动态扩展,那么当线程请求栈的深度超过当前 Java 虚拟机栈的最大深度的时候,就抛出StackOverFlowError错误。

      • OutOfMemoryError:如果栈的内存大小可以动态扩展,如果虚拟机在动态扩展栈时无法申请到足够的内存空间,则抛出OutOfMemoryError异常。

  • 本地方法栈

    • 和虚拟机栈所发挥的作用非常相似,区别是:虚拟机栈为虚拟机执行 Java 方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。在 HotSpot 虚拟机中和 Java 虚拟机栈合二为一。

    • 本地方法被执行的时候,在本地方法栈也会创建一个栈帧,用于存放该本地方法的局部变量表、操作数栈、动态链接、出口信息。

    • 方法执行完毕后相应的栈帧也会出栈并释放内存空间,也会出现StackOverFlowError和OutOfMemoryError两种错误。

    • Java 虚拟机所管理的内存中最大的一块,Java 堆是所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例以及数组都在这里分配内存。

    • Java 堆是垃圾收集器管理的主要区域,因此也被称作GC 堆(Garbage Collected Heap)。从垃圾回收的角度,由于现在收集器基本都采用分代垃圾收集算法,所以 Java 堆还可以细分为:新生代和老年代;再细致一点有:Eden、Survivor、Old 等空间。进一步划分的目的是更好地回收内存,或者更快地分配内存。

  • 方法区

    • 方法区属于是 JVM 运行时数据区域的一块逻辑区域,是各个线程共享的内存区域。

    • 当虚拟机要使用一个类时,它需要读取并解析 Class 文件获取相关信息,再将信息存入到方法区。方法区会存储已被虚拟机加载的类信息、字段信息、方法信息、常量、静态变量、即时编译器编译后的代码缓存等数据

    • 方法区和永久代以及元空间是什么关系呢?方法区和永久代以及元空间的关系很像 Java 中接口和类的关系,也就是说永久代以及元空间是 HotSpot 虚拟机对虚拟机规范中方法区的两种实现方式。并且,永久代是 JDK 1.8 之前的方法区实现,JDK 1.8 及以后方法区的实现变成了元空间。

    • Class 文件中除了有类的版本、字段、方法、接口等描述信息外,还有用于存放编译期生成的各种字面量和符号引用的常量池表(Constant Pool Table)。常量池表会在类加载后存放到方法区的运行时常量池中。运行时常量池是方法区的一部分,所以受到方法区内存的限制,当常量池无法再申请到内存时会抛出OutOfMemoryError错误。

5、说说Java里面的GC机制

  • Java的GC机制概括来说,该机制对JVM中的内存进行标记,并确定哪些内存需要回收,根据一定的回收策略,自动的回收内存,持续地保证JVM中的内存空间充足,防止出现内存泄露和溢出的问题。总结下来,GC机制一共做了三件事:回收什么、什么时候回收、怎么回收。

6、为什么需要垃圾回收呢?

  • 在Java中,当没有对象引用指向原先分配给某个对象的内存时,该内存便成为垃圾。垃圾回收意味着程序不再需要的对象是"无用信息",这些信息将被丢弃。当一个对象不再被引用的时候,内存将回收它占领的空间,以便空间被后来的新对象使用。垃圾回收能自动释放内存空间,减轻编程的负担,JVM的一个系统级线程会自动释放该内存块。除了释放没用的对象,垃圾回收也可以清除内存记录碎片。

7、垃圾回收算法

  • 标记-清除算法

    • 该算法分为“标记”和“清除”阶段:首先标记出所有不需要回收的对象,在标记完成后统一回收掉所有没有被标记的对象。它是最基础的收集算法。这种垃圾收集算法会带来两个明显的问题:

      • 效率问题:可能无法满足大对象的内存分配,一旦导致无法分配对象,那就会导致jvm启动gc,一旦启动gc,应用程序就会暂停,这就导致应用的响应速度变慢。

      • 空间问题:标记清除后会产生大量不连续的碎片

  • 标记-复制算法

    • “标记-复制”解决了标记-清除算法的效率问题。它可以将内存分为大小相同的两块,每次使用其中的一块。当这一块的内存使用完后,就将还存活的对象复制到另一块去,然后再把使用的空间一次清理掉。这样就使每次的内存回收都是对内存区间的一半进行回收。

  • 标记-整理算法

    • 是根据老年代的特点提出的一种标记算法,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象回收,而是让所有存活的对象向一端移动,然后直接清理掉端边界以外的内存。

  • 分代收集算法

    • 当前虚拟机的垃圾收集都采用分代收集算法,是根据对象存活周期的不同将内存分为几块。一般将 Java 堆分为新生代和老年代,这样我们就可以根据各个年代的特点选择合适的垃圾收集算法。

    • 比如在新生代中,每次收集都会有大量对象死去,所以可以选择”标记-复制“算法,只需要付出少量对象的复制成本就可以完成每次垃圾收集。而老年代的对象存活几率是比较高的,而且没有额外的空间对它进行分配担保,所以我们必须选择“标记-清除”或“标记-整理”算法进行垃圾收集。

8、HotSpot 为什么要分为新生代和老年代?

  • 一般将 Java 堆分为新生代和老年代,这样我们就可以根据各个年代的特点选择合适的垃圾收集算法。

  • 比如在新生代中,每次收集都会有大量对象死去,所以可以选择”标记-复制“算法,只需要付出少量对象的复制成本就可以完成每次垃圾收集。而老年代的对象存活几率是比较高的,而且没有额外的空间对它进行分配担保,所以我们必须选择“标记-清除”或“标记-整理”算法进行垃圾收集。

9、常用的垃圾回收器有哪些?/详细介绍下CMS

  • Serial 收集器

    • Serial(串行)收集器是最基本、历史最悠久的垃圾收集器,是一个单线程收集器。它的“单线程”不仅仅意味着它只会使用一条垃圾收集线程去完成垃圾收集工作,更重要的是它在进行垃圾收集工作的时候必须暂停其他所有的工作线程,直到它收集结束。

    • 新生代采用标记-复制算法,老年代采用标记-整理算法。

  • ParNew 收集器

    • ParNew 收集器其实就是 Serial 收集器的多线程版本,除了使用多线程进行垃圾收集外,其余行为(控制参数、收集算法、回收策略等等)和 Serial 收集器完全一样。

    • 新生代采用标记-复制算法,老年代采用标记-整理算法。

  • Serial Old 收集器

    • Serial 收集器的老年代版本,它同样是一个单线程收集器。它主要有两大用途:一种用途是在 JDK1.5 以及以前的版本中与 Parallel Scavenge 收集器搭配使用,另一种用途是作为 CMS 收集器的后备方案。

  • Parallel Scavenge 收集器

    • Parallel Scavenge 收集器关注点是吞吐量(高效率的利用 CPU),提供了很多参数供用户找到最合适的停顿时间或最大吞吐量, Parallel Scavenge 收集器有自适应调节策略,可以把内存管理优化交给虚拟机去完成。是 JDK1.8 默认收集器。

    • 新生代采用标记-复制算法,老年代采用标记-整理算法。

    • 吞吐量就是 CPU 中用于运行用户代码的时间与 CPU 总消耗时间的比值。

  • Parallel Old 收集器

    • Parallel Scavenge 收集器的老年代版本。使用多线程和“标记-整理”算法。在注重吞吐量以及 CPU 资源的场合,都可以优先考虑 Parallel Scavenge 收集器和 Parallel Old 收集器。

  • CMS 收集器

    • CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。它符合在注重用户体验的应用上使用。

    • CMS收集器是 HotSpot 虚拟机第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程(基本上)同时工作。

    • CMS 收集器是基于“标记-清除”算法实现的。整个过程分为四个步骤:

      • 初始标记:暂停所有的其他线程,并记录下直接与 root 相连的对象,速度很快。

      • 并发标记:同时开启 GC 和用户线程,用一个闭包结构去记录可达对象。但在这个阶段结束,这个闭包结构并不能保证包含当前所有的可达对象。因为用户线程可能会不断的更新引用域,所以 GC 线程无法保证可达性分析的实时性。所以这个算法里会跟踪记录这些发生引用更新的地方。

      • 重新标记:重新标记阶段就是为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段的时间稍长,远远比并发标记阶段时间短。

      • 并发清除:开启用户线程,同时 GC 线程开始对未标记的区域做清扫。

    • 主要优点:并发收集、低停顿。但是它有下面三个明显的缺点:

      • 对 CPU 资源敏感;

      • 无法处理浮动垃圾;

      • 它使用的回收算法-“标记-清除”算法会导致收集结束时会有大量空间碎片产生。

  • G1 收集器

    • G1 (Garbage-First)是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器,以极高概率满足 GC 停顿时间要求的同时,还具备高吞吐量性能特征。

    • 它具备以下特点:

      • 并行与并发:G1 能充分利用 CPU、多核环境下的硬件优势,使用多个 CPU来缩短 Stop-The-World 停顿时间。部分其他收集器原本需要停顿 Java 线程执行的 GC 动作,G1 收集器仍然可以通过并发的方式让 Java 程序继续执行。

      • 分代收集:虽然 G1 可以不需要其他收集器配合就能独立管理整个 GC 堆,但是还是保留了分代的概念。

      • 空间整合:与 CMS 的“标记-清理”算法不同,G1 从整体来看是基于“标记-整理”算法实现的收集器;从局部上来看是基于“标记-复制”算法实现的。

      • 可预测的停顿:这是 G1 相对于 CMS 的另一个大优势,降低停顿时间是 G1 和 CMS 共同的关注点,但 G1 除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为 M 毫秒的时间片段内。

    • G1 收集器的运作大致分为以下几个步骤:

      • 初始标记

      • 并发标记

      • 最终标记

      • 筛选回收

    • G1 收集器在后台维护了一个优先列表,每次根据允许的收集时间,优先选择回收价值最大的 Region。这种使用 Region 划分内存空间以及有优先级的区域回收方式,保证了 G1 收集器在有限时间内可以尽可能高的收集效率(把内存化整为零)。

10、JVM怎么判断一个对象是否是垃圾对象?/如何判断对象已经死亡?

  • 引用计数法

    • 给对象中添加一个引用计数器,每当有一个地方引用它,计数器就加1;当引用失效,计数器就减1;任何时候计数器为0 的对象就是不可能再被使用的。

      这个方法实现简单,效率高,但是它很难解决对象之间相互循环引用的问题。所谓对象之间的相互引用问题,除了对象 objA 和 objB 相互引用着对方之外,这两个对象之间再无任何引用。但是他们因为互相引用对方,导致它们的引用计数器都不为0,于是引用计数算法无法通知 GC 回收器回收他们。

  • 可达性分析算法

    • 这个算法的基本思想就是通过一系列的称为“GC Roots”的对象作为起点,从这些节点开始向下搜索,节点所走过的路径称为引用链,当一个对象到 GC Roots 没有任何引用链相连的话,则证明此对象是不可用的,需要被回收。

    • 可以作为 GC Roots的对象:

      • 虚拟机栈(栈帧中的本地变量表)中引用的对象

      • 本地方法栈(Native 方法)中引用的对象

      • 方法区中类静态属性引用的对象

      • 方法区中常量引用的对象

      • 所有被同步锁持有的对象

11、如何判断一个常量是废弃常量?

  • 假如在字符串常量池中存在字符串"abc",如果当前没有任何 String 对象引用该字符串常量的话,就说明常量"abc"就是废弃常量,如果这时发生内存回收的话而且有必要的话,"abc"就会被系统清理出常量池了。

12、如何判断一个类是无用的类?

  • 类需要同时满足下面3 个条件才能算是“无用的类”

    • 该类所有的实例都已经被回收,也就是 Java 堆中不存在该类的任何实例。

    • 加载该类的ClassLoader已经被回收。

    • 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

13、什么情况下老年代会发生GC?/什么时候会触发Full GC?

  • 调用 System.gc()

    • 只是建议虚拟机执行 Full GC,但是虚拟机不一定真正去执行。不建议使用这种方式,而是让虚拟机管理内存。

  • 未指定老年代和新生代大小,堆伸缩时会产生fullgc,所以一定要配置-Xmx、-Xms

  • 老年代空间不足

    • 老年代空间不足的常见场景比如大对象、大数组直接进入老年代、长期存活的对象进入老年代等。为了避免以上原因引起的 Full GC,应当尽量不要创建过大的对象以及数组。

    • 除此之外,可以通过-Xmn 虚拟机参数调大新生代的大小,让对象尽量在新生代被回收掉,不进入老年代。

    • 还可以通过-XX:MaxTenuringThreshold 调大对象进入老年代的年龄,让对象在新生代多存活一段时间。

    • 在执行Full GC后空间仍然不足,则抛出错误:java.lang.OutOfMemoryError: Java heap space

14、说一说四种引用类型

  • 强引用

    • 我们使用的大部分引用实际上都是强引用,这是使用最普遍的引用。如果一个对象具有强引用,垃圾回收器绝不会回收它。当内存空间不足,Java 虚拟机宁愿抛出 OutOfMemoryError 错误,使程序异常终止,也不会靠随意回收具有强引用的对象来解决内存不足问题。

  • 软引用

    • 如果一个对象只具有软引用,如果内存空间足够,垃圾回收器就不会回收它,如果内存空间不足了,就会回收这些对象的内存。只要垃圾回收器没有回收它,该对象就可以被程序使用。软引用可用来实现内存敏感的高速缓存。

  • 弱引用

    • 弱引用与软引用的区别在于:只具有弱引用的对象拥有更短暂的生命周期。在垃圾回收器线程扫描它所管辖的内存区域的过程中,一旦发现了只具有弱引用的对象,不管当前内存空间足够与否,都会回收它的内存。不过,由于垃圾回收器是一个优先级很低的线程,因此不一定会很快发现那些只具有弱引用的对象。

  • 虚引用

    • 虚引用并不会决定对象的生命周期。如果一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收。虚引用主要用来跟踪对象被垃圾回收的活动

    • 虚引用与软引用和弱引用的一个区别在于:虚引用必须和引用队列(ReferenceQueue)联合使用。当垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象的内存之前,把这个虚引用加入到与之关联的引用队列中。程序可以通过判断引用队列中是否已经加入了虚引用,来了解被引用的对象是否将要被垃圾回收。程序如果发现某个虚引用已经被加入到引用队列,那么就可以在所引用的对象的内存被回收之前采取必要的行动。

    • 特别注意,在程序设计中一般很少使用弱引用与虚引用,使用软引用的情况较多,这是因为软引用可以加速 JVM 对垃圾内存的回收速度,可以维护系统的运行安全,防止内存溢出(OutOfMemory)等问题的产生

你可能感兴趣的:(java,开发语言,面试)