市面上各类 JVM 相关的资料虽多,但是明显存在两个极端:过于生涩难懂,或者流于某个技巧点而不系统化。同时各大公司也都越来越重视推动和发展 JVM 相关技术,一线大厂技术面试现在 JVM 知识也是必考科目。
在这个背景下,我全面梳理了系统化学习 JVM 的知识和经验,包括 JVM 的技术和内存模型,JVM 参数和内置工具,GC 算法,GC 日志、内存和线程等相关问题排查分析,以及常见的面试问题深度剖析等高级的进阶方法与实战,既满足大家快速系统化学习和全面掌握知识的需求,又兼顾大家的面试经验辅导, 需要的可以关注公众号:有故事的程序员领取哦~
JVM面试题
1. 内存模型以及分区,需要详细到每个区放什么。
2. 堆里面的分区:Eden,survival (from+ to),老年代,各自的特点。
3. 对象创建方法,对象的内存分配,对象的访问定位。
4. GC 的两种判定方法:
5. SafePoint 是什么
6. GC 的三种收集方法:标记清除、标记整理、复制算法的原理与特点,分别用在什么地方,如果让你优化收集方法,有什么思路?
7. GC 收集器有哪些?CMS 收集器与 G1 收集器的特点。
8. Minor GC 与 Full GC 分别在什么时候发生?
9. 几种常用的内存调试工具:jmap、jstack、jconsole、jhat
10. 类加载的几个过程:
11. JVM 内存分哪几个区,每个区的作用是什么?
12. 如和判断一个对象是否存活?(或者 GC 对象的判定方法)
13. 简述 java 垃圾回收机制?
14. java 中垃圾收集的方法有哪些?
15. java 内存模型
16. java 类加载过程?
17. 简述 java 类加载机制?
18. 类加载器双亲委派模型机制?
19. 什么是类加载器,类加载器有哪些?
20. 简述 java 内存分配与回收策率以及 Minor GC 和Major GC
21.怎么获取 Java 程序使用的内存?堆使用的百分比?
22.Java 中堆和栈有什么区别?
23.描述一下 JVM 加载 Class 文件的原理机制?
24. 什么是tomcat类加载机制?
25.Java 堆的结构是什么样子的?
26. 什么是GC调优?
27. 简述各个版本内存区域的变化?
28. Java 中会存在内存泄漏吗,简述一下?
29. 垃圾回收的优点和原理,并考虑 2 种回收机制?基本原理是什么?
30. 什么是分布式垃圾回收(DGC)?它是如何工作的?
31. 讲讲你理解的性能评价及测试指标?
32. 常用的性能优化方式有哪些?
32. 说说分布式缓存和一致性哈希?
JVM知识点
JVM
(1) 基本概念:
JVM是可运行Java代码的假想计算机,包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收,堆和一个存储方法域。JVM是运行在操作系统之上的,它与硬件没有直接的交互。
(2) 运行过程:
我们都知道Java源文件,通过编译器,能够生产相应的.Class文件,也就是字节码文件,而字节码文件又通过Java虚拟机中的解释器,编译成特定机器上的机器码。也就是如下:①Java源文件—->编译器—->字节码文件②字节码文件—->JVM—->机器码每一种平台的解释器是不同的,但是实现的虚拟机是相同的,这也就是Java为什么能够跨平台的原因了,当一个程序从开始运行,这时虚拟机就开始实例化了,多个程序启动就会存在多个虚拟机实例。程序退出或者关闭,则虚拟机实例消亡,多个虚拟机实例之间数据不能共享。
2.线程
这里所说的线程指程序执行过程中的一个线程实体。JVM 允许一个应用并发执行多个线程。Hotspot JVM 中的Java 线程与原生操作系统线程有直接的映射关系。当线程本地存储、缓冲区分配、同步对象、栈、程序计数器等准备好以后,就会创建一个操作系统原生线程。Java 线程结束,原生线程随之被回收。操作系统负责调度所有线程,并把它们分配到任何可用的CPU 上。当原生线程初始化完毕,就会调用Java 线程的run() 方法。当线程结束时,会释放原生线程和Java 线程的所有资源。
HotspotJVM 后台运行的系统线程主要有下面几个:
虚拟机线程(VM thread):这个线程等待JVM 到达安全点操作出现。这些操作必须要在独立的线程里执行,因为当堆修改无法进行时,线程都需要JVM 位于安全点。这些操作的类型有:stop-the-world 垃圾回收、线程栈dump、线程暂停、线程偏向锁(biased locking)解除。
周期性任务线程:这线程负责定时器事件(也就是中断),用来调度周期性操作的执行。
GC 线程:这些线程支持JVM 中不同的垃圾回收活动。
编译器线程:这些线程在运行时将字节码动态编译成本地平台相关的机器码。
信号分发线程:这个线程接收发送到JVM 的信号并调用适当的JVM 方法处理
3.JVM内存区域
JVM内存区域主要分为线程私有区域【程序计数器、虚拟机栈、本地方法区】、线程共享区域【JAVA堆、方法区】、直接内存。线程私有数据区域生命周期与线程相同,
依赖用户线程的启动/结束而创建/销毁(在HotspotVM内,每个线程都与操作系统的本地线程直接映射,因此这部分内存区域的存/否跟随本地线程的生/死对应)。
线程共享区域随虚拟机的启动/关闭而创建/销毁。
直接内存并不是JVM运行时数据区的一部分,但也会被频繁的使用:在JDK 1.4引入的NIO提供了基于Channel与Buffer的IO方式,它可以使用Native函数库直接分配堆外内存,然后使用DirectByteBuffer对象作为这块内存的引用进行操作(详见:Java I/O扩展),这样就避免了在Java堆和Native堆中来回复制数据,因此在一些场景中可以显著提高性能。
3.程序计数器(线程私有)
一块较小的内存空间,是当前线程所执行的字节码的行号指示器,每条线程都要有一个独立的程序计数器,这类内存也称为“线程私有”的内存。正在执行java方法的话,计数器记录的是虚拟机字节码指令的地址(当前指令的地址)。如果还是Native方法,则为空。这个内存区域是唯一一个在虚拟机中没有规定任何OutOfMemoryError情况的区域。
4虚拟机栈(线程私有)
是描述java方法执行的内存模型,每个法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
栈帧(Frame)是用来存储数据和部分过程结果的数据结构,同时也被用来处理动态链接(Dynamic Linking)、方法返回值和异常分派(Dispatch Exception)。栈帧随着方法调用而创建,随着方法结束而销毁——无论方法是正常完成还是异常完成(抛出了在方法内未被捕获的异常)都算作方法结束。
5.本地方法区(线程私有)
本地方法区和Java Stack作用类似,区别是虚拟机栈为执行Java方法服务,而本地方法栈则为Native方法服务,如果一个VM实现使用C-linkage模型来支持Native调用,那么该栈将会是一个C栈,但HotSpot VM直接就把本地方法栈和虚拟机栈合二为一。
6.堆(Heap-线程共享)-运行时数据区
是被线程共享的一块内存区域,创建的对象和数组都保存在Java堆内存中,也是垃圾收集器进行垃圾收集的最重要的内存区域。由于现代VM采用分代收集算法,因此Java堆从GC的角度还可以细分为:新生代(Eden 区、From Survivor 区和To Survivor 区)和老年代。
7.方法区l永久代(线程共享)
即我们常说的永久代(Permanent Generation),用于存储被JVM加载的类信息、常量、静态变量、即时编译器编译后的代码等数据. HotSpot VM把GC分代收集扩展至方法区,即使用Java堆的永久代来实现方法区,这样HotSpot的垃圾收集器就可以像管理Java堆一样管理这部分内存,而不必为方法区开发专门的内存管理器(永久带的内存回收的主要目标是针对常量池的回收和类型的卸载,因此收益一般很小)。
运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述等信息外,还有一项信息是常量池
(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。Java 虚拟机对Class文件的每一部分(自然也包括常量池)的格式都有严格的规定,每一个字节用于存储哪种数据都必须符合规范上的要求,这样才会被虚拟机认可、装载和执行。
8.JVM运行时内存
Java堆从GC的角度还可以细分为:新生代(Eden区、From Survivor区和To Survivor区)和老年代。
2.3.1.新生代
是用来存放新生的对象。一般占据堆的1/3空间。由于频繁创建对象,所以新生代会频繁触发MinorGC进行垃圾回收。新生代又分为Eden区、ServivorFrom、ServivorTo三个区。
1.Eden区Java新对象的出生地(如果新创建的对象占用内存很大,则直接分配到老年代)。当Eden区内存不够的时候就会触发MinorGC,对新生代区进行一次垃圾回收。
2.ServivorFrom上一次GC的幸存者,作为这一次GC的被扫描者。
3.ServivorTo保留了一次MinorGC过程中的幸存者。
4.MinorGC的过程(复制->清空->互换)MinorGC采用复制算法。
1: eden、servicorFrom复制到ServicorTo,年龄+1
首先,把Eden和ServivorFrom区域中存活的对象复制到ServicorTo区域(如果有对象的年龄以及达到了老年的标准,则赋值到老年代区),同时把这些对象的年龄+1(如果ServicorTo不够位置了就放到老年区);
2:清空eden、servicorFrom
然后,清空Eden和ServicorFrom 中的对象;
3: ServicorTo和 ServicorFrom互换
最后,ServicorTo和ServicorFrom互换,原ServicorTo成为下一次GC时的ServicorFrom区。
9.老年代
主要存放应用程序中生命周期长的内存对象。
老年代的对象比较稳定,所以MajorGC 不会频繁执行。在进行MajorGC前一般都先进行了一次 MinorGC,使得有新生代的对象晋身入老年代,导致空间不够用时才触发。当无法找到足够大的连续空间分配给新创建的较大对象时也会提前触发一次MajorGC进行垃圾回收腾出空间。
MajorGC采用标记清除算法:首先扫描一次所有老年代,标记出存活的对象,然后回收没有标记的对象。MajorGC的耗时比较长,因为要扫描再回收。MajorGC 会产生内存碎片,为了减少内存损耗,我们一般需要进行合并或者标记出来方便下次直接分配。当老年代也满了装不下的时候,就会抛出OOM (Out of Memory)异常。
10.永久代
指内存的永久保存区域,主要存放Class 和Meta(元数据)的信息,Class在被加载的时候被放入永久区域,它和和存放实例的区域不同,GC不会在主程序运行期对永久区域进行清理。所以这也导致了永久代的区域会随着加载的Class的增多而胀满,最终抛出OOM异常。
11.垃圾回收与算法
12.如何确定垃圾
1.引用计数法
在Java 中,引用和对象是有关联的。如果要操作对象则必须用引用进行。因此,很显然一个简单的办法是通过引用计数来判断一个对象是否可以回收。简单说,即一个对象如果没有任何与之关联的引用,即他们的引用计数都不为О,则说明对象不太可能再被用到,那么这个对象就是可回收对象。
2.可达性分析
为了解决引用计数法的循环引用问题,Java 使用了可达性分析的方法。通过一系列的“GC roots"对象作为起点搜索。如果在“GC roots”和一个对象之间没有可达路径,则称该对象是不可达的。要注意的是,不可达对象不等价于可回收对象,不可达对象变为可回收对象至少要经过两次标记过程。两次标记后仍然是可回收对象,则将面临回收。
13.标记清除算法(Mark-Sweep)
最基础的垃圾回收算法,分为两个阶段,标注和清除。标记阶段标记出所有需要回收的对象,清除阶段回收被标记的对象所占用的空间。如图
从图中我们就可以发现,该算法最大的问题是内存碎片化严重,后续可能发生大对象不能找到可利用空间的问题。
总结
所有的面试题目都不是一成不变的,特别是像一线大厂,上面的面试真题只是给大家一个借鉴作用,最主要的是给自己增加知识的储备,有备无患。
给大家分享整理的2019年大厂JVM面试题资料(20多页pdf文档)以及多家公司java面试题资料100多页pdf文档和各知识点学习路线思维脑图(xmind)还有JVM讲解视频。需要的可以点击这里!!!暗号