本文主要讲的是Java内存泄露和CUP飙升问题的排查方案以及相关面试题的回答话术。
内存泄漏原因:
如果线程请求分配的栈容量超过java虚拟机栈允许的最大容量的时候,java虚拟机将抛出一个StackOverFlowError异常
如果java虚拟机栈可以动态拓展,并且扩展的动作已经尝试过,但是目前无法申请到足够的内存去完成拓展,或者在建立新线程的时候没有足够的内存去创建对应的虚拟机栈,那java虚拟机将会抛出一个OutOfMemoryError异常
如果一次加载的类太多,元空间内存不足,则会报OutOfMemoryError: Metaspace
1、通过 jmap
指定打印内存快照 dump
有的情况是内存溢出之后程序则会直接中断,而jmap只能打印在运行中的程序,所以建议通过参数的方式的生成dump文件,配置如下:
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=/home/app/dumps/ 指定生成后文件的保存目录
2、通过工具, VisualVM(Ecplise MAT)去分析 dump
文件
VisualVM可以加载离线的dump文件,如下图
文件 => 装入 => 选择dump文件即可查看堆快照信息
如果是linux系统中的程序,则需要把dump文件下载到本地(windows环境)下,打开VisualVM工具分析。VisualVM目前只支持在windows环境下运行可视化
3、通过查看堆信息的情况,可以大概定位内存溢出是哪行代码出了问题
4、找到对应的代码,通过阅读上下文的情况,进行修复即可
1、使用 top
命令查看占用 CPU
的情况
2、通过 top
命令查看后,可以查看是哪一个进程占用 CPU
较高,上图所示的进程为:30978
3、查看当前线程中的进程信息
ps H -eo pid,tid,%cpu | grep 40940
pid 进行id
tid 进程中的线程id
% cpu使用率
4、通过上图分析,在进程30978中的线程30979占用 CPU
较高
注意:上述的线程id是一个十进制,我们需要把这个线程id转换为16进制才行,因为通常在日志中展示的都是16进制的线程id名称
转换方式:
在linux中执行命令
printf "%x\n" 30979
5、可以根据线程 id 找到有问题的线程,进一步定位到问题代码的源码行号
执行命令:
jstack 30978 此处是进程id
程序中存在死循环或者长时间占用 CPU 的操作。比如,不合理的递归操作、循环操作等。
程序中存在大量的计算操作,例如复杂的算法、大量的数值计算等。
程序中存在大量的 IO 操作,例如读写文件、网络通信等。
程序中存在大量的线程创建和销毁操作,以及线程间的竞争和同步操作。
程序中存在内存泄漏或者内存溢出,导致 JVM 不断进行垃圾回收。
程序中存在大量的数据库操作,导致数据库连接池的耗尽和数据库负载过高。
针对这些问题,需要具体情况具体分析,采取相应的优化措施,例如修改代码逻辑、优化算法、降低 IO 操作频率、减少线程创建和销毁、增加 JVM 内存等。
面试官:JVM 调优的参数可以在哪里设置参数值?
候选人:
我们当时的项目是SpringBoot项目,可以在项目启动的时候,java -jar中加入参数就行了。
面试官:用的 JVM 调优的参数都有哪些?
候选人:
嗯,这些参数是比较多的
我记得当时我们设置过堆的大小,像-Xms和-Xmx
还有就是可以设置年轻代中Eden区和两个Survivor区的大小比例还有就是可以设置使用哪种垃圾回收器等等。具体的指令记不太清楚。
面试官:你们平时调试 JVM 都用了哪些工具呢?
候选人:
嗯,我们一般都是使用jdk自带的一些工具,比如
jps 输出JVM中运行的进程状态信息。
jstack 查看java进程内线程的堆栈信息。
jmap 用于生成堆转存快照。
jstat 用于JVM统计监测工具。
还有一些可视化工具,像 jconsole 和 VisualVM 等。
面试官:假如项目中产生了java内存泄露,你说一下你的排查思路?
候选人:
第一,可以通过jmap指定打印他的内存快照 dump文件,不过有的情况打印不了,我们会设置vm参数让程序自动生成dump文件。
第二,可以通过工具去分析 dump文件,jdk自带的VisualVM就可以分析。
第三,通过查看堆信息的情况,可以大概定位内存溢出是哪行代码出了问题。
第四,找到对应的代码,通过阅读上下文的情况,进行修复即可。
面试官:如果说服务器CPU持续飙高,你的排查方案与思路?
候选人:
第一,可以使用使用top命令查看占用cpu的情况。
第二,通过top命令查看后,可以查看是哪一个进程占用CPU较高,记录这个进程id。
第三,可以通过ps查看当前进程中的线程信息,看看哪个线程的CPU占用较高。
第四,可以jstack命令打印进行的id,找到这个线程,就可以进一步定位问题代码的行号。
其它问题可以参考另一篇文章:JVM相关问题排查与定位