Java应用崩溃的排查流程

目录

分析问题

hs_err_pid.log

上周排查了一个java应用的崩溃问题,在这里记录一下。


分析问题

首先是排查到/tmp目录下有很多的core文件,形式类似:

core-18238-java-1705462412  1.3 GB   程序崩溃数据  2024-01-17 11:33:44 
core-18108-java-1705462399  1.3 GB   程序崩溃数据  2024-01-17 11:35:54
.
.
.
.

core文件,通常是指程序在运行过程中发生严重错误(比如段错误)时生成的一种文件。它记录了程序在崩溃时的内存状态、寄存器信息等,有助于开发者在调试时找到问题所在。一般出现在tmp目录下。

我们在这里可以看到许多core文件,并且文件名中包含java字样,说明这是java应用崩溃的core文件。

hs_err_pid.log

Java应用崩溃的信息往往存储在hs_err_pid.log里面,其中pid是进程的id。

本次崩溃的hs_err_pid.log日志也在tmp下,我们来分析下其中的内容:

Java应用崩溃的排查流程_第1张图片

日志的一开头会是一些基本信息,比如用到的jdk版本(Line 6),断点的信息(Line 9)等等。

通过开头我们可知,Java应用是在strcpy处断错误的。

再继续看Stack段:

Java应用崩溃的排查流程_第2张图片

从Stack部分我们可以看出,断错误发生在ScanDevice.so里,com.xwj.verify.ScanDevice.getDeviceList中。

之后联系了维护ScanDevice.so的同事排查,发现是其中的getDeviceList函数的bug,修复了问题后应用可以正常使用,不再崩溃。

你可能感兴趣的:(java,开发语言)