Java在线诊断-Arthas生产方法执行耗时分析

生产方法执行耗时分析

背景:生产某程序在执行某个操作的时候,耗时30多分钟,测试环境无法复现,要求定位到具体的操作

1)准备工作

  • 首先保证开发环境代码与生产一致
  • 提前安装阿里巴巴开源的 Java 诊断工具 Arthas,如果生产环境不能访问公网可以采用离线全量安装方式。具体参考:https://alibaba.github.io/arthas/install-detail.html#id2

2)耗时分析

  • 启动Arthas工具
java -jar arthas-boot.jar

Java在线诊断-Arthas生产方法执行耗时分析_第1张图片

  • 启动成功后将会列出当前运行的所有 java 进程,输入准备修改的程序编号

Java在线诊断-Arthas生产方法执行耗时分析_第2张图片

  • 然后会进入到该程序的 Arthas 操作命令界面中,然后使用trace命令查询某个方法内部调用路径,并输出方法路径上的每个节点上耗时
trace -E com.test.ClassA|org.test.ClassB method1|method2|method3

Java在线诊断-Arthas生产方法执行耗时分析_第3张图片

  • 手动或者等待该方法执行,即可得到该方法的内部调用路径和方法路径上的每个节点上耗时

Java在线诊断-Arthas生产方法执行耗时分析_第4张图片

  • 根据图片上的分析我们可以得知 initLog 方法耗费了大量的时间,然后我们就可以专门分析这个方法了
  • PS:后续我仔细的分析了这个方法,发现并不是程序逻辑问题导致时间长,是由于方法里面一个对数据库查询的操作导致的,但是单独在生产执行这个查询的 SQL 语句却非常快,最后经过和运维同事一起排查发现,是由于这个任务执行时数据库压力太大导致。

之前用过 Arthas 的代码热更新功能,非常好用,这次又用它来排查程序耗时过长的问题,所以 Arthas 还是很牛掰的,一些常用的操作最好能够掌握。

你可能感兴趣的:(问题排查)