官网地址:简介 | arthas
Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。
为啥要用Arthas:
通常,本地开发环境无法访问生产环境。如果在生产环境中遇到问题,则无法使用 IDE 远程调试。更糟糕的是,在生产环境中调试是不可接受的,因为它会暂停所有线程,导致服务暂停。
开发人员可以尝试在测试环境或者预发环境中复现生产环境中的问题。但是,某些问题无法在不同的环境中轻松复现,甚至在重新启动后就消失了。
如果您正在考虑在代码中添加一些日志以帮助解决问题,您将必须经历以下阶段:测试、预发,然后生产。这种方法效率低下,更糟糕的是,该问题可能无法解决,因为一旦 JVM 重新启动,它可能无法复现,如上文所述。
第一步:启动 math-game
curl -O https://arthas.aliyun.com/math-game.jar
java -jar math-game.jar
math-game是一个简单的程序,每隔一秒生成一个随机数,再执行质因数分解,并打印出分解结果。
如图所示:
第二步:启动 arthas
curl -O https://arthas.aliyun.com/arthas-boot.jar
java -jar arthas-boot.jar
启动后,选择应用 java 进程进行监听,我这里选择1,再输入回车/enter。Arthas 会 attach 到目标进程上,并输出日志:
如图所示:
第三步:查看 dashboard
输入dashboard,按回车/enter,会展示当前进程的信息,按ctrl+c可以中断执行。
如图所示:
秒
分:秒
Java 8 之后支持获取 JVM 内部线程 CPU 时间,这些线程只有名称和 CPU 时间,没有 ID 及状态等信息(显示 ID 为-1)。 通过内部线程可以观测到 JVM 活动,如 GC、JIT 编译等占用 CPU 情况,方便了解 JVM 整体运行状况。
trace/watch/tt/redefine
等命令后,可以看到 JIT 线程活动变得更频繁。因为 JVM 热更新 class 字节码时清除了此 class 相关的 JIT 编译结果,需要重新编译。JVM 内部线程包括下面几种:
C1 CompilerThread0
, C2 CompilerThread0
GC Thread0
, G1 Young RemSet Sampling
VM Periodic Task Thread
, VM Thread
, Service Thread
GC区域说明:
gc.ps_scavenge.count:从应用程序启动到当前采样时间年轻代gc次数
gc.ps_scavenge.time(ms):从应用程序启动到当前采样时间年轻代gc所用的总时间(毫秒)
gc.ps_marksweep.count:从应用程序启动到当前采样时间老年代gc次数
gc.ps_marksweep.time(ms):从应用程序启动到当前采样时间老年代gc所用的总时间(毫秒)
Memory区域主要参数说明:
heap:堆内存使用情况(ps_eden_space+ps_survivor_space+ps_old_gen)
ps_eden_space:eden区内存使用情况
ps_survivor_space:survivor区内存使用情况
ps_old_gen :老年代内存使用情况
nonheap:非堆内存使用情况
第四步:通过 thread 命令来获取到math-game进程的 Main Class
thread 1会打印线程 ID 1 的栈,通常是 main 函数的线程。
第五步:通过 jad 来反编译 Main Class
1111
第六步:watch
通过watch命令来查看demo.MathGame#primeFactors函数的返回值
第七步:退出 arthas
如果只是退出当前的连接,可以用quit或者exit命令。Attach 到目标进程上的 arthas 还会继续运行,端口会保持开放,下次连接时可以直接连接上。
如果想完全退出 arthas,可以执行stop命令。
----------等待合适测试案例