Arthas
是阿里开源的一款 Java 应用诊断工具,可以在线排查问题,动态跟踪 Java 代码,以及实时监控 JVM 状态。
官方网站:arthas
wget https://arthas.aliyun.com/arthas-boot.jar
需要在运行了java程序的环境运行
java -jar arthas-boot.jar
程序会显示出系统中所有正在运行的 Java 进程,Arthas 为每个进程分配了一个序号
[INFO] JAVA_HOME: C:\Program Files\Java\jdk1.8.0_351\jre [INFO] arthas-boot version: 3.7.1 [INFO] Found existing java process, please choose one and input the serial number of the process, eg : 1. Then hit ENTER. * [1]: 9400 .\target\demo-0.0.1-SNAPSHOT.jar [2]: 13964 org.eclipse.equinox.launcher_1.6.500.v20230717-2134.jar [3]: 6796 org.springframework.ide.vscode.boot.app.BootLanguageServerBootApp
从这个列表中找到出问题的那个 Java 进程,并输入相应的序号,比如这里我输入
1
,然后按下回车,Arthas 就会自动下载完整的包,并 Attach 到目标进程,输出如下:[INFO] Start download arthas from remote server: https://arthas.aliyun.com/download/3.7.1?mirror=aliyun [INFO] Download arthas success. [INFO] arthas home: C:\Users\aneasystone\.arthas\lib\3.7.1\arthas [INFO] Try to attach process 9400 [INFO] Attach process 9400 success. [INFO] arthas-client connect 127.0.0.1 3658 ,---. ,------. ,--------.,--. ,--. ,---. ,---. / O \ | .--. ''--. .--'| '--' | / O \ ' .-' | .-. || '--'.' | | | .--. || .-. |`. `-. | | | || |\ \ | | | | | || | | |.-' | `--' `--'`--' '--' `--' `--' `--'`--' `--'`-----' wiki https://arthas.aliyun.com/doc tutorials https://arthas.aliyun.com/doc/arthas-tutorials.html version 3.7.1 main_class pid 9400 time 2023-12-06 07:16:31 [arthas@9400]$
[arthas@9400]$ help
NAME DESCRIPTION
help Display Arthas Help
auth Authenticates the current session
keymap Display all the available keymap for the specified connection.
sc Search all the classes loaded by JVM
sm Search the method of classes loaded by JVM
classloader Show classloader info
jad Decompile class
getstatic Show the static field of a class
monitor Monitor method execution statistics, e.g. total/success/failure count, average rt, fail rate, etc.
stack Display the stack trace for the specified class and method
thread Display thread info, thread stack
trace Trace the execution time of specified method invocation.
watch Display the input/output parameter, return object, and thrown exception of specified method invocation
tt Time Tunnel
jvm Display the target JVM information
memory Display jvm memory info.
perfcounter Display the perf counter information.
ognl Execute ognl expression.
mc Memory compiler, compiles java files into bytecode and class files in memory.
redefine Redefine classes. @see Instrumentation#redefineClasses(ClassDefinition...)
retransform Retransform classes. @see Instrumentation#retransformClasses(Class...)
dashboard Overview of target jvm's thread, memory, gc, vm, tomcat info.
dump Dump class byte array from JVM
heapdump Heap dump
options View and change various Arthas options
cls Clear the screen
reset Reset all the enhanced classes
version Display Arthas version
session Display current session information
sysprop Display and change the system properties.
sysenv Display the system env.
vmoption Display, and update the vm diagnostic options.
logger Print logger info, and update the logger level
history Display command history
cat Concatenate and print files
base64 Encode and decode using Base64 representation
echo write arguments to the standard output
pwd Return working directory name
mbean Display the mbean information
grep grep command for pipes.
tee tee command for pipes.
profiler Async Profiler. https://github.com/jvm-profiling-tools/async-profiler
vmtool jvm tool
stop Stop/Shutdown Arthas server and exit the console.
与 JVM 相关的命令
与类加载、类、方法相关的命令
统计和观测命令
类 Linux 命令
其他命令
这是主要的几类命令
这些命令主要与 JVM 相关,用于查看或修改 JVM 的相关属性,查看 JVM 线程、内存、CPU、GC 等信息:
jvm - 查看当前 JVM 的信息;
sysenv - 查看 JVM 的环境变量;
sysprop - 查看 JVM 的系统属性;
vmoption - 查看或修改 JVM 诊断相关的参数;
memory - 查看 JVM 的内存信息;
heapdump - 将 Java 进程的堆快照导出到某个文件中,方便我们对堆内存进行分析;
thread - 查看所有线程的信息,包括线程名称、线程组、优先级、线程状态、CPU 使用率、堆栈信息等;
dashboard - 查看当前系统的实时数据面板,包括了线程、内存、GC 和 Runtime 等信息;可以把它看成是
thread
、memory
、jvm
、sysenv
、sysprop
几个命令的综合体;perfcounter - 查看当前 JVM 的 Perf Counter 信息;
logger - 查看应用日志信息,支持动态更新日志级别;
mbean - 查看或实时监控 Mbean 的信息;
vmtool - 利用 JVMTI 接口,实现查询内存对象,强制 GC 等功能;
这些命令主要与类加载、类或方法相关,比如在 JVM 中搜索类或类的方法,查看类的静态属性,编译或反编译,对类进行热更新等:
classloader - 查看 JVM 中所有的 Classloader 信息;
dump - 将指定类导出成
.class
字节码文件;jad - 将指定类反编译成 Java 源码;
mc - 内存编译器,将 Java 源码编译成
.class
字节码文件;redefine / retransform - 这两个命令都可以对已加载的类进行热更新,但是
redefine
和jad
/watch
/trace
/monitor
/tt
等命令会冲突,而且redefine
后的原来的类不能恢复,所以推荐使用retransform
命令,关于 JDK 中 Redefine 和 Retransform 机制的区别可以参考 这里;sc - Search Class,搜索 JVM 中的类;
sm - Search Method,搜索 JVM 中的类的方法;
getstatic - 查看类的静态属性;
ognl - 执行 ognl 表达式;ognl 非常灵活,可以实现很多功能,比如上面的查看或修改系统属性,查看类的静态属性都可以通过 ognl 实现;
这些命令可以对类方法的执行情况进行统计和监控,是排查线上问题的利器:
monitor - 对给定的类方法进行监控,统计其调用次数,调用耗时以及成功率等;
stack - 查看一个方法的执行调用堆栈;
trace - 对给定的类方法进行监控,输出该方法的调用耗时,和
monitor
的区别在于,它还能跟踪一级方法的调用链路和耗时,帮助快速定位性能问题;watch - 观测指定方法的执行数据,包括方法的入参、返回值、抛出的异常等;
tt - 和
watch
命令一样,tt
也可以观测指定方法的执行数据,但tt
是将每次的执行情况都记录下来,然后再针对每次调用进行排查和分析,所以叫做 Time Tunnel;reset - 上面这些与统计观测相关的命令都是通过 字节码增强技术 来实现的,会在指定类的方法中插入一些切面代码,因此在生产环境诊断结束后,记得执行
reset
命令重置增强过的类(或执行stop
命令);profiler - 使用 async-profiler 对应用采样,并将采样结果生成火焰图;
jfr - 动态开启关闭 JFR 记录,生成的 jfr 文件可以通过 JDK Mission Control 进行分析;
Arthas 命令 | JDK 工具 | 对比 |
---|---|---|
sysprop |
jinfo -sysprops |
都可以查看 JVM 的系统属性,但是 sysprop 比 jinfo 强的是,它还能修改系统属性 |
vmoption |
jinfo -flag |
都可以查看 JVM 参数,但是 vmoption 只显示诊断相关的参数,比如 HeapDumpOnOutOfMemoryError 、PrintGC 等 |
memory |
jmap -heap |
都可以查看 JVM 的内存信息,但是 memory 以表格形式显示,方便用户阅读 |
heapdump |
jmap -dump |
都可以导出进程的堆内存,只是它在使用上更加简洁 |
thread |
jstack |
都可以列出 JVM 的所有线程,但是 thread 以表格形式显示,方便用户阅读,而且增加了 CPU 使用率的功能,可以方便我们快速找出当前最忙的线程 |
perfcounter |
jcmd PerfCounter.print |
都可以查看 JVM 进程的性能统计信息 |
classloader |
jmap -clstats |
都可以查看 JVM 的 Classloader 统计信息,但是 classloader 命令还支持以树的形式查看,另外它还支持查看每个 Classloader 实际的 URL,通过 Classloader 查找资源等 |
jfr |
jcmd JFR.start |
都可以开启或关闭 JFR 记录,并生成的 jfr 文件 |
除了上面那些用于问题诊断的命令,Arthas 还提供了一些类 Linux 命令,方便我们在 Arthas 终端中使用,比如:
base64 - 执行 base64 编码和解码;
cat - 打印文件内容;
cls - 清空当前屏幕区域;
echo - 打印参数;
grep - 使用字符串或正则表达式搜索文本,并输出匹配的行;
history - 输出历史命令;
pwd - 输出当前的工作目录;
tee - 从 stdin 读取数据,并同时输出到 stdout 和文件;
wc
- 暂时只支持wc -l
,统计输出的行数;此外,Arthas 还支持在后台运行任务,仿照 Linux 中的相关命令,我们可以使用
&
在后台运行任务,使用jobs
列出所有后台任务,使用Ctrl + Z
暂停任务,使用bg
和fg
将暂停的任务转到后台或前台继续运行,使用kill
终止任务。具体内容可以参考 Arthas 后台异步任务。
还有一些与 Arthas 本身相关的命令,比如查看 Arthas 的版本号、配置、会话等信息:
version - 查看 Arthas 版本号;
options - 查看或修改 Arthas 全局配置;
keymap - 查看当前所有绑定的快捷键,可以通过
~/.arthas/conf/inputrc
文件自定义快捷键;session - 查看当前会话信息;
auth - 验证当前会话;
quit - 退出当前 Arthas 客户端,其他 Arthas 客户端不受影响;
stop - 关闭 Arthas 服务端,所有 Arthas 客户端全部退出;这个命令会重置掉所有的增强类(除了
redefine
的类);
watch
监听方法出入参和异常logger
动态更新日志级别ognl
查看系统属性和应用配置jad/sc/retransform
热更新代码Arthas 的使用非常灵活,有时候甚至还会有一些意想不到的功能,除了上面这些使用场景,Arthas 的 Issues 中还收集了一些 用户案例,其中有几个案例对我印象很深,非常有启发性,可供参考。
使用
stack
命令定位System.exit/System.gc
的调用来源:https://github.com/alibaba/arthas/issues/20
使用
sc
和jad
排查NoSuchMethodError
问题:https://github.com/alibaba/arthas/issues/160
使用
redefine
修改StringBuilder.toString()
定位未知的日志来源:https://github.com/alibaba/arthas/issues/263
使用
trace javax.servlet.Servlet/Filter
排查 Spring Boot 应用 404/401 问题:https://github.com/alibaba/arthas/issues/429
使用
tt
定位 Java 应用 CPU 负载过高问题:https://github.com/alibaba/arthas/issues/1202
使用
profiler
做复杂链路分析,排查性能问题:https://github.com/alibaba/arthas/issues/1416
使用
trace
命令将接口性能优化十倍:https://github.com/alibaba/arthas/issues/1892
Arthas 文档:
https://arthas.aliyun.com/doc/
OGNL 参考文档:
https://commons.apache.org/proper/commons-ognl/language-guide.html
Arthas 在线教程 - Killercoda:
https://killercoda.com/arthas/course/arthas-tutorials-cn
redefine VS. retransform:
https://lsieun.github.io/java-agent/s01ch03/redefine-vs-retransform.html
Alibaba Arthas实践--获取到Spring Context,然后为所欲为:
https://github.com/alibaba/arthas/issues/482
Arthas 用户案例:
https://github.com/alibaba/arthas/issues?q=label%3Auser-case
使用 SkyWalking & Arthas 优化微服务性能:
https://github.com/alibaba/arthas/issues/1653
使用 Arthas 排查线上问题