在平时开发过程中经常会遇到日志打印有问题、代码不知道是否执行、定位运行缓慢的代码段等需求,这时往往需要排查很久,并且由于我们基于docker进行部署,一旦有问题要发包调试的话构建过程还是比较复杂耗时的,有时候打包只是为了添加几行日志输出来查看运行参数,非常影响我们的调试效率
Arthas 是一款线上监控诊断产品,通过全局视角实时查看java应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。
Arthas 是Alibaba开源的Java诊断工具,深受开发者喜爱。
当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决:
1、这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
2、我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
3、遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
4、线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
5、是否有一个全局视角来查看系统的运行状况?
6、有什么办法可以监控到JVM的实时运行状态?
7、怎么快速定位应用的热点,生成火焰图?
8、怎样直接从JVM内查找某个类的实例?
1、查询docker容器id
docker ps -a
docker exec -it 5ede1efc9679 bash
1、执行命令
curl -O https://arthas.aliyun.com/arthas-boot.jar
java -jar arthas-boot.jar
1、选择服务
在上面的服务选择中输入想要监测的java服务,比如我想监测user服务,就输入对应的编号6,然后按回车
此时会进入到arthas的命令窗格
四、使用arthas进行监测
比如我们要监测user服务中的listReportDataByTemp接口
watch com.yzsj.provideruser.feignController.statistical.valueReport.UseTemplateToSearchFeignController listReportDataByTemp '{params,returnObj,throwExp}' -n 5 -x 3
由于该接口报了空指针报错,在arthas命令行入参显示正常,出参展示出了空指针报错的栈信息
注意
请注意,这些命令,都通过字节码增强技术来实现的,会在指定类的方法中插入一些切面来实现数据统计和观测,因此在线上、预发使用时,请尽量明确需要观测的类、方法以及条件,诊断结束要执行 stop 或将增强过的类执行 reset 命令。
Arthas 支持使用管道对上述命令的结果进行进一步的处理,如sm java.lang.String * | grep ‘index’
当线上出现偶发的问题,比如需要 watch 某个条件,而这个条件一天可能才会出现一次时,异步后台任务就派上用场了,详情请参考这里
:::info
是否对上述语法表示疑惑?
是否容易忘记语法或者参数?
是否由于语法过多导致不知道用哪个?
:::
兄弟们,解决方案来了!!!idea插件,你值得拥有。
在idea的插件下载市场搜索并下载插件arthas idea
在你想监控的方法名上右击鼠标,选择Arthas Command,并点击想要使用的操作,点击完后会自动复制。
我们自动生成的命令如下:
watch com.yzsj.provideruser.feignController.statistical.valueReport.UseTemplateToSearchFeignController listReportDataByTemp '{params,returnObj,throwExp}' -n 5 -x 3
使用该命令在arthas命令窗口执行会进入自动监测等待方法执行的状态
打开postman调用该接口或调用类,会输出我们想要监测到的内容
在上面的输出中我们能看到类入参出参的具体内容
@Object[][
@LinkedHashMap[
@String[msgCode]:@String[09_02_02_03],
@String[type]:@String[create],
@String[statType]:@String[0],
@String[start]:@String[1694512946000],
@String[end]:@Long[1694602946000],
@String[startTime]:@String[2023-09-12 18:02:26],
@String[endTime]:@String[2023-09-13 19:02:26],
@String[timeSpan]:@String[1],
@String[spanType]:@String[d],
@String[cycleTime]:@String[1],
@String[timeType]:@String[h],
@String[statisticValType]:@String[max,min,avg,dev],
@String[samplings]:@String[mean],
@String[tempId]:@String[1d357a67ac6f4fe5b7270c1cf5a1b1b2],
@String[sort]:@String[assetName],
@String[offset]:@String[0],
@String[limit]:@String[10],
@String[tagIds]:@String[],
@String[url]:@String[http://192.168.1.42:8086/query],
],
@StatHttpServletResponseWrapper[
status=@Integer[200],
LSTRING_FILE=@String[javax.servlet.LocalStrings],
lStrings=@PropertyResourceBundle[java.util.PropertyResourceBundle@310e9f85],
response=@ResponseFacade[org.apache.catalina.connector.ResponseFacade@4e41e4ca],
],
]