5. 监控和诊断工具

一、Linux工具

1. top

top 命令是 Linux 下最常用的命令之一,它可以实时显示正在执行进程的 CPU 使用率、内存使用率以及系统负载等信息。其中上半部分显示的是系统的统计信息,下半部分显示的是进程的使用率统计信息。
还可以通过 top -Hp pid 按照cpu使用率查看具体线程使用系统资源情况:


image.png
2. vmstat

vmstat 是一款指定采样周期和次数的功能性监测工具,它不仅可以统计内存的使用情况,还可以观测到 CPU 的使用率、swap 的使用情况。但 vmstat 一般很少用来查看内存的使用情况,而是经常被用来观察进程的上下文切换。


image.png
  • r:等待运行的进程数;
  • b:处于非中断睡眠状态的进程数;
  • swpd:虚拟内存使用情况;
  • free:空闲的内存;
  • buff:用来作为缓冲的内存数;
  • si:从磁盘交换到内存的交换页数量;
  • so:从内存交换到磁盘的交换页数量;
  • bi:发送到块设备的块数;
  • bo:从块设备接收到的块数;
  • in:每秒中断数;
  • cs:每秒上下文切换次数;
  • us:用户 CPU 使用时间;
  • sy:内核 CPU 系统使用时间;
  • id:空闲时间;
  • wa:等待 I/O 时间;
  • st:运行虚拟机窃取的时间;
3. pidstat

上面的 top 和 vmstat 两个命令都是监测进程的内存、CPU 以及 I/O 使用情况,而 pidstat 命令则是深入到线程级别。
pidstat [ options ] [ [ ] ]
常用参数:

  • -u:默认的参数,显示各个进程的 cpu 使用情况;
  • -r:显示各个进程的内存使用情况;
  • -d:显示各个进程的 I/O 使用情况;
  • -w:显示每个进程的上下文切换情况;
  • -p:指定进程号;
  • -t:显示进程中线程的统计信息;

例如:pidstat -p 26208 -w 1 3
其中 pidstat 的参数 -p 用于指定进程 ID,-w 表示每个进程的上下文切换情况,1 表示每秒的意思,3 则表示采样次数


image.png
4. ps

ps 可以用来查看进程对应的线程信息,通常用来查看进程中哪些线程消耗CPU比较多。
例如:ps -mp 28602 -o THREAD,tid,time | sort -nr| head -15,查看CPU排名最高的15个线程,然后可以通过线程tid转换成16进制(printf "%x" 29111)配合jstack进行thread dump;


image.png

二、JAVA工具

1. jinfo

查看运行中的java实例参数,如下查看设置的Meta的内存
例如:jinfo -flag MetaSpaceSize 3556


image.png
2. jps

主要用来输出JVM中运行的进程状态信息

  • -q 不输出类名、Jar名和传入main方法的参数
  • -m 输出传入main方法的参数
  • -l 输出main类或Jar的全限名
  • -v 输出传入JVM的参数
1. jstat

jstat 可以监测 Java 应用程序的实时运行情况,包括堆内存信息以及垃圾回收信息

  • -class:显示 ClassLoad 的相关信息;
  • -compiler:显示 JIT 编译的相关信息;
  • -gc:显示和 gc 相关的堆信息;
  • -gccapacity:显示各个代的容量以及使用情况;
  • -gcmetacapacity:显示 Metaspace 的大小;
  • -gcnew:显示新生代信息;
  • -gcnewcapacity:显示新生代大小和使用情况;
  • -gcold:显示老年代和永久代的信息;
  • -gcoldcapacity :显示老年代的大小;
  • -gcutil:显示垃圾收集信息;
  • -gccause:显示垃圾回收的相关信息(通 -gcutil),同时显示最后一次或当前正在发生的垃圾回收的诱因;
  • -printcompilation:输出 JIT 编译的方法信息;

例如:jstat -gc 21711 250 4,GC信息,采样时间间隔为250ms,采样数为4


image.png
  • S0C:年轻代中 To Survivor 的容量(单位 KB);
  • S1C:年轻代中 From Survivor 的容量(单位 KB);
  • S0U:年轻代中 To Survivor 目前已使用空间(单位 KB);
  • S1U:年轻代中 From Survivor 目前已使用空间(单位 KB);
  • EC:年轻代中 Eden 的容量(单位 KB);
  • EU:年轻代中 Eden 目前已使用空间(单位 KB);
  • OC:Old 代的容量(单位 KB);
  • OU:Old 代目前已使用空间(单位 KB);
  • MC:Metaspace 的容量(单位 KB);
  • MU:Metaspace 目前已使用空间(单位 KB);
  • YGC:从应用程序启动到采样时年轻代中 gc 次数;
  • YGCT:从应用程序启动到采样时年轻代中 gc 所用时间 (s);
  • FGC:从应用程序启动到采样时 old 代(全 gc)gc 次数;
  • FGCT:从应用程序启动到采样时 old 代(全 gc)gc 所用时间 (s);
  • GCT:从应用程序启动到采样时 gc 用的总时间 (s);
2. jstack

主要用来查看某个Java进程内的线程堆栈信息,最常用的功能就是使用 jstack pid 命令查看线程的堆栈信息,通常会结合 top -Hp pid 或 pidstat -p pid -t 一起查看具体线程的状态,也经常用来排查一些死锁的异常
例如:jstack 28602|grep 71b7 -A 30,查看71b7线程快照信息


image.png
3. jmap

用来查看堆内存使用状况,一般结合jhat使用;
通常用法:

  • jmap -permstat pid 打印进程的类加载器和类加载器加载的持久代对象信息,输出:类加载器名称、对象是否存活(不可靠)、对象地址、父类加载器、已加载的类大小等信息
  • jmap -heap pid 查看进程堆内存使用情况,包括使用的GC算法、堆配置参数和各代中堆内存使用情况
  • jmap -histo:live 21711 | more 查看堆内存中的对象数目、大小统计直方图,如果带上live则只统计活对象
  • jmap -dump:format=b,file=dumpFileName pid 把进程内存使用情况dump到文件中,再用jhat分析查看

三、arthas

一款阿里巴巴开源的性能分析神器Arthas(阿尔萨斯),官网地址;
通过 help 命令可以查看 arthas 提供的所有功能,下面列举几个常用的命令;

1. dashboard

实时展示当前jvm进程的多线程状态、Jvm各区域、GC情况等信息


image.png
2. thread

thread会显示所有线程的状态信息
thread -n 3会显示当前最忙的3个线程,可以用来排查线程CPU消耗
thread -b 会显示当前处于BLOCKED状态的线程,可以排查线程锁的问题


image.png
3. jvm

查看jvm详细的性能数据

4. trace

trace 命令能主动搜索 class-pattern/method-pattern 对应的方法调用路径,渲染和统计整个调用链路上的所有性能开销和追踪调用链路。
详细信息及案例查看官网

-------over------

你可能感兴趣的:(5. 监控和诊断工具)