jvm学习笔记:第4章 虚拟机性能监控与故障处理工具

 4.1 概述
    给一个系统定位问题的时候,知识、经验是关键基础,数据是依据,工具是运用知识处理数据的手段。这里说的数据包括:运行日志、异常堆栈、GC日志、线程快照(threaddump/javacore文件)、堆转储快照(heapdump/hprof文件)等。
4.2JDK的命令行工具
    这些命令工具大多数是jdk\lib\tools.jar类库的一层薄包装而已,它们主要的功能代码是在tools类库中实现的。
    注意:如果需要监控运行于JDK1.5的虚拟机之上的程序,在程序启动时请添加参数”-Dcom.sun.management.jmxremote“开启JMX管理功能,否则由于部分工具都是基于JMX的,因此它们都将会无法使用,如果被监控程序运行于JDK1.6的虚拟机之上,那JMX管理默认是开启的,虚拟机启动时无须再添加任何参数。
    Sun JDK 监控和故障处理工具
    (1)jps:JVM process Status Tool,显示指定系统内所有的HotSpot虚拟机进程
    (2)jstat:JVM Statistics Monitoring Tool,用于收集HotSpot虚拟机各方面的运行数据
    (3)jinfo:Configuration Info for Java,显示虚拟机配置信息
    (4)jmap:Memory Map for Java,生成虚拟机的内存转储快照(heapdump文件)
    (5)jhat:JVM Heap Dump Browser,用于分析headdump文件,它会建立一个HTTP/HTML服务器,让用户可以在浏览器上查看分析结果
    (6)jstack:Stack Trace for Java,显示虚拟机的线程快照
4.2.1 jps:虚拟机进程状况工具
    功能与Unix的ps命令类似:可以列出正在运行的虚拟机进程,并显示虚拟机执行主类(Main Class,main()函数所在的类)的名称,以及这些进程的本地虚拟机的唯一ID(LVMID,Local Virtual Machine Identifier)。虽然功能比较单一,但是它是使用频率最高的JDK命令行工具,因为其他的JDK工具大多需要输入它查询到的LVMID来确定要监控的是哪一个虚拟机进程。对于本地虚拟机进程来说,LVMID与操作系统的进程ID(PID,Process Identifier)是一致的,使用Windows的任务管理器或Unix的ps命令也可以查询到虚拟机进程的LVMID。但如果启动了多个虚拟机进程,无法根据进程名称定位时,那就只能依赖jps命令显示主类的功能才能区分了。
    jps命令格式:
    jps [ options ] [ hostid ]
    jps可以通过RMI协议查询开启了RMI服务的远程虚拟机进程状态,hostid为RMI注册表中注册的主机名。
    jps工具主要选项
    (1)-q : 只输出LVMID,省略主类的名称
    (2)-m :输出虚拟机进程启动时传递给主类main()函数的参数
    (3)-l :输出主类的全名,如果进程执行的是Jar包,输出Jar路径
    (4)-v:输出虚拟机进程启动时JVM参数
nange@ubuntu:~$ jps
2733 DataNode
2877 SecondaryNameNode
4483 Jps
2590 NameNode
2965 JobTracker
3111 TaskTracker
 
-l:输出主类全名
nange@ubuntu:~$ jps -l
2733 org.apache.hadoop.hdfs.server.datanode.DataNode
4495 sun.tools.jps.Jps
2877 org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode
2590 org.apache.hadoop.hdfs.server.namenode.NameNode
2965 org.apache.hadoop.mapred.JobTracker
3111 org.apache.hadoop.mapred.TaskTracker
 
4.2.2 jstat:虚拟机统计信息监视工具
    jstat(JVM Statistics Monitoring Tool)是用于监视虚拟机各种运行状态信息的命令行工具。它可以显示本地或远程(需要远程主机提供RMI支持,Sun提供了jstatd工具可以方便地建立远程RMI服务器)虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据,在没有GUI图形界面,只提供了纯文本控制台环境的服务器上,它将是运行期定位虚拟机性能问题的首选工具。
    jstat命令格式为:
    jstat [option vmid [interval [s|ms] [count] ] ]
    对于命令格式中的vmid与LVMID需要特别说明一下:如果是本地虚拟机进程,VMID和LVMID是一致的,如果是远程虚拟机进程,那VMID的格式应该是:
    [protoco:][//]lvmid[@hostname[:port]/servername]
    参数interval和count代表查询间隔和次数,如果省略这两个参数,说明只查询一次,假设需要每250毫秒查询一次进程1024垃圾收集的情况,一个查询20次,那命令应该是
    jstat -gc 1024 250 20
    选项option代表这用户希望查询的虚拟机信息,主要分为3类:类装载、垃圾收集和运行期编译状况。
    jstat工具主要选项
    (1)-class : 监视类装载、卸载数量、总空间及类装载所耗费的时间
nange@ubuntu:~$ jstat -class 2702
Loaded  Bytes  Unloaded  Bytes     Time   
  2791  5682.0        0     0.0       5.23
查看2702进程的class装载卸载数量、占用空间和消耗的时间
装载2791个class,占用5682字节。卸载0class。一共消耗5.23s

nange@ubuntu:~$ jstat -class 2702 3000 3
Loaded  Bytes  Unloaded  Bytes     Time   
  2791  5682.0        0     0.0       5.23
  2791  5682.0        0     0.0       5.23
  2791  5682.0        0     0.0       5.23
3000:表示3秒  3:查询3次
    (2)-gc : 监视Java堆状况,包括Eden区、两个Survivor区、老年代、永久代等的容量、已用空间、GC时间合计等信息
 
    (3)-gccapacity: 监视内容与-gc基本相同,但输出主要关注Java堆各个区域使用到的最大和最小空间
    (4)-gcutil : 监视内容与-gc基本相同,但输出主要关注已使用空间栈总空间的百分比
    (5)-gccause:与-gcutil功能已用,但是会额外输出导致上一次GC产生的原因
    (6)-gcnew: 监视新生代GC的状况
    (7)-gcnewcapacity:监视内容与-gcnew基本相同,输出主要关注使用到的最大和最小空间
    (8)-gcold:监视老年代GC的状况
    (9)-gcoldcapacity:监视内容与-gcold基本相同,输出主要关注使用到的最大和最小空间
    (10)-gcpermcapacity:输出永久代使用到的最大和最小空间
    (11)-complier:输出JIT编译器编译过的方法、耗时等信息
    (12)-printcompilation:输出已经被JIT编译的方法。
4.2.3 jinfo:Java配置信息工具
    jinfo(Configuration Info for Java)的作用是实时地查看和调整虚拟机的各项参数。使用jps命令的-v参数可以查看虚拟机启动时显式指定的参数列表,但如果想知道未被显示指定的参数的系统默认值,除了去查找资料外,就只能使用jinfo的-flag选项进行查询了(如果只限于JDK1.6或以上版本的话,使用java -XX:+PrintFlagsFinal查看参数默认值也是一个很好的选择),jinfo还可以使用-sysprops选项把虚拟机进程的System.getProperties()的内容大意出来。
    JDK1.6之后,jinfo在Windows和Linux平台都有提供,并且加入了运行期修改参数的能力,可以使用-flag[+|-]name 或 -flag name=value 修改一部分运行期可写的虚拟机参数值。JDK1.6中,jinfo对于Windows平台的功能仍然有较大限制,只提供了最基本的-flag选项。
    jinfo命令格式:
    jinfo [ option ] pid
4.2.4 jmap:Java内存映像工具
    jmap(Memory Map for Java)命令用于生成堆转储快照(一般称为heapdump或dump文件)。如果不使用jmap命令,想要获取Java堆转储快照还有一些比较”暴力“的手段:可以使用-XX:+HeapDumpOnOutOfMemoryError参数,可以让虚拟机在OOM异常出现之后自动生成dump文件,通过-XX:+HeapDumpOnCtrlBreak参数则可以使用[Ctrl]+[Break]键让虚拟机生成dump文件,又或者在Linux系统下通过Kill -3命令发送进程退出信号”恐吓“一下虚拟机,也能拿到dump文件。
    和jinfo命令一样,jmap有不少功能在Windows平台下都是受限的,除了生成dump文件的-dump选项和用于查看每个类的实例、空间占用统计的-histo选项所有操作系统都提供之外,其余选项都只能在Linux/Solaris下使用。
    jmap命令格式:
    jmap [ option ] vmid
    jmap工具主要选项
    (1)-dump:生成Java堆转储快照。格式为:-dump:[live,] format=b,file=<filename>,其中live子参数说明是否只dump出存活的对象
    (2)-finalizerinfo:显示在F-Queue中等待Finalizer线程执行finalize方法的对象。只在Linux/Solaris平台下有效。
    (3)-heap:显示Java堆详细信息,如使用哪种收集器、参数配置、分代状况等。只在Linux/Solaris平台下有效。
    (4)-histo:显示堆中对象统计信息,包括类、实例数量和合计容量。
    (5)-permstat:以ClassLoader为统计口径显示永久代内存状态。只在Linux/Solaris平台下有效。
    (6)-F:当虚拟机进程对-dump选项没有响应时,可以使用这个选项强制生成dump快照。只在Linux/Solaris平台下有效。
4.2.5 jhat:虚拟机堆转储快照分析工具
    Sun JDK提供jhat(JVM Heap Analysis Tool)命令与jmap命令搭配使用,来分析jmap生成的堆存储快照。jhat内置了一个微型的HTTP/HTML服务器,生成dump文件的分析结果后,可以在浏览器中查看。
4.2.6 jstack:Java堆栈跟踪工具
    jstack(Stack Trace for Java)命令用于生成虚拟机当前时刻的线程快照(一般称为threaddump或javacore文件)。线程快照就是当前虚拟机内每一条线程正在执行的方法的堆栈的机会,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等都是导致线程长时间停顿的常见原因。线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做些什么事情,或者等待着什么资源。
    jstack命令格式:
    jstack [ option ] vmid
    option选项的合法值与具体含义为:
    (1)-F : 当正常输出的请求不被响应时,强制输出线程堆栈
    (2)-l:除堆栈外,显示关于锁的附加信息
    (3)-m:如果调用到本地方法的话,可以显示C/C++的堆栈
    在JDK1.5中,java.lang.Thread类新增了一个getAllStackTraces()方法用于获取虚拟机中所有线程的StackTraceElement对象。使用这个方法可以通过简单的几行代码就完成jstack的大部分功能。
4.3 JDK的可视化工具
    JDK中除了提供大量的命令行工具外,还有两个功能强大的可视化工具:JConsole和VisualVM,这两个工具是JDK的正式成员。
    其中JConsole是在JDK1.5时期就已经提供的虚拟机监控工具,而VisualVM在JDK1.6 Update7中才首次发布。
4.3.1 JConsole:Java监视与管理控制台
    JConsole(Java Moniting and Management Console)是一款基于JMX的可视化监视和管理的工具。它管理部分的功能是针对JMX MBean进行管理,由于MBean可以使用代码、中间件服务器的管理控制台或者所有符合JMX规范的软件进行访问,所以本节中将会着重介绍JConsole监视部分的功能。
    1.启动JConsole
    通过JDK/bin目录下的”jconsole.exe“启动JConsole后,将自动搜索出本机运行的所有虚拟机进程,不需要用户自己使用jps来查询了。双击选择其中一个进程即可开始监控,也可以使用下面的”远程监控“功能来连接远程服务器,对远程虚拟机进行监控。
    2.内存监控
    ”内存“页签相当于可视化的jstat命令,用于监视受收集器管理的虚拟机内存(Java堆和永久代)的变化趋势。
    3.线程监控
    ”线程“页签的功能相当于可视化的jstack命令,遇到线程停顿的时候可以使用这个页签进行监控分析。
4.3.2 VisualVM:多合一故障处理工具
    VisualVM(All-in-One Java Troubleshooting Tool)是到目前为止,随JDK发布的功能最强大的运行监视和故障处理程序。其有一个很大的优点:不需要被监视的程序基于特殊的Agent运行,因此它对应用程序的实际性能影响很小,使得它可以直接应用于生成环境中。
    1.VisualVM兼容范围与插件安装
    VisualVM基于NetBeans平台开发,因此它一开始就具备了插件扩展功能的特性,通过插件扩展支持,VisalVM可以做到:
    (1)显示虚拟机进程及进程的配置和环境信息(jps、jinfo)
    (2)监视应用程序的CPU、GC、堆、方法区及线程的信息(jstat、jstack)
    (3)dump及分析堆转储快照(jmap、jhat)
    (4)方法级的程序运行性能分析、找出被调用最多、运行时间最长的方法。
    (5)离线程序快照:收集程序的运行时配置、线程dump、内存dump等信息建立一个快照,可以将快照发送开发者处进行Bug反馈。
    2.生成和浏览堆转储快照
    在VisualVM中生成dump文件有两种方式,可以执行下列任一操作:
    (1)在”应用程序“窗口中右键单击应用程序节点,然后选择”堆Dump“
    (2)在”应用程序“窗口中双击应用程序节点以打开应用程序标签,然后在”监视“标签中单击”堆Dump“。
    生成了dump文件后,应用程序页签将在该堆中的应用程序下增加一个以[heapdump]开头的子节点,并且在主页签中打开该转储快照。如果需要把dump文件保存或者发送出去,要在headdump节点上右键选择”另存为“菜单,否则当VisalVM关闭时,生成的dump文件会被当做临时文件被删除掉。要打开一个已经存在的dump文件,通过文件菜单中的”装入“功能,选择硬盘上的dump文件即可。
    3.分析程序性能
    在Profile页签中,VisalVM提供了程序运行期间方法级的CPU执行时间分析及内存分析,进行Profiling分析肯定会对程序运行性能有比较大的影响,所以一般不在生产环境中使用这项功能。
    要开始分析,选择”CPU“和”内存“按钮中的一个,然后切换到应用程序中对程序进行操作,VisalVM会记录到这段时间中应用程序执行过的方法。如果是CPU分析,将会统计每个方法的执行次数、执行耗时;如果是内存分析则会统计每个方法关联的对象数及这些对象所占的空间。分析结束后,点击”停止“按钮结束监控过程。
    注意:在JDK1.5之后,在Client模式下的虚拟机加入并且自动开启了类共享——这是一个在多虚拟机进程中共享rt.jar中的类数据以提高加载速度和节省内存的优化,而根据相关Bug报告的反馈,VisualVM的Profiler功能可能会因为类共享而导致被监视的应用程序崩溃,所以在进行Profiling前,最好在被监视的程序中使用-Xshare:off参数来关闭类共享优化。
    4.BTrace
    BTrace是一个很”有趣“的VisalVM插件,本身也是可以独立运行的程序,它的作用是在不停止目标程序运行的前提下,通过HotSpot虚拟机的HotSwap技术(代码热替换技术,HotSpot虚拟机运行在不停止运动的情况下,更新已经加载的类的代码)动态加入原本并不存在的调试代码。
4.4 本章小结
    除了JDK自带的工具之外,常用的故障处理工具还有很多,如果使用的是非Sun系列的SDK,非HotSpot虚拟机,就需要使用对应的工具进行分析
    (1)IBM的Support Assistant、Heap Analyzer、Javacore Analyzer、Garbage Collector Analyzer适用于IBM J9 VM。
    (2)HP的HPjmeter、HPjtune适用于HP-UX、SAP、HotSpot VM。
    (3)Eclipse的Memory Analyzer Tool(MAT)适用于HP-UX、SAP、HotSpot VM,安装IBM DTFJ插件后可支持IBM J9 VM。
    (4)BEA的JRockit Mission Control,适用于JRockit VM。

你可能感兴趣的:(学习笔记)