JVM监控及诊断工具-GUI篇

01-工具概述

使用上一章命令行工具或组合能帮助我们获取目标Java应用性能相关的基础信息,但它们存在下列局限:

1、无法获取方法级别的分析数据,如方法间的调用关系、各方法的调用次数和调用时间等(这对定位应用性能瓶颈至关重要)。

2、要求用户登陆到目标Java应用所在的宿主机上,使用起来不是很方便。

3、分析数据终端输出,结果展示不够直观。

为此,JDK提供了一些内存泄露的分析工具,如jconsole,jvisualvm等,用于辅助开发人员定位问题,但是这些工具很多时候并不满足快速定位的需求。所以这里我们介绍的工具相对多一些、丰富一些。

图形化综合诊断工具

JDK自带的工具

jconsole:JDK自带的可视化监控工具。查看Java应用程序的运行概况、监控堆信息、永久区(或元空间)使用情况、类加载情况等。位置jdk\bin\jconsole.exe

Visual VM:Visual VM 是一个工具,它提供了一个可视界面,用于查看Java虚拟机上运行的基于Java技术的应用程序的详细信息。位置:jdk\bin\jvisualvm.exe

JMC:Java Mission Control,内置Java Flight Recorder。能够以极低的性能开销收集Java虚拟机的性能数据。

第三方工具

MAT:MAT(Memory Analyzer Tool)是基于Eclipse的内存分析工具,是一个快速、功能丰富的Java heap分析工具,它可以帮助我们查找内存泄露和减少内存消耗。它可以是独立软件,也可以Eclipse的插件形式出现。

JProfiler:商业软件,需要付费。功能强大。与Visual VM类似。

Arthas:Alibaba开源的Java诊断工具。深受开发者的喜爱。

Btrace:Java运行时追踪工具。可以在不停机的情况下,跟踪指定的方法调用、构造函数调用和系统内存等信息。

02-jConsole

基本概述:

从Java5开始,在JDK中自带的java监控和管理控制台。

用于对JVM内存、线程和类的监控,是一个基于JMX(java management extensions)的GUI性能监控工具。

三种连接方式:

Local:使用JConsole连接一个正在本地系统运行的JVM,并且执行程序和运行JConsole的需要是同一个用户。JConsole使用文件系统的授权通过RMI连接器连接到平台的MBean服务器上。这种从本地连接的监控能力只有Sun的JDK具有。

Remote:使用下面的URL通过RMI连接器连接到一个JMX代理,service:jmx:rmi:///jndi/rmi://hostName:portNum/jmxrmi。JConsole为建立连接,需要在环境变量中设置mx.remote.credentials来指定用户名和密码,从而进行授权。

Advance:使用一个特殊的URL连接JMX代理。一般情况使用自己定制的连接器而不是RMI提供的连接器来连接JMX代理,或者是一个使用JDK1.4的实现了JMX和JMX  Romote的应用。

03-Visual VM  

基本概述:

Visual VM是一个功能强大的多合一故障诊断和性能监控的可视化工具。

它集成了多个JDK命令行工具,使用Visual VM可用于显示虚拟机进程即进程的配置和环境信息(jps、jinfo),监视应用程序的CPU、GC、堆、方法区即线程的信息(jstat、jstack)等,甚至代替JConsole。

在JDK 6 Update 7以后,Visual VM便作为JDK的一部分发布(VisaulVM 在JDK/bin目录下),即:它完全免费。

此外,Visaul VM也可以作为独立的软甲安装。

连接方式:

本地连接:监控本地线程的CPU、类、线程等。

远程连接:

1、确定远程服务器的ip地址

2、添加JMX(通过JMX技术具体监控远端服务器哪个Java进程)

3、修改bin/catalina.sh文件,连接远程的tomact

4、在../conf中添加jmxremote.access和jmxremote.password文件

5、将服务器地址改为公网ip地址

6、设置阿里云安全策略和防火墙策略

7、启动 tomcat,查看tomcat启动日志和端口监听

8、JMX中输入端口号、用户名、密码登陆

主要功能:

生成、读取堆内存快照

查看JVM参数和系统属性

查看正在运行的虚拟机进程

生成、读取线程快照

程序资源的实时监控

其他功能:JMX代理连接、远程环境监控、CPU分析和 内存分析

04-eclipse MAT

基本概述:

MAT工具是一款功能强大的Java内存分析器。可用于查找内存泄露以及查看内存消耗情况。

获取dump文件:

dump文件内容:MAT可以分析heap dump文件。在进行内存分析时,只要获得了反映当前设备内存映像的hprof文件,通过MAT打开就可以直观地看到当前的内存信息。一般来说这些信息含有:

所有的对象信息,包括对象实例、成员变量、存储于栈中的基本类型值和存储于堆中的其他对象的引用值。

所有的类信息,包括classloader、类名称、父类、静态变量等。

GCRoot到所有这些对象的引用路径

线程信息,包括线程的调用栈以及线程的线程局部变量(TLS)。

两点说明:

说明1:缺点:MAT不是一个万能工具,它并不能处理所有的堆转储文件。但是比较主流的厂家和格式,例如Sun,HP,SAP所采用的HPROF二进制堆转储文件,以及IBM的PHD堆存储文件都能被很好的解析。

说明2:最吸引人的还是能够快速为开发人员生成内存泄露报表,方便问题定位和分析问题。虽然MAT有如此强大的功能,但是内存分析也没有简单到一键完成的程度,很多内存问题还是需要我们从MAT展现给我们的信息当中通过经验和直觉才能发现。

获取dump文件:

方法1:通过前一章介绍的jmap工具生成,可以生成任意一个java进程的dump文件;

方法2:通过配置JVM参数生成。

选项"-XX:+HeapDumpOutOfMemoryError"或"-XX:+HeapDumpBeforeFullGC"

选项"-XX:HeapDumpPath"所代表的含义就是当程序出现OutOfMemory时,将会在相应的目录下生成一份dump文件。如果不指定选项"XX:HeapDumpPath"则在当前目录下生成dump文件。

对比:考虑到生产环境中几乎不可能在线对其进行分析,大都是采用离线分析,因此使用jmap+MAT工具是最常见的组合。

 方法3:使用VisualVM可以导出dump文件

方法4:使用MAT既可以打开一个已有的堆快照,也可以通过MAT直接从活动Java程序中导出快照。该功能将借助jps列出当前正在运行的Java进程,以供选择并获取快照。

分析堆dump文件:

1.histogram:展示了各个类的实例数目以及这些实例的Shallow heap或Retainedheap的总和

MAT的直方图和jmap的-histo子命令一样,都能够展示各个类的实例数目以及这些实例的Shallow heap总和。但是,MAT的直方图还能计算Retained heap,并支持基于实例数目或Retained heap的排序方式(默认为 Shallow heap)。此外,MAT还可以将直方图中的类按照超类、类加载器或者包名分组。当选中某个类时,MAT界面左上角的Inspector窗口将展示该类Class实例的相关信息,比如类加载器等。

2.thread overview:查看系统中的Java线程;查看局部变量的信息。

3.获得对象相互引用的关系:with outgoing referneces; with incoming references

4.浅堆和深堆:

    shallow heap:浅堆是指一个对象消耗的内存。在32位系统中,一个对象引用会占据4个字节,一个int类型会占据4个字节,long型变量会占据8个字节,每个对象头需要占用8个字节。根据堆快照格式不同,对象的大小可能会向8字节进行对齐。

以String为例子:两个int值共占8字节,对象引用占4字节,对象头占8字节,合计20字节,向8字节对齐,故占24字节(jdk7中)。

这24字节为String对象浅堆大小。它与String的value实际取值无关,无论字符串长度如何,浅堆的大小始终是24字节。

    retained heap:

保留集(Retained Set):

对象A的保留集指当对象A被垃圾回收后,可以释放的所有对象集合(包括对象A本身),即对象A的保留集可以被认为是只能通过对象A被直接访问或间接访问到的所有对象的集合。通俗的说,就是指仅被对象A所持有的对象的集合。

深堆(Retained Heap):

深堆是指对象的保留集中所有的对象的浅堆大小之和。

注意:浅堆指对象本身占用的内存,不包括内部引用对象的大小。一个对象的深堆指只能通过该对象访问到的(直接或间接)所有对象的浅堆之和,及对象被回收后,可以释放的真实空间。 

    补充:对象实际大小

另外一个概念是对象的实际大小。这里,对象的实际大小定义为一个对象所能触及的所有对象的浅堆大小之和,也就是我们通常说的对象大小。与深堆相比,似乎这个在日常开发中更为直观和被人接受,但实际上,这个概念和垃圾回收无关。

下图展示了一个简单的对象引用关系图,对象A引用了C和D,对象B引用了C和E。那么对象A的浅堆大小只是只是A本身,不含C和D,而A的实际大小为A、C、D三者之和。而A的深堆大小是A、D之和,由于C还可以通过对象B访问到,因此不在对象A的深堆范围之内。

   支配树:

支配树(Dominator Tree)

支配树的概念源自图论。

MAT提供了一个称为支配树(Dominator Tree)的对象图。支配树体现了对象实例间的支配关系。在对象引用图中,所有指向对象B的路径都经过对象A,则认为对象A支配对象B。如果对象A是距离对象B最近的支配对象,则认为对象A是对象B路径的直接支配者。支配树是基于对象间的引用图锁建立的,它有以下基本性质:

对象A的子树(所有被对象A支配的对象集合)表示对象A的保留集(retained set),即深堆。

如果对象A支配对象B,那么对象A的直接支配者也支配对象B

支配树的边与对象引用图的边不直接对应。

如下图所示:左图表示对象引用图,右图表示左图对应的支配树。对象A和B由根对象直接支配,由于在到对象C的路径中,可以经过A,也可以经过B,因此对象C的直接支配者也是根对象。对象F与对象D相互引用,因为到对象F的所有路径必然经过对象D,因此,对象D是对象F的直接支配者。而到对象D的所有路径中,必然经过对象C,即使是从对象F到对象D的引用,从根节点出发,也是经过对象C的,所以,对象D的直接支配者为对象C。

同理,对象E支配对象G。到达对象H的可以通过对象D,也可以通过对象E,因此对象D和E都不能支配对象H,而经过对象C既可以到达D也可以到达E,因此对象C为对象H的支配者。

在MAT中,单击工具栏上的对象支配者树按钮,可以打开对象支配者视图。

补充1: 再谈内存泄露

内存泄露的理解与分类:

何为内存泄露(memory leak)?

可达性分析算法来判断对象是否是不再使用的对象,本质都是判断一个对象是否还被引用。那么对于这种情况下,由于代码的实现不同就会出现很多种内存泄露问题(让JVM误以为此对象还在引用中,无法回收,造成内存泄露)。

内存泄露(memory leak)的理解:

严格来说,只有对象不会再被程序用到了,但是GC又不能回收它们的情况,才叫做内存泄露。但实际情况中,可能会出现一些疏忽导致对象的生命周期变得很长甚至导致OOM,也可以叫做宽泛意义上的内存泄露。

对象X引用对象Y,X的生命周期比Y的生命周期长;那么当Y的生命周期结束的时候,X依然引用的Y,这时候,垃圾回收器是不会回收对象Y的;如果对象X还引用着生命周期比较短的A/B/C,对象A又引用着对象a、b、c这样就可能造成大量无用的对象不能被回收,进而占据了内存资源,造成内存泄露,直至内存溢出。

内存泄露和内存溢出的关系:

内存泄露的增多最终会导致内存溢出。

泄露的分类

经常发生:发生内存泄露的代码被多次执行,每执行一次,泄露一块内存。

偶然发生:在某些特定情况下才会发生。

一次性:发生内存泄露的方法只会执行一次。

隐式泄露:一直站着内存不释放,直到执行结束;严格的说这个不算泄露,因为内存释放掉了,但是如果执行时间特别长,也会导致内存耗尽。

Java内存泄露的8种情况:

1.静态集合类

静态集合类,如HashMap、LinkedList等等。如果这些容器为静态的,那么它们的生命周期与JVM程序一致,则容器中的对象在程序结束之前不能被释放,从而造成内存泄露。简单而言,长生命周期的对象持有短生命周期对象的引用,尽管短生命周期的对象不再使用,但是因为长生命周期对象持有它的引用而导致不能被回收。

public class MemoryLeak{

    static List list = new ArrayList();

    public void oomTest(){

        Object obj = new Object();

        List.add(obj);

    }

}

2.单例模式

单例模式,和静态集合导致内存泄露的原因类似,但因为单例的静态特性,它的生命周期和JVM的生命周期一样长,所以如果单例对象持有外部对象的引用,那么这个外部对象也不会回收,那么就会造成内存泄露。

3.内部类持有外部类

内部类持有外部类,如果一个外部类的实例对象的方法返回了一个内部类的实例对象。这个内部类对象被长期持有了,即使那个外部类实例对象不再被使用,但由于内部类持有外部类的实例对象,这个外部类对象将不会被垃圾回收,这也会造成内存泄露。

4.各种连接,如数据库连接、网络连接和IO连接等。

在对数据库进行操作的过程中,首先需要建立与数据库的连接,当不再使用时,需要调用close方法来释放与数据库的连接。只有在连接被关闭后,垃圾回收器才会回收相应的对象。否则,如果在数据库访问过程中,对Connection、Statement或ResultSet不显性的关闭,将会造成大量对象无法回收,从而引起内存泄露。

public static void main(String args[]){

    try{

        Connection conn = null;

        Class.forName("com.mysql.jdbc.Driver");

        conn = DriverManager.getConnection("url", "", "");

        Statement stmt = conn.createStatement();

        ResultSet rs = stmt.executeQuery("...");

    }catch(Exception e){//异常日志


    }finally{

        //关闭结果集 Statement

        //关闭声明的对象 ResultSet

        //关闭连接 Connection

    }

}

5.变量不合理的作用域

变量不合理的作用域。一般而言,一个变量定义的范围可能大于器使用范围,很有可能会造成内存泄露。另一方面,如果没有即时地把对象设置为null,很有可能导致内存泄露的发生。

public class UsingRandom{

    private String msg;

    public void receiveMsg(){

        readFromNet(); //从网络中接受数据保存到msg中

        saveDB();//把数据保存到数据库中

    }

}

如上面这个伪代码,通过readFromNet方法把接受的消息保存在变量msg中,然后调用saveDB方法把msg中的内容保存到数据库中,此时msg已经没用了,由于msg的生命周期与对象的生命周期相同,此时msg还不能回收,因此造成了内存泄露。

实际上这个msg变量可以放在receiveMsg内部,当方法使用完,那么msg的生命周期也就结束,此时就可以回收了。还有一种方法,就是在使用哇msg后,把msg设为null,这样垃圾回收器也会会后msg的内存空间。

6.改变哈希值

改变哈希值,当一个对象被存储进HashSet集合中以后,就不能修改这个对象中的那些参与计算哈希值的字段了。否则,对象修改后的哈希值与最初存储进HashSet集合中的哈希值就不同了,在这种情况下,即使contains方法使用该对象的当前引用作为参数去HashSet集合中检索对象,也将找不到对象的结果。这也会导致无法从HashSet集合中单独删除当前对象,造成内存泄露。

这也是为什么String会被设置为不可变类型,我们可以放心把String存入HashSet,或者把String 当做HashMap的key值;当我们想把自己定义的类保存到散列表的时候,需要保证对象的hashcode不可变。

7.缓存泄露

内存泄露的另一个常见来源是缓存,一旦你把对象放到缓存中,就很容易被遗忘。比如:之前项目再一次上线的时候,应用启动奇慢直至夯死,就是因为代码中会加载一个表中的数据到缓存(内存)中,测试环境只有几百条数据,但是生产环境有几百万的数据。

对于这个问题,可以使用WeakHashMap代表缓存,此种Map的特点是,当除了自身有对key的引用外,此key没有其他引用那么此map会自动丢弃此值。

8.内存泄露的第三个常见来源是监听器和其他回调,如果客户端在你实现的API中注册回调,却没有显示取消,那么就会积聚。需要确保回调立即被当做垃圾回收的最佳方法是只保存它的弱引用,例如将他们保存为WeakHashMap中的键。

你可能感兴趣的:(JVM监控及诊断工具-GUI篇)