使用命令行工具或组合能帮您获取目标Java应用性能相关的基础信息,但它们存在下列局限:
为此,JDK提供了一些内存泄漏的分析工具,如jconsole,jvisualvm等,用于辅助开发人员定位问题,但是这些工具很多时候并不足以满足快速定位的需求。所以这里我们介绍的工具相对多一些、丰富一些。
图形化综合诊断工具
从Java5开始,在JDK中自带的java监控和管理控制台。
用于对JVM中内存、线程和类等的监控,是一个基于JMX(java management extensions)的GUI性能监控工具。
官方教程:https://docs.oracle.com/javase/7/docs/technotes/guides/management/jconsole.html
启动:jdk/bin目录下,启动jconsole.exe命令即可;不需要使用jps命令来查间
三种连接方式:
Local:使用JConsole连接一个正在本地系统运行的JVM,并且执行程序的和运行JConsole的需要是同一个用户。JConsole使用文件系统的授权通过RMI连接器连接到平台的MBean服务器上。这种从本地连接的监控能力只有Sun的JDK具有。
Remote:使用下面的URL通过RM连接器连接到一个MX代理,service:jmx:rmi:///jndi/rmi://hostName:portNum/jmxrmi。JConsole为建立连接,需要在环境变量中设置mx.remote.credentials:来指定用户名和密码,从而进行授权。
Advanced:使用一个特殊的URL连接JMX代理。一股情况使用自己定制的连接器而不是RMI提供的连接器来连接JMX代理,或者是一个使用JDK1.4的实现了JMX和JMX Rmote的应用。
主要作用:监控内存、监控线程、监控死锁、类加载与虚拟机信息
描述:
首页:VisualVM: Home
安装:
Visual VM的一大特点是支持插件扩展,并且插件安装非常方便。我们既可以通过离线下载插件文件*.nbm,然后在Plugin对话框的已下载页面下,添加已下载的插件。也可以在可用插件页面下,在线安装插件。(这里建议安装上:VisualGC)
插件地址:VisualVM: Plugins Centers
IDEA安装VisualVM Launcher插件:Preferences --> Plugins --> 搜索VisualVM Launcher,安装重启即可。
① 在IDEA中安装插件:
② 配置Idea VisualVM Launcher插件:
连接方式:
本地连接:监控本地ava进程的CPU、类、线程等
远程连接:
1-确定远程服务器的ip地址
2-添加JMX(通过JMX技术具体监控远端服务器哪个Java进程)
3-修改bin/catalina.sh文件,连接远程的tomcat
4-在.../conf中添加jmxremote.access和jmxremote.password文件
5-将服务器地址改为公网ip地址
6-设置阿里云安全策路和防火墙策路
7-启动tomcat,查看tomcat启动日志和端口监听
8-JMX中输入端口号、用户名、密码登录
主要功能:
1-生成/读取堆内存快照
2-查看JVM参数和系统属性
3-查看运行中的虚拟机进程
4-生成/读取线程快照
5-程序资源的实时监控
6-其他功能:JMX代理连接、远程环境监控、CPU分析和内存分析
概述:
MAT(Memory Analyzer Tool)工具是一款功能强大的Java堆内存分析器。可以用于查找内存泄漏以及查看内存消耗情况。
MAT是基于Eclipse开发的,不仅可以单独使用,还可以作为插件的形式嵌入在Eclipse中使用。是一款免费的性能分析工具,使用起来非常方便。大家可以在https://www.eclipse.org/mat/downloads.php下载并使用MAT。
只要确保机器上装有JDK并配置好相关的环境变量,MAT可正常启动。
还可以在Eclipse中以插件的方式安装:
获取堆dump文件:
dump文件内容:MAT可以分析heap dump文件。在进行内存分析时,只要获得了反映当前设备内存映像的hprof文件,通过MAT打开就可以直观地看到当前的内存信息。
一般说来,这些内存信息包含:
两点说明:
说明1(缺点):MAT 不是一个万能工具,它并不能处理所有类型的堆存储文件。但是比较主流的厂家和格式,例如 Sun, HP, SAP 所采用的 HPROF 二进制堆存储文件,以及 IBM 的 PHD 堆存储文件等都能被很好的解析。
说明2:最吸引人的还是能够快速为开发人员生成内存泄漏报表,方便定位问题和分析问题。虽然MAT有如此强大的功能,但是内存分析也没有简单到一键完成的程度,很多内存问题还是需要我们从MAT展现给我们的信息当中通过经验和直觉来判断才能发现。
获取dump文件:
方法一:通过 jmap工具生成,可以生成任意一个java进程的dump文件;
方法二:通过配置JVM参数生成。
对比:考虑到生产环境中几乎不可能在线对其进行分析,大都是采用离线分析,因此使用jmap+MAT工具是最常见的组合。
方法三:使用VisualVM可以导出堆dump文件
方法四:使用MAT既可以打开一个已有的堆快照,也可以通过MAT直接从活动Java程序中导出堆快照。该功能将借助jps列出当前正在运行的 Java 进程,以供选择并获取快照。
分析堆dump文件:
histogram:展示了各个类的实例数目以及这些实例的Shallow heap或Retainedheap的总和。MAT 的直方图和jmap的-histo子命令一样,都能够展示各个类的实例数目以及这些实例的 Shallow heap 总和。但是,MAT 的直方图还能够计算 Retained heap,并支持基于实例数目或 Retained heap 的排序方式(默认为 Shallow heap)。此外,MAT 还可以将直方图中的类按照超类、类加载器或者包名分组。当选中某个类时,MAT 界面左上角的 Inspector 窗口将展示该类的 Class 实例的相关信息,如类加载器等。
thread overview:查看系统中的Java线程、查看局部变量的信息
获得对象相互引用的关系:with outgoing references、with incoming references
浅堆与深堆:
shallow heap:浅堆(Shallow Heap)是指一个对象所消耗的内存。在32位系统中,一个对象引用会占据 4个字节,一个int类型会占据4个字节,long型变量会占据8个字节,每个对象头需要占用8 个字节。根据堆快照格式不同,对象的大小可能会向8字节进行对齐。以String为例:2个int值共占8字节,对象引用占用4字节,对象头8字节,合计20字节,向8字节对 齐,故占24字节。(jdk7中)
这24字节为String对象的浅堆大小。它与String的value实际取值无关,无论字符串长度如何,浅堆大小始终是24字节。
retained heap:
保留集(Retained Set):对象A的保留集指当对象A被垃圾回收后,可以被释放的所有的对象集合(包括对象A本身), 即对象A的保留集可以被认为是只能通过对象A被直接或间接访问到的所有对象的集合。通俗地说,就是指仅被对象A所持有的对象的集合。
深堆(Retained Heap):深堆是指对象的保留集中所有的对象的浅堆大小之和。
注意:浅堆指对象本身占用的内存,不包括其内部引用对象的大小。一个对象的深堆指只能通过该对象访问到的(直接或间接)所有对象的浅堆之和,即对象被回收后,可以释放的真实空间。
补充:对象实际大小:另外一个常用的概念是对象的实际大小。这里,对象的实际大小定义为一个对象所能触及的所有对象的浅堆大小之和,也就是通常意义上我们说的对象大小。与深堆相比,似乎这个在日常开发中更为直观和被人接受,但实际上,这个概念和垃圾回收无关。下图显示了一个简单的对象引用关系图,对象A引用了C和D,对象B引用了C和E。那么对象A的浅堆大小只是A本身,不含C和D,而A的实际大小为A、C、D三者之和。而A的深堆大小为A与D之和,由于对象C还可以通过对象B访问到,因此不在对象A的深堆范围内。
练习:看图理解Retained Size
上图中,GC Roots直接引用了A和B两个对象。A对象的Retained Size=A对象的Shallow Size。B对象的Retained Size=B对象的Shallow Size + C对象的Shallow Size。这里不包括D对象,因为D对象被GC Roots直接引用。如果GC Roots不引用D对象呢?
此时,B对象的Retained Size=B对象的Shallow Size + C对象的Shallow Size + D对象Shallow Size。
案例分析:StudentTrace:
考虑Lily同学:15 个 webpage,每个对应152个字节 15 * 152 = 2280字节 -->即为elementData的实际大小。关心的是elementData的深堆1288是如何计算出来的?能被7整除,且能被3整除,以及能被7整除,且能被5整除的数值有:0,21,42,63,84,35,70 共7个数。7 * 152 = 1064字节;2280 - 1064 + 72 = 1288字节!这72个字节是什么?15个elementData的元素 * 4字节 = 60字节;60 + 8个对象头的字节数 + 4字节 = 72字节。
支配树:支配树的概念源自图论。MAT提供了一个称为支配树(Dominator Tree)的对象图。支配树体现了对象实例间的支配关系。在对象引用图中,所有指向对象B的路径都经过对象A,则认为对象A支配对象B。如果对象A是离对象B最近的一个支配对象,则认为对象A为对象B的直接支配者。支配树是基于对象间的引用图所建立的,它有以下基本性质:
如下图所示:左图表示对象引用图,右图表示左图所对应的支配树。对象A和B由根对象直接支配,由于在到对象C的路径中,可以经过A,也可以经过B,因此对象C的直接支配者也是根对象。对象F与对象D相互引用,因为到对象F的所有路径必然经过对象D,因此,对象D是对象F的直接支配者。而到对象D的所有路径中,必然经过对象C,即使是从对象F到对象D的引用,从根节点出发,也是经过对象C的,所以,对象D的直接支配者为对象C。
同理,对象E支配对象G。到达对象H的可以通过对象D,也可以通过对象E,因此对象D和E都不能支配对象H,而经过对象C既可以到达D也可以到达E,因此对象C为对象H的直接支配者。
在MAT中,单击工具栏上的对象支配树按钮,可以打开对象支配树视图。
下图显示了对象支配树视图的一部分。该截图显示部分Lily学生的history队列的直接支配对象。即当Lily对象被回收,也会一并回收的所有对象。显然能被3或者5整除的网页不会出现在该列表中,因为它们同时被另外两名学生对象引用。
案例:Tomcat堆溢出分析:
说明:Tomcat是最常用的Java Servlet容器之一,同时也可以当做单独的Web服务器使用。Tomcat本身使用Java实现,并运行于Java虚拟机之上。在大规模请求时,Tomcat有可能会因为无法承受压力而发生内存溢出错误。这里根据一个被压垮的Tomcat的堆快照文件,来分析Tomcat在崩溃时的内部情况。
分析过程:
图1:
图2:
图3:sessions对象,它占用了约17MB空间
图4:可以看到sessions对象为ConcurrentHashMap,其内部分为16个Segment。从深堆大小看,每个Segment都比较平均,大约为1MB,合计17MB。
图5:
图6:当前堆中含有9941个session,并且每一个session的深堆为1592字节,合计约15MB,达到当前堆大小的50%。
图7:
图8:
根据当前的session总数,可以计算每秒的平均压力为:9941/(1403324677648-1403324645728)*1000=311次/秒。由此推断,在发生Tomcat堆溢出时,Tomcat在连续30秒的时间内,平均每秒接收了约311次不同客户端的请求,创建了合计9941个session。
介绍
在运行Java的时候有时候想测试运行时占用内存情况,这时候就需要使用测试工具查看了。在eclipse里面有 Eclipse Memory Analyzer tool(MAT)插件可以测试,而在IDEA中也有这么一个插件,就是JProfiler。
JProfiler 是由 ej-technologies 公司开发的一款 Java 应用性能诊断工具。功能强大,但是收费。
官网下载地址:https://www.ej-technologies.com/products/jprofiler/overview.html
特点
主要功能
1-方法调用:对方法调用的分析可以帮助您了解应用程序正在做什么,并找到提高其性能的方法
2-内存分配:通过分析堆上对象、引用链和垃圾收集能帮您修复内存泄漏问题,优化内存使用
3-线程和锁:JProfiler提供多种针对线程和锁的分析视图助您发现多线程问题
4-高级子系统:许多性能问题都发生在更高的语义级别上。例如,对于心BC调用,您可能希望找出执行最慢的SQL语句。JProfiler支持对这些子系统进行集成分析
下载:ej-technologies - Java APM, Java Profiler, Java Installer Builder
安装后,直接启动bin目录下jprofiler.exe命令即可
JProfiler中配置IDEA
选择IDEA 2019
IDEA集成JProfiler
一、安装分为在线安装和离线安装两种方式
方式一:直接在IDEA上下载File–Settings–plugins–Browse repositories ,找到jprofiler然后点击安装。
看到如下图片则说明安装完成
方式二:从官网下载插件
官方下载地址:https://plugins.jetbrains.com/plugin/253-jprofiler
找到对应的版本下载就行。然后把从下载的压缩包解压出来的JProfiler文件夹,copy到IDEA自定义插件目录,默认路径:C:\Users\Administrator.IntelliJIdea2017.2\config\plugins
二、安装完之后,还不能使用,如果不配置OK的话,会一直报错的。
然后启动的时候,就可以使用这个 jprofiler 的插件启动,监测了。
启动项目的时候,他会自动调用你安装的客户端。
数据采集方式
JProfier数据采集方式分为两种:Sampling(样本采集)和Instrumentation(重构模式)
注: JProfiler本身没有指出数据的采集类型,这里的采集类型是针对方法调用的采集类型。因为JProfiler的绝大多数核心功能都依赖方法调用采集的数据, 所以可以直接认为是JProfiler的数据采集类型。
遥感监测Telemetries
遥感监测 Telemetries (查看JVM的运行信息)
内存视图Live Memory
Live memory 内存剖析:class/class instance的相关信息。 例如对象的个数,大小,对象创建的方法执行栈,对象创建的热点。
显示所有加载的类的列表和在堆上分配的实例数。只有Java 1.5 (JVMTI)才会显示此视图。
查看特定时间段对象的分配,并记录分配的调用堆栈。
显示一棵请求树或者方法、类、包或对已选择类有带注释的分配信息的J2EE组件。
显示一个列表,包括方法、类、包或分配已选类的J2EE组件。你可以标注当前值并且显示差异值。对于每个热点都可以显示它的跟踪记录树。
类跟踪视图可以包含任意数量的图表,显示选定的类和包的实例与时间。
分析:内存中的对象的情况
> 频繁创建的Java对象:死循环、循环次数过多
> 存在大的对象:读取文件时,byte[]应该边读边写。-->如果长时间不写出的话,导致byte[]过大
>存在内存泄漏
堆遍历heap walker
Heap walker 堆遍历 :对一定时间内收集的内存对像信息进行静态分析,功能强大且使用。包含对象的outgoing reference, incoming reference, biggest object等。
显示所有类和它们的实例,可以右击具体的类"Used Selected Instance"实现进一步跟踪。
为所有记录对象显示分配树和分配热点。
为单个对象和“显示到垃圾回收根目录的路径”提供索引图的显示功能。还能提供合并输入视图和输出视图的功能。
显示一个对已记录对象的解决时间的柱状图。
显示了一个数量的操作,将分析当前对象集在某种条件下的子集,实质是一个筛选的过程。
你需要在references视图和biggest视图手动添加对象到图表,它可以显示对象的传入和传出引用,能方便的找到垃圾收集器根源。
Ps:在工具栏点击"Go To Start"可以使堆内存重新计数,也就是回到初始状态。
cpu视图cpu views
JProfiler 提供不同的方法来记录访问树以优化性能和细节。线程或者线程组以及线程状况可以被所有的视图选择。所有的视图都可以聚集到方法、类、包或J2EE组件等不同层上。
显示一个积累的自顶向下的树,树中包含所有在JVM中已记录的访问队列。JDBC,JMS和JNDI服务请求都被注释在请求树中。请求树可以根据Servlet和JSP对URL的不同需要进行拆分。
显示消耗时间最多的方法的列表。对每个热点都能够显示回溯树。该热点可以按照方法请求,JDBC,JMS和JNDI服务请求以及按照URL请求来进行计算。
显示一个从已选方法、类、包或J2EE组件开始的访问队列的图。
显示一段时间内记录的方法的调用时间细节。
线程视图threads
JProfiler通过对线程历史的监控判断其运行状态,并监控是否有线程阻塞产生,还能将一个线程所管理的方法以树状形式呈现。对线程剖析。
显示一个与线程活动和线程状态在一起的活动时间表。
显示一个列表,包括所有的活动线程以及它们目前的活动状况。
显示所有线程的堆栈跟踪。
线程分析主要关心三个方面:
1. web容器的线程最大数。比如:Tomcat的线程容量应该略大于最大并发数。
2. 线程阻塞
3. 线程死锁
监视器&锁 Monitors&locks
监控和锁 Monitors & Locks 所有线程持有锁的情况以及锁的信息。
观察JVM的内部线程并查看状态:
案例1:
/**
* 功能演示测试
*/
public class JProfilerTest {
static HashMap map = new HashMap<>();
static int init = 1;
public static void main(String[] args) {
while (true){
ArrayList list = new ArrayList();
for (int i = 0; i < 500; i++) {
Data data = new Data();
list.add(data);
}
try {
TimeUnit.MILLISECONDS.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
class Data{
private int size = 10;
private byte[] buffer = new byte[1024 * 1024];//10kb
private String info = "hello,atguigu";
}
案例2:
package com.atguigu.jprofiler;
import java.lang.reflect.Array;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.concurrent.TimeUnit;
public class MemoryLeak {
public static void main(String[] args) {
while (true) {
ArrayList beanList = new ArrayList();
for (int i = 0; i < 500; i++) {
Bean data = new Bean();
data.list.add(new byte[1024 * 10]);
beanList.add(data);
}
try {
TimeUnit.MILLISECONDS.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
class Bean {
int size = 10;
String info = "hello,atguigu";
static ArrayList list = new ArrayList();
}
背暴
前面,我们介绍了jdk自带的jvisualvm等免费工具,以及商业化工具Jprofiler。
jvisualvm界面
Jprofiler
这两款工具在业界知名度也比较高,他们的优点是可以图形界面上看到各维度的性能数据,使用者根据这些数据进行综合分析,然后判断哪里出现了性能问题。
但是这两款工具也有个缺点,都必须在服务端项目进程中配置相关的监控参数。然后工具通过远程连接到项目进程,获取相关的数据。这样就会带来一些不便,比如线上环境的网络是隔离的,本地的监控工具根本连不上线上环境。并且类似于Jprofiler这样的商业工具,是需要付费的。
那么有没有一款工具不需要远程连接,也不需要配置监控参数,同时也提供了丰富的性能监控数据呢?
今天跟大家介绍一款阿里巴巴开源的性能分析神器Arthas(阿尔萨斯)
概述
Arthas(阿尔萨斯) 是Alibaba开源的Java诊断工具,深受开发者喜爱。在线排查问题,无需重启;动态跟踪Java代码;实时监控JVM状态。
Arthas 支持JDK 6+,支持Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。
当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决:
基于哪些工具开发而来
官方使用文档
官网:Redirecting...
安装
安装方式一:可以直接在Linux上通过命令下载
可以在官方 Github 上进行下载,如果速度较慢,可以尝试国内的码云 Gitee 下载。
wget https://alibaba.github.io/arthas/arthas-boot.jar
wget https://arthas.gitee.io/arthas-boot.jar
安装方式二:也可以在浏览器直接访问https://alibaba.github.io/arthas/arthas-boot.jar,等待下载成功后,上传到Linux服务器上。
卸载
在 Linux/Unix/Mac 平台删除下面文件:
rm -rf ~/.arthas/
rm -rf ~/logs/arthas
Windows平台直接删除user home下面的.arthas和logs/arthas目录
工程目录
arthas-agent:基于JavaAgent技术的代理
bin:一些启动脚本
arthas-boot:Java版本的一键安装启动脚本
arthas-client:telnet client代码
arthas-common:一些共用的工具类和枚举类
arthas-core:核心库,各种arthas命令的交互和实现
arthas-demo:示例代码
arthas-memorycompiler:内存编绎器代码,Fork from https://github.com/skalogs/SkaETL/tree/master/compiler
arthas-packaging:maven打包相关的
arthas-site:arthas站点
arthas-spy:编织到目标类中的各个切面
static:静态资源
arthas-testcase:测试
启动
Arthas 只是一个 java 程序,所以可以直接用 java -jar 运行。执行成功后,arthas提供了一种命令行方式的交互方式,arthas会检测当前服务器上的Java进程,并将进程列表展示出来,用户输入对应的编号(1、2、3、4…)进行选择,然后回车。
方式1:java -jar arthas-boot.jar
# 选择进程(输入[]内编号(不是PID)回车)
[INFO] arthas-boot version: 3.1.4
[INFO] Found existing java process, please choose one and hit RETURN.
* [1]: 11616 com.Arthas
[2]: 8676
[3]: 16200 org.jetbrains.jps.cmdline.Launcher
[4]: 21032 org.jetbrains.idea.maven.server.RemoteMavenServer
方式2:运行时选择 Java 进程 PID
java -jar arthas-boot.jar [PID]
查看进程
查看 PID 的方式可以通过 ps 命令,也可以通过 JDK 提供的 jps命令。
查看运行的 java 进程信息
jps -mlvV
ps -ef| grep java
筛选 java 进程信息
jps -mlvV | grep [xxx]
查看日志
cat ~/logs/arthas/arthas.log
参看帮助
java -jar arthas-boot.jar -h
web console
除了在命令行查看外,Arthas 目前还支持 Web Console。在成功启动连接进程之后就已经自动启动,可以直接访问 http://127.0.0.1:8563/ 访问,页面上的操作模式和控制台完全一样。
退出
最后一行 [arthas@7457]$,说明打开进入了监控客户端,在这里就可以执行相关命令进行查看了。
使用quit\exit:退出当前客户端
使用stop\shutdown:关闭arthas服务端,并退出所有客户端。
基础指令
jvm相关
dashboard:可以查看当前系统的实时数据面板。
常用参数:
-i1000:每次执行间隔时间,这是单位是毫秒
-n4:执行多少次dashboard,不指定的话会一直刷新
可以看到,这里会显示出线程(按照cpu占用百分比倒排)、内存(堆空间实时情况)、GC情况等数据。
thread:查看当前 JVM 的线程堆栈信息
[arthas@49290]$ thread 1 | grep 'main('
at org.apache.zookeeper.server.ZooKeeperServerMain.main(ZooKeeperServerMain.java:55)
at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:81)
[arthas@49290]$
jvm:查看jvm详细的性能数据
地址:jvm | arthas
其它:
sysprop
sysenv
getstatic
heapdump
[arthas@58205]$ heapdump /tmp/dump.hprof
[arthas@58205]$ heapdump --live /tmp/dump.hprof
class/classloader相关
sc:查看 JVM 已加载的类信息
class-pattern 类名表达式匹配
-d 输出当前类的详细信息,包括这个类所加载的原始文件来源、类的声明、加载的ClassLoader等详细信息。如果一个类被多个ClassLoader所加载,则会出现多次
-E 开启正则表达式匹配,默认为通配符匹配
-f 输出当前类的成员变量信息(需要配合参数-d一起使用)
-x 指定输出静态变量时属性的遍历深度,默认为 0,即直接使用 toString 输出
class-pattern支持全限定名,如com.test.AAA,也支持com/test/AAA这样的格式,这样,我们从异常堆栈里面把类名拷贝过来的时候,不需要在手动把/替换为.了。
sc 默认开启了子类匹配功能,也就是说所有当前类的子类也会被搜索出来,想要精确的匹配,请打开options disable-sub-class true开关
示例:sc -d com.atguigu.arthas.OOMTest
sm:查看已加载类的方法信息
class-pattern 类名表达式匹配
method-pattern 方法名表达式匹配
-d 展示每个方法的详细信息
-E 开启正则表达式匹配,默认为通配符匹配
示例:sm -d com.atguigu.arthas.OOMTest main
jad :反编译指定已加载类的源码
mc、redefine:
mc命令:Memory Compiler/内存编译器,编译.java文件生成.class
网站:mc | arthas
示例:mc /tep/Test.java
redefine命令:加载外部的.class文件,redefine jvm已加载的类。
网站:redefine | arthas
推荐使用 retransform 命令
classloader:查看 classloader 的继承树,urls,类加载信息
-t : 查看ClassLoader的继承树
-l : 按类加载实例查看统计信息
-c : 用classloader对应的hashcode 来查看对应的jar urls
monitor/watch/trace相关
monitor:方法执行监控
class-pattern 类名表达式匹配
method-pattern 方法名表达式匹配
-c 统计周期,默认值为120秒
watch:方法执行数据观测
class-pattern 类名表达式匹配
method-pattern 方法名表达式匹配
express 观察表达式
condition-express 条件表达式
-b 在方法调用之前观察(默认关闭)
-e 在方法异常之后观察(默认关闭)
-s 在方法返回之后观察(默认关闭)
-f 在方法结束之后(正常返回和异常返回)观察 (默认开启)
-x 指定输出结果的属性遍历深度,默认为0
#cost 方法执行耗时
trace:方法内部调用路径,并输出方法路径上的每个节点上耗时
网站:trace | arthas
补充说明:
参数说明:
class-pattern 类名表达式匹配
method-pattern 方法名表达式匹配
condition-express 条件表达式
-n 命令执行次数
#cost 方法执行耗时
--skipJDKMethod false 设置trace是否包含jdk里的函数调用。默认为false
stack:输出当前方法被调用的调用路径
class-pattern 类名表达式匹配
method-pattern 方法名表达式匹配
condition-express 条件表达式
-n 执行次数限制
#cost 方法执行耗时
举例:
tt :方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测。
-t 表明希望记录下类 *Test 的 print 方法的每次执行情况。
-n 3 指定你需要记录的次数,当达到记录次数时 Arthas 会主动中断tt命令的记录过程,避免人工操作无法停止的情况。
-s 筛选指定方法的调用信息
-i 参数后边跟着对应的 INDEX 编号查看到它的详细信息
-p 重做一次调用 通过 --replay-times 指定 调用次数,通过 --replay-interval 指定多次调用间隔(单位ms, 默认1000ms)
举例:
表格中的字段说明:
其它
使用>将结果重写到日志文件,使用&指令命令是后台运行,session断开不影响任务执行(生命周期默认为1天)
jobs:列出所有job
kill:强制终止任务
fg:将暂停的任务拉到前台执行
bg:将暂停的任务放到后台执行
grep:搜索满足条件的结果
plaintext:将命令的结果去除ANSI颜色
wc:按行统计输出结果
options:查看或设置Arthas全局开关
profiler:使用async-profiler对应用采样,生成火焰图
解释:
1、profiler/火焰图:支持生成应用热点的火焰图。
action 要执行的操作
actionArg 属性名模式
[i:] 采样间隔(单位:ns)(默认值:10'000'000,即10 ms)
[f:] 将输出转储到指定路径
[d:] 运行评测指定秒
[e:] 要跟踪哪个事件(cpu, alloc, lock, cache-misses等),默认是cpu
profiler start
profiler getSamples
profiler status
profiler stop
默认情况下,生成的结果保存到应用的工作目录下的arthas-output目录。可以通过 --file参数来指定输出结果路径。比如:profiler stop --file /tmp/output.svg
profiler stop --format html
默认情况下,arthas使用3658端口,则可以打开: http://localhost:3658/arthas-output/ 查看到arthas-output目录下面的profiler结果:
点击可以查看具体的结果:
2、options:全局开关。可以获取或设置
网站:options | arthas
历史
在 Oracle 收购 Sun 之前,Oracle 的 JRockit 虚拟机提供了一款叫做 JRockit Mission Control 的虚拟机诊断工具。在Oracle收购Sun之后,Oracle公司同时拥有了Sun Hotspot和JRockit两款虚拟机。根据Oracle对于Java的战略,在今后的发展中,会将JRockit的优秀特性移植到Hotspot上。其中,一个重要的改进就是在Sun的JDK中加入了JRockit的支持。
在Oracle JDK 7u40之后,Mission Control这款工具已经绑定在Oracle JDK中发布。自 Java 11 开始,本节介绍的 JFR 已经开源。但在之前的 Java 版本,JFR 属于 Commercial Feature,需要通过 Java 虚拟机参数-XX:+UnlockCommercialFeatures开启。
如果你有兴趣请可以查看OpenJDK的Mission Control项目。
官网:GitHub - JDKMissionControl/jmc: This mirror is deprecated - please start using https://github.com/openjdk/jmc
启动
Mission Control 位于%JAVA_HOME%/ bin/jmc.exe,打开这款软件。
概述
Java Mission Control(简称 JMC),Java官方提供的性能强劲的工具。是一个用于对 Java 应用程序进行管理、监视、概要分析和故障排除的工具套件。它包含一个 GUI 客户端,以及众多用来收集 Java 虚拟机性能数据的插件,如 JMX Console(能够访问用来存放虚拟机各个子系统运行数据的MXBeans),以及虚拟机内置的高效 profiling 工具 Java Flight Recorder(JFR)。
JMC 的另一个优点就是:采用取样,而不是传统的代码植入技术,对应用性能的影响非常非常小,完全可以开着 JMC 来做压测(唯一影响可能是 full gc 多了)。
功能:实时监控VM运行时的状态
如果是远程服务器,使用前要开 JMX。
-Dcom.sun.management.jmxremote.port=${YOUR PORT}
-Dcom.sun.management.jmxremote
-Dcom.sun.management.jmxremote.authenticate=false
-Dcom.sun.management.jmxremote.ssl=false
-Djava.rmi.server.hostname=${YOUR HOST/IP}
方式:文件 -> 连接 -> 创建新连接, 填入上面 JMX 参数的 host 和 port
Mission Control的界面非常有特色,在默认的界面中,以飞机仪表的视图显示了Java堆使用率、CPU使用率和Live Set+Fragmentation。
Mission Control的一大特点是可以自由设置图标内容。比如,如果希望在飞机仪表面板再增加一个监控项,可以单击右侧的添加按钮“+”,按需添加各种统计图表。
Java Flight Recorder
Java Flight Recorder 是 JMC 的其中一个组件。Java Flight Recorder能够以极低的性能开销收集 Java 虚拟机的性能数据。JFR 的性能开销很小,在默认配置下平均低于 1%。与其他工具相比,JFR 能够直接访问虚拟机内的数据,并且不会影响虚拟机的优化。因此,它非常适用于生产环境下满负荷运行的 Java 程序。
Java Flight Recorder和JDK Mission Control共同创建了一个完整的工具链。JDK Mission Control可对Java Flight Recorder连续收集低水平和详细的运行时信息进行高效,详细的分析。
事件类型:当启用时,JFR 将记录运行过程中发生的一系列事件。其中包括 Java 层面的事件,如线程事件、锁事件,以及 Java 虚拟机内部的事件,如新建对象、垃圾回收和即时编译事件。
按照发生时机以及持续时间来划分,JFR 的事件共有四种类型,它们分别为以下四种。
取样事件的其中一个常见例子便是方法抽样(Method Sampling),即每隔一段时间统计各个线程的栈轨迹。如果在这些抽样取得的栈轨迹中存在一个反复出现的方法,那么我们可以推测该方法是热点方法。
启动方式:
方式1:使用-XX:StartFlightRecording=参数
第一种是在运行目标 Java 程序时添加-XX:StartFlightRecording=参数。比如:下面命令中,JFR 将会在 Java 虚拟机启动 5s 后(对应delay=5s)收集数据,持续 20s(对应duration=20s)。当收集完毕后,JFR 会将收集得到的数据保存至指定的文件中(对应filename=myrecording.jfr)
示例:java -XX:StartFlightRecording=delay=5s,duration=20s,filename=myrecording.jfr,settings=profile MyApp
由于 JFR 将持续收集数据,如果不加以限制,那么 JFR 可能会填满硬盘的所有空间。因此,我们有必要对这种模式下所收集的数据进行限制。
比如:java -XX:StartFlightRecording=maxage=10m,maxsize=100m,name=SomeLabel MyApp
方式2:使用jcmd的JFR.*子命令
通过jcmd来让 JFR 开始收集数据、停止收集数据,或者保存所收集的数据,对应的子命令分别为JFR.start,JFR.stop,以及JFR.dump。
命令:jcmd
上述命令运行过后,目标进程中的 JFR 已经开始收集数据。此时,我们可以通过下述命令来导出已经收集到的数据:
命令:jcmd
最后,我们可以通过下述命令关闭目标进程中的 JFR:
命令:jcmd
方式3:JMC的JFR插件
Java Flight Recorder取样分析:
要采用取样,必须先添加参数:
否则报错:
取样时间默认 1 分钟,可自行按需调整,事件设置选为 profiling,然后可以设置取样 profile 哪些信息,比如:
然后就开始 Profile,到时间后 Profile 结束,会自动把记录下载回来,在 JMC 中展示。
从展示信息中,我们大致可以读到内存和CPU信息、代码、线程和IO等比较重要的信息展示。
代码定位:它可以显示系统中的热点方法和占用的时间,下图显示了占用CPU时间最多的方法调用树信息。
IO详情:在IO页面,还可以看到磁盘文件的读写情况,以及网络Socket的访问情况。下图显示了在记录时间段内,程序通过Socket访问的远程主机以及数据读取次数和数据读取数量。
Flame Graphs(火焰图)
在追求极致性能的场景下,了解你的程序运行过程中cpu在干什么很重要,火焰图就是一种非常直观的展示cpu在程序整个生命周期过程中时间分配的工具。
火焰图对于现代的程序员不应该陌生,这个工具可以非常直观的显示出调用栈中的CPU消耗瓶颈。
网上的关于java火焰图的讲解大部分来自于Brendan Gregg的博客:http://www.brendangregg.com/flamegraphs.html
火焰图 ,简单通过x轴横条宽度来度量时间指标,y轴代表线程栈的层次。
Tprofiler
案例:使用 JDK 自身提供的工具进行 JVM 调优可以将 TPS 由 2.5 提升到 20 (提升了 7 倍),并准确定位系统瓶颈。系统瓶颈有:应用里静态对象不是太多、有大量的业务线程在频繁创建一些生命周期很长的临时对象,代码里有问题。那么,如何在海量业务代码里边准确定位这些性能代码?这里使用阿里开源工具 TProfiler 来定位这些性能代码,成功解决掉了 GC 过于频繁的性能瓶颈,并最终在上次优化的基础上将 TPS 再提升了4 倍,即提升到 100。
TProfiler 配置部署、远程操作、日志阅读都不太复杂,操作还是很简单的。但是其却是能够起到一针见血、立竿见影的效果,帮我们解决了 GC 过于频繁的性能瓶颈。
TProfiler 最重要的特性就是能够统计出你指定时间段内 JVM 的 top method,这些 top method 极有可能就是造成你 JVM 性能瓶颈的元凶。这是其他大多数 JVM 调优工具所不具备的,包括 JRockit Mission Control。JRokit 首席开发者 Marcus Hirt 在其私人博客《Low Overhead Method Profiling with Java Mission Control》下的评论中曾明确指出 JRMC 并不支持 TOP 方法的统计。
TProfiler的下载:https://github.com/alibaba/TProfiler
Btrace:Java运行时追踪工具
常见的动态追踪工具有BTrace、HouseMD(该项目已经停止开发)、Greys-Anatomy(国人开发,个人开发者)、Byteman(JBoss出品),注意Java运行时追踪工具并不限于这几种,但是这几个是相对比较常用的。
BTrace是SUN Kenai云计算开发平台下的一个开源项目,旨在为java提供安全可靠的动态跟踪分析工具。先看一下BTrace的官方定义:
BTrace is a safe, dynamic tracing tool for the Java platform. BTrace can be used to dynamically trace a running Java program (similar to DTrace for OpenSolaris applications and OS). BTrace dynamically instruments the classes of the target application to inject tracing code (“bytecode tracing”)。
简洁明了,大意是一个Java平台的安全的动态追踪工具。可以用来动态地追踪一个运行的Java程序。BTrace动态调整目标应用程序的类以注入跟踪代码(“字节码跟踪”)。
YourKit
JProbe
Spring Insight
案例1:
public class Stack {
private Object[] elements;
private int size = 0;
private static final int DEFAULT_INITIAL_CAPACITY = 16;
public Stack() {
elements = new Object[DEFAULT_INITIAL_CAPACITY];
}
public void push(Object e) {
ensureCapacity();
elements[size++] = e;
}
public Object pop() {
if (size == 0)
throw new EmptyStackException();
return elements[--size];
}
private void ensureCapacity() {
if (elements.length == size)
elements = Arrays.copyOf(elements, 2 * size + 1);
}
}
分析:
上述程序并没有明显的错误,但是这段程序有一个内存泄漏,随着GC活动的增加,或者内存占用的不断增加,程序性能的降低就会表现出来,严重时可导致内存泄漏,但是这种失败情况相对较少。代码的主要问题在pop函数,下面通过这张图示展现,假设这个栈一直增长,增长后如下图所示:
当进行大量的pop操作时,由于引用未进行置空,gc是不会释放的,如下图所示
从上图中看以看出,如果栈先增长,在收缩,那么从栈中弹出的对象将不会被当作垃圾回收,即使程序不再使用栈中的这些队象,他们也不会回收,因为栈中仍然保存这对象的引用,俗称过期引用,这个内存泄露很隐蔽。
解决办法:
public Object pop() {
if (size == 0)
throw new EmptyStackException();
Object result = elements[--size];
elements[size] = null;
return result;
}
一旦引用过期,清空这些引用,将引用置空。
案例2:
public class TestActivity extends Activity {
private static final Object key = new Object();
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
new Thread(){//匿名线程
public void run() {
synchronized (key) {
try {
key.wait();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}.start();
}
}
分析:
解决办法:
1. 使用线程时,一定要确保线程在周期性对象(如Activity)销毁时能正常结束,如能正常结束,但是Activity销毁后还需执行一段时间,也可能造成泄露,此时可采用WeakReference方法来解决,另外在使用Handler的时候,如存在Delay操作,也可以采用WeakReference;
2. 使用Handler + HandlerThread时,记住在周期性对象销毁时调用looper.quit()方法;
MAT支持一种类似于SQL的查询语言OQL(Object Query Language)。OQL使用类SQL语法,可以在堆中进行对象的查找和筛选。
SELECT子句
Select子句:在MAT中,Select子句的格式与SQL基本一致,用于指定要显示的列。Select子句中可以使用“*”,查看结果对象的引用实例(相当于outgoing references)。
SELECT * FROM java.util.Vector v
使用“OBJECTS”关键字,可以将返回结果集中的项以对象的形式显示。
SELECT objects v.elementData FROM java.util.Vector v
SELECT OBJECTS s.value FROM java.lang.String s
在Select子句中,使用“AS RETAINED SET”关键字可以得到所得对象的保留集。
SELECT AS RETAINED SET * FROM com.atguigu.mat.Student
“DISTINCT”关键字用于在结果集中去除重复对象。
SELECT DISTINCT OBJECTS classof(s) FROM java.lang.String s
FROM子句
From子句用于指定查询范围,它可以指定类名、正则表达式或者对象地址。
SELECT * FROM java.lang.String s
下例使用正则表达式,限定搜索范围,输出所有com.atguigu包下所有类的实例
SELECT * FROM "com\.atguigu\..*"
也可以直接使用类的地址进行搜索。使用类的地址的好处是可以区分被不同ClassLoader加载的同一种类型。
select * from 0x37a0b4d
WHERE子句
Where子句用于指定OQL的查询条件。OQL查询将只返回满足Where子句指定条件的对象。Where子句的格式与传统SQL极为相似。
下例返回长度大于10的char数组。
SELECT * FROM char[] s WHERE s.@length>10
下例返回包含“java”子字符串的所有字符串,使用“LIKE”操作符,“LIKE”操作符的操作参数为正则表达式。
SELECT * FROM java.lang.String s WHERE toString(s) LIKE ".*java.*"
下例返回所有value域不为null的字符串,使用“=”操作符。
SELECT * FROM java.lang.String s where s.value!=null
Where子句支持多个条件的AND、OR运算。下例返回数组长度大于15,并且深堆大于1000字节的所有Vector对象。
SELECT * FROM java.util.Vector v WHERE v.elementData.@length>15 AN D v.@retainedHeapSize>1000
内置对象与方法
OQL中可以访问堆内对象的属性,也可以访问堆内代理对象的属性。访问堆内对象的属性时,格式如下:
[
其中alias为对象名称。
访问java.io.File对象的path属性,并进一步访问path的value属性:
SELECT toString(f.path.value) FROM java.io.File f
下例显示了String对象的内容、objectid和objectAddress。
SELECT s.toString(), s.@objectId, s.@objectAddress FROM java.lang.String s
下例显示java.util.Vector内部数组的长度。
SELECT v.elementData.@length FROM java.util.Vector v
下例显示了所有的java.util.Vector对象及其子类型
select * from INSTANCEOF java.util.Vector