更多好文,可关注公众号【爪哇缪斯】,第一时间好文推送。
一、JVM的架构
1.1> Java程序的跨平台特性
- 在Java虚拟机中执行的指令,我们称之为Java字节码指令。下面显示了同一个Java程序,被编译为一组Java字节码的集合之后,可以通过Java虚拟机运行于不同的操作系统上,它以Java虚拟机为中介,实现了跨平台的特性。
1.2> JVM的基本结构
负责从文件系统或者网络中加载Class信息。
加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中可能还会存放运行时常量池信息,包括:字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)是所有线程共享的。
Java堆是在虚拟机启动的时候建立的,它是Java程序最主要的内存工作区域。几乎所有的Java对象实例和数组都存放于Java堆中。堆空间是所有线程共享的。
Java的NIO库允许Java程序使用直接内存,在NIO被广泛使用后,直接内存的使用也变得非常普通。直接内存是Java堆外的、直接向系统申请的内存空间。访问速度会优于Java堆。它大空间大小只会受操作系统给出的最大内存影响。与Java堆相比,虽然在访问读写上直接内存有较大的优势,但是在内存空间申请时,堆空间的速度远远高于直接内存。结论:直接内存适合内存空间申请次数较少、访问较频繁的场合。
它是线程私有的,它在线程创建的时候被创建。Java栈中保存着栈帧信息、局部变量、方法参数、同时和Java方法的调用、返回密切相关。
它与Java栈非常类似,最大的不同在于Java栈用于Java方法的调用,而本地方法栈则用于Native方法调用。
它是每个线程私有的空间。如果正在执行的方法不是本地方法,PC寄存器就会指向当前正在被执行的指令。如果当前方法是本地方法,那么PC寄存器的值就是undefined。
GC可以对方法区、Java堆和直接内存进行回收。Java堆是GC的工作重点,和C、C++不同,Java中所有的对象空间释放都是隐式的。
是Java虚拟机的最核心组件之一,它负责执行虚拟机的字节码。
1.3> Class类加载
- 我们从事java开发,接触最多的也就是java源文件,但是类是如何被jvm加载执行的呢?我们来看图所示:
1.3.1> Class文件内容
- cafe babe 魔数,唯一作用是确定这个文件是否是一个能被JVM接收的Class文件。
- 0000 次版本号 (Minor Version)
- 0034 主版本号 (Major Version)
- 003a 常量池容量计数器
- 0a00 0e00 2409 ... 常量池(包含:直接引用和符号引用javap -verbose Student)
- 一个Class文件中,包含16个部分,再此我就不一一说了。
1.3.2> ClassLoader对类进行加载
1.3.2.1> 主动加载的4种情况
- 情况1:new一个对象实例的时候。
- 情况2:利用反射或者或者clone的方式。
- 情况3:初始化子类时,父类会被优先初始化。
- 情况4:调用一个类的静态方法时。
1.3.2.2> 类的加载分为5步
通过类的全路径名称,获取类的二进制数据流。解析类的二进制数据流,转化为方法区(永久代or元空间)内部的数据结构。创建java.lang.Class类的实例对象,表示该类型。
它的目的是保证第一步中加载的字节码是合法且符合规范的。
大体分为4步验证
步骤1:格式检查
检查魔数、版本、长度等等。
步骤2:语义检查
抽象方法是否有实现类、是否继承了final类等等编码语义上的错误检查。
步骤3:字节码验证
跳转指令是否指向正确的位置,操作数类型是否合理等。
步骤4:符号引用验证
符号引用的直接引用是否存在
准备阶段是正式为类变量分配内存并设置类变量的初始值阶段,即:在方法区中分配这些变量所使用的内存空间。注意这里所说的初始值概念,比如一个类变量定义为:public static int v = 8080; 实际上变量v在准备阶段过后的初始值为0而不是8080,将v赋值为8080的put static指令是程序被编译后,存放于类构造器方法之中。 但是注意如果声明为:public static final int v = 8080; 在编译阶段会为v生成ConstantValue属性,在准备阶段虚拟机会根据ConstantValue属性将v赋值为8080。
解析阶段是指虚拟机将运行时常量池中的符号引用替换为直接引用的过程。符号引用就是class文件中的:CONSTANT_Class_info、CONSTANT_Field_info、CONSTANT_Method_info 等类型的常量。 (参见1.3.3)
到达这个阶段,类就可以顺利加载到系统中。此时,类才会开始执行Java字节码。初始化阶段是执行类构造器方法的过程。方法是由编译器自动收集类中的类变量的赋值操作和静态语句块中的语句合并而成的。虚拟机会保证子方法执行之前,父类的方法已经执行完毕,如果一个类中没有对静态变量赋值也没有静态语句块,那么编译器可以不为这个类生成()方法。
1.3.3> 符号引用和直接引用
- 在解析阶段会有一个步骤,将运行时常量池当中二进制数据当中的符号引用转化为直接引用的过程。
1.3.3.1> 符号引用
- 以一组符号来描述所引用的目标。
- 符号引用可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可,符号引用和虚拟机的布局无关。
- 为什么要有符号引用?
在编译的时候每个java类都会被编译成一个class文件,但在编译的时候虚拟机并不知道所引用类的地址,所以就用符号引用来代替,而在解析阶段就是为了把这个符号引用转化成为真正的地址的阶段。
1.3.3.2> 直接引用
- 直接引用和虚拟机的布局是相关的,不同的虚拟机对于相同的符号引用所翻译出来的直接引用一般是不同的。
- 如果有了直接引用,那么直接引用的目标一定被加载到了内存中。
- 直接引用可以是:
直接指向目标的指针——指向对象,类变量和类方法的指针;相对偏移量——指向实例的变量,方法的指针;一个间接定位到对象的句柄。
1.3.3.3> 示范例子
- 执行javap -verbose Student.class
二、JMM
- 讲解内存管理,此处是面试关键点,面试官常问的就是JVM内存管理分为几部分?每部分都是做什么的?哪些是线程私有的?哪些是线程共享的?
- Class只有在必须要使用的时候才会被加载。
2.1> 程序计数器(线程私有)
- 是当前线程所执行的字节码的行号指示器,指向虚拟机字节码指令的位置。
- 被分配了一块较小的内存空间。
- 针对于非Native方法:是当前线程执行的字节码的行号指示器。针对于Native方法,则为undefined。
- 每个线程都有自己独立的程序计数器,所以,该内存是线程私有的。
- 这块区域是唯一一个在虚拟机中没有规定任何OutOfMemoryError情况的区域
2.2> 虚拟机栈(线程私有)
- 为执行Java方法服务的,是描述方法执行的内存模型。
- Java栈是线程私有的内存空间。
- 每次函数调用的数据都是通过栈传递的。
- 在Java栈中保存的主要内容为栈帧。它的数据结构就是先进后出。每当函数被调用,该函数就会被入栈,每当函数执行完毕,就会执行出栈操作。而当前栈顶,即为正在执行的函数。
- 每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、帧数据区等信息。
- 栈帧操作示意图——StackFrameTest.java
- 由于每次函数调用都会生成对应的栈帧,从而占用一定的栈空间。因此,如果栈空间不足,那么函数调用自然无法继续进行下去。当请求的栈深度大于最大可用栈深度时,系统就会抛出StackOverflowError栈溢出错误,所以函数嵌套调用的层次在很大程度上由栈的大小决定:栈越大,函数可以支持的嵌套调用次数就越多。
- 可以通过参数-Xss来指定线程的最大栈空间。示例如下所示:
- StackOverflowTest.java
- 设置最大栈内存为-Xss160K,运行结果如下所示:
- 设置最大栈内存为-Xss256K,运行结果如下所示:
2.2.1> 局部变量表
- 局部变量表是栈帧的重要组成部分之一,它用于保存函数的参数以及局部变量。
- 局部变量表中的变量只在当前函数调用中有效,当函数调用结束后,随着函数栈帧的销毁,局部变量表也会随之销毁。
- 由于局部变量表在栈帧中,因此,如果函数的参数和局部变量较多,会使得局部变量表膨胀,从而每一次函数调用就会占用更多的栈空间,最终导致函数的嵌套调用次数减少,如下所示:
- StackOverflow2Test.java
- 设置最大栈内存为-Xss160K,运行结果如下所示:
【解释】StackOverflowTest.java执行同样栈大小,count=850
- 设置最大栈内存为-Xss256K,运行结果如下所示:
【解释】StackOverflowTest.java执行同样栈大小,count=2131
- 使用jclasslib查看局部变量表中的内容
- 在idea中添加jclasslib视图
- 添加后,使用Show Bytecode With Jclasslib查看StackOverflow2Test.java文件
- 查看结果如下所示,表明红框里的参数表示了在Class文件中的局部变量表的内容
2.2.2> 操作数栈
- 操作数栈也是栈帧中重要的内容之一,它主要用于保存计算过程中的中间结果,同时作为计算过程中的变量临时的存储空间。
- 操作数栈也是一个先进后出的数据结构。许多Java字节码指令都需要通过操作数栈进行参数传递。比如下面所示的iadd指令:
【解释】30和15出栈,计算出结果为45后,再入栈。
2.2.3> 帧数据区
- 栈帧还需要一些数据来支持常量池解析、正常方法返回和异常处理等。
- 常量池解析
大部分Java字节码指令需要进行常量池访问。在帧数据区中保存着访问常量池的“指针”,方便程序访问常量池。
当函数返回或者出现异常时,虚拟机必须恢复调用者函数的栈帧,并让调用者函数继续执行下去。对于异常处理,虚拟机必须有一个异常处理表。方便在发生异常的时候找到处理异常的代码。如下所示:
【解释】表示在字节码偏移量0~19字节之间可能抛出任意异常,如果遇到异常,则跳到字节码偏移量为19处执行。
2.2.4> 本地方法栈(线程私有)
2.2.5> 堆(线程共享)
- 运行时数据区,几乎所有的对象都保存在java堆中。
- Java堆是完全自动化管理的,通过垃圾回收机制,垃圾对象会被自动清理,而不需要显示地释放。
- 堆是垃圾收集器进行GC的最重要的内存区域。
- Java堆可以分为:新生代(Eden区、S0区、S1区)和 老年代。
- 在绝大多数情况下,对象首先分配在eden区,在一次新生代GC回收后,如果对象还存活,则会进入S0或S1,之后,每经历过一次新生代回收,对象如果存活,它的年龄就会加一。当对象的年龄达到一定条件后,就会被认为是老年代对象,从而进入老年代。
- 对象在内存中的分配
2.2.6> 方法区/永久代/元空间(线程共享)
2.2.6.1> 方法区
- 逻辑上的东西,是JVM的规范,所有虚拟机必须遵守的。
- 是JVM 所有线程共享的、用于存储类信息,例如:类的字段、方法数据、方法代码、常量池等。
- 方法区的大小决定了系统可以保存多少个类。
2.2.6.2> 永久代(JDK8之前)
设置初始永久代大小。例如:-XX:PermSize=5m
设置最大永久代大小,默认情况下为64MB。例如:-XX:MaxPermSize=5m
- 指内存的永久保存区域,主要存放Class和Meta(元数据)的信息,Class在被加载的时候被放入永久区域,它和存放实例的区域不同,GC不会在主程序运行期对永久区域进行清理。所以这也导致了永久代的区域会随着加载的Class的增多而胀满,最终抛出OOM异常。
- 如果系统使用了一些动态代理,那么有可能会在运行时生成大量的类,从而造成内存溢出。所以,设置合适的永久代大小,对于系统的稳定性是至关重要的。
2.2.6.3> 元空间(JDK8及之后)
设置元空间默认初始大小,默认为20.75MB。例如:-XX:MetaspaceSize=40m
设置最大元数据空间。例如:-XX:MaxMetaspaceSize=40m
- 在Java8中,永久代已经被移除,被一个称为“元数据区”(元空间)的区域所取代。
- 元空间的本质和永久代类似,元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用堆外的直接内存。
- 因此,与永久代不同,如果不指定大小,默认情况下,虚拟机会耗尽所有的可用系统内存。
2.2.6.4> 为什么使用元空间替换永久代?
- 表面上看是为了避免OOM异常。因为通常使用PermSize和MaxPermSize设置永久代的大小就决定了永久代的上限,但是不是总能知道应该设置为多大合适, 如果使用默认值很容易遇到OOM错误。当使用元空间时,可以加载多少类的元数据就不再由MaxPermSize控制, 而由系统的实际可用空间来控制。
- 更深层的原因还是要合并HotSpot和JRockit的代码,JRockit从来没有所谓的永久代,也不需要开发运维人员设置永久代的大小,但是运行良好。同时也不用担心运行性能问题了,在覆盖到的测试中, 程序启动和运行速度降低不超过1%,但是这点性能损失换来了更大的安全保障。由于永久代内存经常不够用或者发生内存泄露,爆出异常 java.lang.OutOfMemoryError: PermGen 。字符串存在永久代中,容易出现性能问题和内存溢出。类及方法的信息等比较难确定其大小,因此对于永久代的大小指定比较困难,太小容易出现永久代溢出,太大则容易导致老年代溢出。永久代会位GC带来不必要的复杂度,而且回收效率偏低。Oracle可能会将HotSpot和JRockit合二为一。
三、垃圾回收算法
3.1> 可触及性
- 什么叫可触及性,就是GC时,是根据它来确定对象是否可被回收的。也就是说,从根节点开始是否可以访问到某个对象,也说明这个对象是否被使用。分为3种状态:
可触及:从根节点开始,可以到达某个对象。
可复活:对象引用被释放,但是可能在finalize()函数中被初始化复活。
不可触及:由于finalize()只会执行一次,所以,错过这一次复活机会的对象,则为不可触及状态。
- 看下面例子:DieAliveObject.java
【解释】
因为finalize()函数有可能发生引用外泄,在无意中复活对象。由于finalize()函数是被系统调用的,调用时间是不明确的,因此不是一个好的资源释放方案,推荐在try-catch-finally语句中进行资源的释放。java.lang.ref.Cleaner和java.lang.ref.PhantomReference提供更灵活和有效的方式,在对象无法再访问时释放资源。
3.2> 引用级别
强引用、软引用、弱引用、虚引用
3.2.1> 强引用
- 上面例子中的两个引用都是强引用,强引用具备以下特点:
强引用可以直接访问目标对象。强引用所指向的对象在任何时候都不会被系统回收,虚拟机宁愿抛出OOM异常,也不会回收强引用所指向的对象。强引用可能导致内存泄漏。
3.2.2> 软引用(SoftReference)
- 软引用是比强引用弱一点的引用类型。
- 一个对象只持有软引用,那么当堆空间不足时,才会被回收。因此,软引用对象不会引起内存溢出。如下所示:
3.2.3> 弱引用(WeakReference)
- 当GC的时候,只要发现存在弱引用,无论系统堆空间是否不足,均会将其回收。如下所示:
3.2.4> 虚引用(PhantomReference)
- 如果对象持有虚引用,其实与没有引用是一样的。虚引用必须和引用队列在一起使用,它的作用是用于跟踪GC回收过程,所以可以将一些资源释放操作放置在虚引用中执行和记录。
- 示例如下所示:
3.2.5> 相关面试题
- 讲完了触及性和引用级别,我们来看一道面试题LocalValueGC.java
3.3> 槽位复用
- 槽位复用例子——LocalValueGC.java,通过jclasslib查看如下:
- 也可以执行javap -verbose LocalValueGC.class查看
3.4> 对象的分配
【解释】
- 并不是所有对象都分配在堆上,除了堆(绝⼤多数对象分配到堆上)以外,还有两个地⽅可以存放对象——栈和TLAB。
如果开启栈上分配,JVM会先进行栈上分配;如果没有开启栈上分配或不符合条件,则会进行TLAB分配;如果TLAB分配不成功且不满足进入老年代的条件,则会在eden区分配;如果对象满足了直接进入老年代的条件,那就直接在老年代分配。
3.4.1> 栈上分配
- 栈上分配是JVM提供的一项优化技术。
- 基本思想如下所示:
对于那些线程私有的对象(即:不可能被其他线程访问的对象),可以将它们打散分配在栈上,而不是分配在堆上。分配在栈上的好处是可以在函数调用结束后自行销毁,而不需要垃圾回收器的介入,从而提高系统的性能。对于大量的零散小对象,栈上分配提供了一种很好的对象分配优化策略,栈上分配速度快,并且可以有效避免GC带来的负面影响,但是由于和堆空间相比,栈空间较小,因此对于大对象无法也不适合在栈上分配。
逃逸分析:逃逸分析的目的是判断对象的作用域是否有可能逃逸出函数体。
标量替换:允许将对象打散分配在栈上。比如:若一个对象拥有两个字段,会将这两个字段视作局部变量进行分配。
- 参数-XX:+DoEscapeAnalysis启用逃逸分析;
【解释】Java SE 6u23版本之后,HotSpot中默认就开启了逃逸分析,可以通过选项-XX:+PrintEscapeAnalysis查看逃逸分析的筛选结果。
- 参数-XX:+EliminateAllocations开启标量替换(默认打开)。
- 参数-XX:-UseTLAB关闭TLAB(默认打开)
- 当关闭栈上分配(即:关闭逃逸分析或标量替换中的任何一个)再次执行的时候,输出如下:
3.4.2> TLAB
- TLAB的全称是Thread Local Allocation Buffer,即线程本地分配缓存区,这是一个线程专用的内存分配区域。
- 由于对象一般会分配在堆上,而堆是全局共享的。因此在同一时间,可能会有多个线程在堆上申请空间。因此,每次对象分配都必须要进行同步(虚拟机采用CAS配上失败重试的方式保证更新操作的原子性),而在竞争激烈的场合分配的效率又会进一步下降。
- JVM使用TLAB来避免多线程冲突,在给对象分配内存时,每个线程使用自己的TLAB,这样可以避免线程同步,提高了对象分配的效率。
- TLAB本身占用Eden区空间,在开启TLAB的情况下,虚拟机会为每个Java线程分配一块TLAB空间。
- 参数-XX:+UseTLAB开启TLAB,默认是开启的。
- TLAB空间的内存非常小,缺省情况下仅占有整个Eden空间的1%,当然可以通过选项-XX:TLABWasteTargetPercent设置TLAB空间所占用Eden空间的百分比大小。
- 由于TLAB空间一般不会很大,因此大对象无法在TLAB上进行分配,总是会直接分配在堆上。TLAB空间由于比较小,因此很容易装满。
- 示例:
【解释】
开启TLAB,默认为开启。
打开TLAB跟踪参数
- -Xcomp(这里只是希望在相对一致的环境中测试)
JVM在第一次使用时会把所有的字节码编译成本地代码,从而带来最大程度的优化。启用对所有函数的JIT
- -XX:-BackgroundCompilation (这里只是希望在相对一致的环境中测试)
禁止后台编译
关闭逃逸分析
在部分商用虚拟机中(如HotSpot),Java程序最初是通过解释器(Interpreter)进行解释执行的,当虚拟机发现某个方法或代码块的运行特别频繁时,就会把这些代码认定为“热点代码”。为了提高热点代码的执行效率,在运行时,虚拟机将会把这些代码编译成与本地平台相关的机器码,并进行各种层次的优化,完成这个任务的编译器称为即时编译器(Just In Time Compiler,下文统称JIT编译器)。
3.4.3> 堆上分配
3.5> 逃逸分析
- 对于线程私有的对象,可以分配在栈上,⽽不是分配在堆上。好处是⽅法执⾏完,对象⾃⾏销毁,不需要gc介⼊。可以提⾼性能。
- ⽽栈上分配的⼀个技术基础(如果关闭逃逸分析或关闭标量替换,那么⽆法将对象分配在栈上)就是逃逸分析。
- 逃逸分析的⽬的是判断对象的作⽤域是否有可能逃逸出函数体。如下所示:
Student student; // 属于逃逸了
public void say1() {
student = new Student();
}
public void say2() {
Student student = new Student(); // 没有逃逸
}
【注意】
- 对于say2()⽅法中的new Student(),jvm就有可能将Student分配在栈上,⽽不是堆上。
- 对于⼤量的零散⼩对象,栈上分配提供了⼀种很好的对象分配优化策略。
- 对于⼤对象,⽆法也不适合在栈上分配。
3.6> 标量替换
即不可被进一步分解的量,——JAVA的基本数据类型就是标量(如:int,long等基本数据类型以及reference类型等)
标量的对立就是可以被进一步分解的量。——JAVA中对象就是可以被进一步分解的聚合量。
条件1> 通过逃逸分析确定该对象不会被外部访问。
条件2> 对象可以被进一步分解,即聚合量。
JVM不会创建该对象,而会将该对象成员变量分解若干个被这个方法使用的成员变量所代替。
这些代替的成员变量在栈帧或寄存器上分配空间。
3.7> 垃圾回收算法
3.7.1> 引用计数法
- 引用计数法是最经典也是最古老的垃圾收集方法,但是由于其固有的循环引用和性能问题,所以JVM并未选择此算法作为垃圾收集器算法。
- 对于一个对象A,只要有任何一个对象引用了A,则A的引用计数器就加1,当引用失效时,引用计数器就减1.只要对象A的引用计数器的值为0,则对象A就不可能再被使用。
- 2> 引用计数器要求在每次因引用产生和消除的时候,需要伴随一个加减法操作,对系统性能会有一定的影响。因此:JVM并未选择此算法作为垃圾回收算法。
3.7.2> 标记清除法
- 标记清除算法是现代垃圾回收算法的思想基础。分为两个阶段:标记阶段和清除阶段。标记清除算法产生最大的问题就是清除之后的空间碎片。如下图所示:
实现简单,与保守式GC算法相兼容(由于保守式GC算法中,对象是不能被移动的。所以,适用于标记-清除算法。)
内存空间碎片化。由于分块不是连续的,因此每次分配都必须遍历空闲链表,找到足够大的分块。如果分配的是大的对象,最糟的情况就是得把空闲链表遍历到最后。标记和清除过程的效率都不高。
它是最基础的GC算法,后续的GC算法都是针对它的缺点进行改良而产生的。JVM回收器中的CMS就是使用的该算法
简单来说,保守式 GC(Conservative GC)指的是“不能识别指针和非指针的GC”。
【优点】
保守式GC的优点在于容易编写语言处理程序。处理程序基本上不用在意GC就可以编写代码。语言处理程序的实现者即使没有意识到GC的存在,程序也会自己回收垃圾。因此语言处理程序的实现要比准确式GC简单。
【缺点】
- 1> 识别指针和非指针需要付出成本
- 2> 错误识别指针会压迫堆。当存在貌似指针的非指针时,保守式GC会把被引用的对象错误识别为活动对象。如果这个对象存在大量的子对象,那么它们一律都会被看成活动对象。因为程序把已经死了的非活动对象看成了活动对象,所以垃圾对象会严重压迫堆。
- 3> 能够使用的GC算法有限
3.7.3> 复制算法
- 将原有内存空间分为两块。每次只使用其中一块内存,例如:A内存,GC时将存活的对象复制到B内存中。然后清除掉A内存所有对象。开始使用B内存。复制算法没有内存碎片,并且如果垃圾对象很多,那么这种算法效率很高。但是它的缺点是系统内存只能使用1/2。如下图所示:
执行效率很高。可以保证回收后的内存空间没有碎片。
内存空间只能使用1/2
因为90%以上的新生代对象生命周期都很短暂,并且GC在新生代回收的特点就是频率高,耗时低,所以:针对以上特点,JVM垃圾收集器都采用复制算法来回收新生代。
- 由于Eden区于S0和S1比例默认是8:1:1,新生代的空间=Eden区+S0/S1=90%,那么浪费的空间也只有10%而已。
- 设置Eden区与Survivior区比例的jvm参数
-XX:SurvivorRatio
-XX:PretenureSizeThreshold
-XX:MaxTenuringThreshold 每次Minor GC,年龄加一岁。tenure:任期。
muse@muse:/Users/muse/Desktop> jinfo -flag SurvivorRatio 11303
-XX:SurvivorRatio=8
muse@muse:/Users/muse/Desktop> jinfo -flag PretenureSizeThreshold 11303
-XX:PretenureSizeThreshold=0 // 默认值是0,意思是不管多大都是先在eden中分配内存
muse@muse:/Users/muse/Desktop> jinfo -flag MaxTenuringThreshold 11303
-XX:MaxTenuringThreshold=15
3.7.4> 标记压缩算法
- 标记压缩算法是一种老年代的回收算法。它首先标记存活的对象,然后将所有存活的对象压缩到内存的一端,然后在清理所有存活对象之外的空间。该算法不会产生内存碎片,并且也不用将内存一分为二。因此,其性价比比较高。如下图所示:
- 由于老年代的对象存活率很高,不容易被消亡,而复制算法不仅存在空间浪费,而且当老年代对象很多的时候,复制对象的效率会非常的低,所以,基于老年代的特性,产生了标记压缩算法。
- 它在标记清除算法的基础上做了优化,和标记清除算法一样,也是首先需要从根节点开始,对所有可达对象做一次标记。但之后,它并不是简单地清理未标记的对象,而是将所有的存活对象压缩到内存的一端,然后,清理边界外所有的空间。这种方法即避免了碎片的产生,又不需要两块相同的内存空间,因此,性价比很高。
3.7.5> 分代算法
- 将堆空间划分为新生代和老年代,根据它们直接的不同特点,执行不同的回收算法,提升回收效率。如下图所示:
- 当前jvm的垃圾回收,都是采用分代收集算法
- 针对新生代由于GC都有大量对象死去被回收,少数存量对象,只需要复制少量对象,就可以完全清除S0/S1的垃圾对象空间。所以采用“复制算法”更为合适;
- 而老年代对象存活率高,每次GC只清除少部分对象,所以采用“标记-清除”和“标记-压缩”算法来回收。
3.7.6> 分区算法
- 将堆空间划分成连续的不同小区间,每个区间独立使用、回收。由于当堆空间大时,一次GC的时间会非常耗时,那么可以控制每次回收多少个小区间,而不是整个堆空间,从而减少一次GC所产生的停顿。如下图所示:
四、垃圾收集器
4.1> 串行回收器
- 串行回收器也叫Serial收集器,是最古老收集器。
- 它在JDK1.3之前是虚拟机新生代收集器的唯一选择。在client模式下,默认是新生代收集器。
- 它是单线程执行回收操作的。它的特点就是,在单核或内核少的计算机来说,有更好的性能表现。它的优点就是简单高效
只使用单线程进行GC;独占式的GC
- 使用-XX:+UseSerialGC可以指定新生代和老年代都是Serial收集器。
【解释】-XX:+PrintCommandLineFlags打印虚拟机显式和隐式参数
【解释】新生代:采用复制算法;老年代:采用标记压缩算法
4.2> 并行回收器
- 将串行回收器多线程化。与串行回收器有相同的回收策略、算法、参数。
4.2.1> ParNew回收器
新生代:使用ParNew回收器
老年代:使用Serial串行回收器
新生代:使用ParNew回收器
老年代:使用CMS回收器
- 是一个新生代的回收器,也是一个独占式的回收器,它与串行回收器唯一不同的,就是它采取并发方式执行GC。
- 大家一定要注意一点,就是在cpu核数少的机器,它的性能很可能比串行回收器差。
- -XX:ParallelGCThreads指定并行GC的线程个数,最好与CPU个数一致,否则会影响垃圾回收性能。
默认情况下,当CPU数量少于等于8个的时候,并行线程数为8个。如果CPU数量大于8,并行线程数量为 3+(5*cpu_nums/8)
4.2.2> ParallelGC回收器(关注吞吐量)
新生代:使用ParallelGC回收器
老年代:使用Serial串行回收器
新生代:使用ParallelGC回收器
老年代:使用ParallelOldGC收器
- 它也是新生代的回收器,也采用的复制算法执行GC回收任务。它与ParNew有一个不同点就是,它提供了一些设置系统吞吐量的参数用来控制GC行为。
- -XX:MaxGCPauseMillis 最大的垃圾收集暂停时间,它是一个大于0的整数,ParallelGC会根据设置的值来调整堆的大小和其他jvm参数,使其把GC停顿时间控制在MaxGCPauseMillis之内,但是,大家要注意,如果将值设置很小,虽然停顿时间小了,却造成初始化的堆也变小了,垃圾回收会变得很频繁。
- -XX:GCTimeRatio 设置吞吐量大小,可设置的值为0~100之间的整数。什么意思呢?就是说它影响的是垃圾回收时间,通过1/(1+n)来计算,假设n=99,那么1/(1+99)=1%,也就是说,系统会花费小于1%的时间用于垃圾回收。
- -XX:+UseAdaptiveSizePolicy 如果你不倾向手动设置上面的参数,可以采用把参数调整交由虚拟机自动设置。
4.2.3> ParallelOldGC回收器(关注吞吐量)
新生代:使用ParallelGC回收器
老年代:使用ParallelOldGC收器
- 它跟ParallelGC相似,也是关注于吞吐量的收集器。
- 从名字看,它比ParallelGC多了个Old,其实就表示它是一个应用于老年代的回收器。
- 可以与ParallelGC搭配使用,即:ParallelGC(新生代收集器)+ ParallelOldGC(老年代收集器)。
- 它采用标记压缩算法进行GC操作。也可以使用-XX:ParallelGCThreads来指定并行GC的线程个数。
4.2.4> CMS回收器(关心系统的停顿时间)
新生代使用ParNew回收器,老年代使用CMS回收器。
- 它的特点是,会关心系统的停顿时间。
- CMS全称为Concurrent Mark Sweep,即:并发标记清除。 它采用的是标记清除算法。也是多线程并发执行器。分为如下六个步骤:
标记根对象
标记所有对象
清理前的准备以及控制停顿时间(可以采用-XX:-CMSPrecleaningEnabled关闭,不进行预清理)
为什么要有预清理?
因为第4步重新标记是独占CPU的,如果YoungGC发生后,立即触发一次重新标记,那么一次停顿时间可能很长,为了避免这种情况,预处理时,会刻意等待一次新生代GC的发生,然后根据历史数据预测下一次YoungGC的时间,在当前时间和预测时间取中间时刻执行重新标记操作,目的就是尽量避免YoungGC与重新标记重叠执行。从而减少一次停顿时间。
修正并发标记数据
清理垃圾(真正的执行垃圾回收)
重置状态等待下次CMS的触发
- 我们可以使用-XX:+UseConcMarkSweepGC来启用CMS
- 那么由于它是多线程回收器,我们可以通过-XX:ConcGCThreads和-XX:PartallelCMSThreads设置并发线程数量
- 也可以通过-XX:CMSInitiatingOccupancyFraction来设置当老年代空间使用量达到某百分比时,会执行CMS。默认68,也就是老年代使用空间达到68%的时候,会执行一次CMS回收。
- 由于CMS采用的是标记清除算法,所以不可避免的就是内存碎片,那么我们可以通过如下两个参数进行解决:
- -XX:+UseCMSCompactAtFullCollection指定GC后,进行一次碎片整理
- -XX:CMSFullGCsBeforeCompaction 指定执行多少次GC后,进行一次碎片整理
4.3> G1回收器
4.3.1> 概述
- G1回收器是JDK1.7正式使用的回收器,它的目标是来取代CMS回收器。
- 它属于分代回收器,也使用了分区算法。
- G1全称Garbage First Garbage Collector。优先回收垃圾比例最高的区域。G1收集器将堆划分为多个区域,每次收集部分区域来减少GC产生的停顿时间。
- -XX:+UseG1GC
标记打开G1收集器开关
1> 它是多个线程同时执行GC操作的,可以最大限度利用多cpu计算能力。
2> 虽然它在初始标记、重新标记和独占清理这三个阶段需要STW。但是,对于整体GC过程来说,是可以与应用程序并行执行的。
3> 它即可以负责年轻代的GC,也可以负责老年代的GC。实现了一个回收器对多代的完全统治。
4> G1不是采用CMS这种标记清除算法,它每次回收都会有效地复制对象,从而减少内存碎片。
5> G1支持分区算法来执行垃圾回收,采取局部回收操作,它对内存进行了划分区域,每次GC收集只针对其中几个区域,极大减少由GC导致的停顿时间。
4.3.2> G1的收集过程
阶段1:新生代GC
- 新生代GC的主要工作就是回收eden区和survivor区。
- 一旦eden区被占满,新生代GC就会启动。回收后,所有的eden区都应该被清空,而survivor区会被收集一部分数据,但是应该至少仍然存在一个survivor区。如下图所示:
阶段2:并发标记周期 (过程与CMS很类似)
标记从根节点直接可到达的对象。
这阶段会伴随一次Young GC,会产生STW(全局停顿),应用程序会停止执行。
由于Young GC的发生,所以初始标记后,eden被清空,存活对象放入Survivor区。然后本阶段,则扫描survivor区,标记可直达老年代的对象。本阶段应用程序可以并行执行。但是,根区域扫描不能和YoungGC同时执行(因为根区域扫描依赖survivor区的对象,而新生代GC会修改这个区域),因此如果恰巧在此时需要进行YoungGC,GC就需要等待根区域扫描结束后才能进行,如果发生这种情况,这次YoungGC的时间就会延长。
用来再次扫描整个堆的存活对象,并做好标记。与CMS类似,该阶段可以被一次Young GC打断。
本阶段也会发生STW,应用程序会停止执行。由于并发标记阶段中,应用程序也是并发执行的,所以本阶段,对标记结果进行最后的修正处理。
本阶段也会发生STW,应用程序会停止执行。它用来计算各个区域的存活对象和GC回收比例,然后进行排序,从而识别出可以用来混合收集的区域。该阶段给出了需要被混合回收的区域并进行了标记,那么在混合收集阶段,是需要这些信息的。
本阶段会去识别并清理那些完全空闲的区域。
阶段3:混合收集
- 在第二步的并发标记周期过程中,虽然有部分对象被回收,但是总体回收比例还是比较低的。
- 由于G1已经明确知道哪些区域含有比较多的垃圾比例,所以就可以针对比例较高的区域进行回收操作。
- G1会优先回收垃圾比例较高的区域,因为这样性价比会比较高。
- 这个阶段叫作混合回收,是因为这段时期,新生代和老年代GC都会同时进行。
- 那么因为新生代GC后,eden区必然被清空,此外被标记为垃圾比例最高的区域也被清理。
- 被清理区域中存活对象就会被移动到其他的区域,这样的好处就是可以减少空间碎片。
阶段4:Full GC(不是一定会执行,看情况来定)
- 由于GC回收过程,是与应用程序并发执行的,所以,如果在吞吐量很大的场景下,回收过程中内存不足,那么就会触发一次Full GC。
4.4> GC设置相关的JVM参数汇总
回收器 |
JVM参数 |
作用 |
ParNew |
-XX:+ParallelGCThreads |
GC时的工作线程数量 |
ParallelOldGC |
ParallelGC |
-XX:MaxGCPauseMillis |
设置最大GC停顿时间 |
-XX:GCTimeRatio |
设置吞吐量大小 |
-XX:+UseAdaptiveSizePolicy |
打开自适应GC策略 |
CMS |
-XX:ConcGCThreads |
GC时的工作线程数量 |
-XX:ParallelCMSThreads |
-XX:CMSInitiatingOccupancyFraction |
默认68,即当老年代68%时执行CMS回收 |
-XX:+UseCMSCompactAtFullCollection |
完成GC后,进行一次内存碎片整理 |
G1 |
-XX:+ParallelGCThreads |
GC时的工作线程数量 |
-XX:MaxGCPauseMillis |
设置最大GC停顿时间 |
-XX:InitiatingHeapOccupancyPercent |
默认45,当堆占用率达到45%,执行并发标记周期 |
五、常用的JVM参数
5.1> 垃圾回收日志
-XX:+PrintGCDetails
- 打印更全面的堆信息(会在每次GC前后分别打印堆的信息)
-XX:+PrintHeapAtGC
- 每次GC发生时,额外输出GC发生的时间(该时间为虚拟机启动后的时间偏移量)
-XX:+PrintGCTimeStamps
-XX:+PrintGCApplicationConcurrentTime
-XX:+PrintGCApplicationStoppedTime
- 跟踪系统内的软引用、弱引用、虚引用和Finallize队列
-XX:+PrintReferenceGC
- 虚拟机允许将GC日志以文件的形式输出(在当前目录下的log文件夹中生成gc.log日志文件)
-Xloggc:log/gc.log
-XX:+PrintVMOptions
-XX:+PrintCommandLineFlags
-XX:+PrintFlagsFinal
5.2> 类加载、类卸载的跟踪
-verbose:class
-XX:+TraceClassLoading
-XX:+TraceClassUnLoad
- 查看当前系统中占用空间最多的对象(在Java控制台按下Ctrl+Break组合键)
-XX:+PrintClassHistogram
5.3> 配置JMM的参数
5.3.1> 堆配置
-Xms30m
-Xmx30m
-Xmn10m
- 设置新生代eden和from/to空间的比例(-XX:SurvivorRatio=eden/from=eden/to)
-XX:SurvivorRatio=8
- 设置老年代和新生代的比例(-XX:NewRatio=老年代/新生代)
-XX:NewRatio=2
5.3.2> 方法区配置
-XX:PermSize=5m
-XX:MaxPermSize=5m
-XX:MaxMetaspaceSize=20m
5.3.3> 栈配置
-Xss20m
5.3.4> 直接内存配置
- 最大可用直接内存(默认为最大堆空间,即:-Xmx)
-XX:MaxDirectMemorySize=200m
5.4> 堆溢出处理
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=/home/muse/logs/a.dump
六、性能监控工具
6.1> Linux
6.1.1> top指令
- 能够实时显示系统中各个进程的资源占用情况。分为两部分:系统统计信息&进程信息。
- 系统统计信息,如下图所示:
【解释】
- Line1:任务队列信息,从左到右依次表示:系统当前时间、系统运行时间、当前登录用户数。Load average表示系统的平均负载,即任务队列的平均长度——1分钟、5分钟、15分钟到现在的平均值。
- Line2:进程统计信息,分别是:正在运行进程数、睡眠进程数、停止的进程数、僵尸进程数。
- Line3:CPU统计信息。us表示用户空间CPU占用率、sy表示内核空间CPU占用率、ni表示用户进程空间改变过优先级的进程CPU占用率。id表示空闲CPU占用率、wa表示待输入输出的CPU时间百分比、hi表示硬件中断请求、si表示软件中断请求。
- Line4:内存统计信息。从左到右依次表示:物理内存总量、已使用的物理内存、空闲物理内存、内核缓冲使用量。
- Line5:从左到右表示:交换区总量、已使用交换区大小、空闲交换区大小、缓冲交换区大小。
【解释】
- PID:进程id
- USER:进程所有者
- PR:优先级
- NI:nice值,负值->高优先级,正值->低优先级
- VIRT:进程使用虚拟内存总量 VIRT=SWAP+RES
- RES:进程使用并未被换出的内存。CODE+DATA
- SHR:共享内存大小
- S:进程状态。
D=不可中断的睡眠状态 R=运行
S=睡眠 T=跟踪/停止 Z=僵尸进程
- %CPU:上次更新到现在的CPU时间占用百分比
- %MEM:进程使用的物理内存百分比
- TIME+:进程使用的CPU时间总计,单位 1/100秒
- COMMAND:命令行
6.1.2> vmstat指令
- 性能监测工具,显示单位均为kb。它可以统计CPU、内存使用情况、swap使用情况等信息,也可以指定采样周期和采用次数。例如:每秒采样一次,共计3次。 vmstat 1 3
【解释】
r表示等待运行的进程数。
b表示处于非中断睡眠状态的进程数。
swpd表示虚拟内存使用情况。
free表示空闲内存量。
buff表示被用来作为缓存的内存。
si表示从磁盘交换到内存的交换页数量。
so表示从内存交换到磁盘的交换页数量。
bi表示发送到块设备的块数,单位:块/秒。
bo表示从块设备接收到的块数。
in表示每秒的中断数,包括时钟中断。
cs表示每秒的上下文切换次数。
us表示用户cpu使用时间。
sy表示内核cpu系统使用时间。
id表示空闲时间。
wa表示等待io时间。
6.1.3> iostat指令
- 可以提供详尽的I/O信息。如果只看磁盘信息,可以使用-d参数。即:Iostat –d 1 3 (每1秒采集一次持续3次)
【解释】
- tps列表示该设备每秒的传输次数。
- Blk_read/s列表示每秒读取块数。
- Blk_wrtn/s列表示每秒写入块数。
- Blk_read列表示读取块数总量。
- Blk_wrtn列表示写入块数总量。
6.2> JDK自带工具
6.2.1> jps列出Java的进程
91275 FireIOTest
91275
91730 FireIOTest a b
91730 day1.FireIOTest
91730 FireIOTest -Xmx512m -XX:+PrintGC -javaagent:/Applications/IntelliJ IDEA.app/Contents/lib/idea_rt.jar=51673:/Applications/IntelliJ IDEA.app/Contents/bin -Dfile.encoding=UTF-8
6.2.2> jstat查看堆中的运行信息
- 执行语法:jstat <-option> [-t] [-h] [ []]
- jstat -class -t 73608 1000 5 查看进程73608的ClassLoader相关信息,每1000毫秒打印1次,一共打印5次,并输出程序启动到此刻的Timestamp数。
- jstat -compiler -t 73608 查看指定进程的编译信息。
- jstat -gc 73608 查看指定进程的堆信息。
- jstat -gccapacity 73608 查看指定进程中每个代的容量与使用情况
- jstat -gccause 73608 显示最近一次gc信息
- jstat -gcmetacapacity 73608 查看指定进程的元空间使用信息
- jstat -gcnew 73608 查看指定进程的新生代使用信息
- jstat -gcnewcapacity 73608 查看指定进程的新生代各区大小信息
- jstat -gcold 73608 查看指定进程的老年代使用信息
- jstat -gcoldcapacity 73608 查看指定进程的老年代各区大小信息
- jstat -gcutil 73608 查看指定进程的GC回收信息
- jstat -printcompilation 73608 查看指定进程的JIT编译方法统计信息
6.2.3> jinfo查看和设置运行中java进程的虚拟机参数
- jinfo -flag MaxTenuringThreshold 73608 查看进程73608的虚拟机参数MaxTenuringThreshold的值
- jinfo -flag +PrintGCDetails 73608 动态添加进程73608的虚拟机参数+PrintGCDetails,开启GC日志打印
- jinfo -flag -PrintGCDetails 73608 动态去除进程73608的虚拟机参数-PrintGCDetails,关闭GC日志打印
6.2.4> jmap用于生成指定java进程的dump文件
- 可以查看堆内对象实例的统计信息,查看ClassLoader信息和finalizer队列信息。
- 执行语法: jmap [option]
- jmap -histo 73608 > /Users/muse/a.txt 输出进程73608的实例个数与合计到文件a.txt中
- jmap -dump:format=b,file=/Users/muse/b.hprof 73608 输出进程73608的堆快照,可使用jhat、visual VM等进行分析
6.2.5> jhat用于分析jmap生成的堆快照
- 命令用于分析jmap生成的堆快照。
- 执行语法: jhat [-stack ] [-refs ] [-port ] [-baseline ] [-debug ] [-version] [-h|-help]
jhat b.hprof
- 分析jmap生成的堆快照b.hprof,http://127.0.0.1:7000通过这个地址查看。OQL(Object Query Language)
6.2.6> jstack用于导出指定java进程的堆栈信息
- 执行语法: jstack [-l]
- jstack -l 73608 > /Users/muse/d.txt 输出进程73608的实例个数与合计到文件d.txt中
- cat /Users/muse/d.txt