目录
一、堆的核心概述
(一)概述
(二)堆空间细分
(三)jvisualvm工具
二、设置堆内存的大小与OOM
三、年轻代与老年代
四、图解对象分配一般过程
五、对象分配特殊过程
六、常用调优工具
七、MinorGC,MajorGC,FullGC
(一)MinorGC的触发条件
(二)老年代GC(MajorGC/FullGC)触发条件
(三)FullGC的触发条件
八、内存分配策略
九、为对象分配内存TLAB
十、小结堆空间的参数设置
十一、堆是分配对象的唯一选择吗
逃逸分析
1、栈上分配
2、同步策略
3、分离对象或标量替换
这次学习的是JVM运行时数据区中的堆内存
1、一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域
2、Java堆区在JVM启动的时候即被创建,其空间大小也就确认了。堆内存的大小是可调节的(可以通过参数调节堆的最大内存和初始内存等)
3、Java虚拟机规范规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的(这里涉及虚拟内存的概念)。
4、所有的线程共享Java堆,在这里还可以划分线程私有的缓冲区(TLAB)
5、“几乎”所有的对象实例都在堆上分配内存(为什么是“几乎”,后面会讲到逃逸分析)
6、数组和对象可能永远不会存储在栈上,因为栈帧中保存引用,引用指向对象或者数组在堆中的位置(为什么是“可能”,逃逸分析可能直接在栈上为对象分配空间,而不用在堆上开辟空间了)
7、方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除。堆是GC执行垃圾回收的重点区域
Java7及之前内存逻辑上分为:
Java8及之后内存逻辑上分为:
不同书籍叫法不一样,看到这些名词知道是同个意思就可以了
- 新生区==新生代==年轻代
- 养老区==老年区==老年代
- 永久区==永久代
可以通过cmd命令行jvisualvm开启,然后在菜单栏工具中安装插件后可以查看GC情况
1、-XX:+PrintGCDetails:可开启打印查看方法区实现
2、-Xms :小秘书表示堆空间的起始内存。
3、-Xmx:小明星表示堆空间的最大内存 超过最大内存将抛出OOM
通常将-Xms和-Xmx两个参数配置相同的值,其目的是为了能够在java垃圾会后清理完堆区后,不需要重新分隔计算堆区的大小,从而提高性能
默认情况下,初始内存大小为物理电脑内存大小/64。最大内存大小为物理电脑内存/4
4、cmd命令
jps命令 查看当前程序运行的进程
jstat 查看JVM在gc时的统计信息 jstat -gc 进程号
Java对象划分为两类:生命周期短和长的。
新生代与老年代空间默认比例1:2,可以通过设置参数来控制
jinfo -flag 关键词 进程号,查看参数设定值
几乎所有的Java对象都是在Eden区被new出来的。
Eden放不了的大对象,直接进入老年代了。
IBM研究表明,新生代80%的对象都是朝生夕死
-Xmn:洗面奶,设置新生代最大内存大小,如果同时设置了新生代比例与此参数冲突,则以此参数为准。
hotspot为什么要分为新生代和老年代?
因为分代的唯一理由就是优化GC的性能。大多数的对象都是朝生夕死,如果没有进行分代,那所有的对象都在一块,GC的时候要找到哪些对象可以回收就需要对所有对象都进行扫描,性能开销较大。而如果分代的话,新创建的对象放到某一地方,当GC的时候先把这块存储“朝生夕死”对象的区域进行回收,这样就能够以较高的效率释放空间。
设置比例不同可能导致的结果
1)新生代设置过小
一是新生代GC次数非常频繁,增大系统消耗;二是导致大对象直接进入旧生代,占据了旧生代剩余空间,诱发Full GC
2)新生代设置过大
一是新生代设置过大会导致老年代过小(堆总量一定),从而诱发Full GC;二是新生代GC耗时大幅度增加
一般说来新生代占整个堆1/3比较合适
3)Survivor设置过小
导致对象从eden直接到达旧生代,降低了在新生代的存活时间
4)Survivor设置过大
导致eden过小,增加了GC频率
另外,通过-XX:MaxTenuringThreshold=n来控制新生代存活时间,尽量让对象在新生代被回收
1、new的对象先放在Eden区,此区有大小限制
2、当创建新对象,Eden空间填满时,会触发Minor GC,将Eden不再被其他对象引用的对象进行销毁。再加载新的对象放到Eden区
3、将Eden中剩余的对象移到幸存者0区
4、再次触发垃圾回收,此时上次幸存者下来的,放在幸存者0区的,如果没有回收,就会放到幸存者1区
5、再次经历垃圾回收,又会将幸存者重新放回幸存者0区,依次类推
6、可以设置一个次数,默认是15次,超过15次,则会将幸存者区幸存下来的转去老年区
-XX:MaxTenuringThreshold=N进行设置
总结:
针对幸存者s0,s1区的总结:复制之后有交换,谁空谁是to
频繁在新生区收集,很少在养老区收集,几乎不在永久区/元空间搜集
触发YGC,幸存者区就会进行回收,不会主动进行回收
超大对象eden放不下,就要看Old区大小是否可以放下。如果Old区放得下,就直接放到Old区。如果也放不下,需要FullGC(MajorGC),这两GC概念还是有区别的。下面详解
针对 HotSpot VM 的实现,它里面的 GC 其实准确分类只有两大种:
部分收集 (Partial GC):
整堆收集 (Full GC):收集整个 Java 堆和方法区。
当年轻代空间不足时,就会触发MinorGC,这里的年轻代指的是Eden满,Survivor满不会触发GC。每次MinorGC会清理年轻代的内存
因为Java对象大多朝生夕灭,所以MinorGC非常频繁。MinorGC会引发STW(stop the world即停止用户线程,让GC线程运行)
指发生在老年代的GC,对象从老年代消失,我们说“MajorGC”“FullGC”发生了
出现了MajorGC,经常会伴随至少一次MinorGC
但是并非绝对,在Parallel Scavenge收集器的收集策略里就直接进行MajorGC的策略选择过程,也就是老年代空间不足,会先尝试触发MinorGC,如果之后空间还不足,则触发MajorGC
MajorGC的速度比MinorGC慢10倍以上,STW的时间更长
如果MajorGC后,内存还不足,就报OOM了
1、调用System.gc()时,系统建议执行FullGC,但是不必然执行
2、老年代空间不足
3、方法区空间不足
4、通过MinorGC后进入老年代的平均大小,大于老年代的可用内存
5、由Eden区,Survivor 0区向Survivor 1区复制时,对象的大小大于ToSpace可用内存,则把改对象转存到老年代,且老年代的可用内存小于该对象的大小
FullGC是开发或调优中尽量要避免的,这样暂停时间会短一些。
1、如果对象再Eden出生并经过第一次MinorGC后仍然存活,并且能被Survivor区容纳,则被移动到Survivor空间中,并将对象年龄设置为1,对象再Survivor区每熬过一次MinorGC,年龄就+1,当年龄增加到一定程度(默认为15,不同Jvm,GC都所有不同)时,就会被晋升到老年代中
可以通过参数 -XX:MaxTenuringThreshold 设置阈值
2、如果大对象Eden放不下,会直接分配到老年代
我们应尽量避免程序中出现过多的大对象
3、动态对象年龄分配
如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代,无需等到MaxTenuringThreshold中要求的年龄
4、空间分配担保机制
通过 -XX:HandlePromotionFailure=true/false 进行设置是否允许担保失败
堆区是线程共享区域,任何线程都可以访问到堆区的共享数据。由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的。为避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度。
于是TLAB(Thread Local Allocation Buffer)出现了
从内存模型而不是垃圾收集的角度,对Eden区域进行划分,JVM为每个线程分配了一个私有缓存区域,包含在Eden空间中
多线程同时分配内存时,使用TLAB可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们将这种内存分配方式称为快速分配策略
1、尽管不是所有的对象实例都能够在TLAB中成功分配内存,但是JVM确实是将TLAB作为内存分配的首选
2、开发人员通过-XX:UseTLAB设置是否开启TLAB空间
3、默认情况下,TLAB空间内存非常小,仅占有整个Eden空间的1%,通过-XX:TLABWasteTargetPercent设置TLAB空间所占用Eden空间的百分比大小
4、一旦对象在TLAB空间分配内存失败,JVM就会尝试通过使用加锁机制确保数据操作的原子性,从而直接在Eden空间中分配内存
随着JIT编译器的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换优化技术,将会导致一些微秒变化,所有对象分配到堆上渐渐变得不那么绝对了。
有一种特殊情况,如果经过逃逸分析后发现,一个对象并没有逃逸出方法的话,那么就可能被优化成栈上分配,这样无需堆上分配,也不需要垃圾回收了,也是最常见的堆外存储技术
逃逸分析的基本行为就是分析对象动态作用域
如果未发生逃逸,将堆分配转为栈分配,如果一个对象在子程序中被分配,要使指向该对象的指针永远不会逃逸,对象可能是栈分配的候选,而不是堆分配
如果一个对象被发现只能从一个线程被访问到,对于这个对象的操作可以不考虑同步
JIT编译器可以借助逃逸分析来判断同步块所使用的的锁对象,是否只能够被一个线程访问,而没有被发布到其他线程。如果没有,那么JIT编译器在编译这个同步块的时候,就会取消对这部分代码的同步。这样就大大提高并发性和性能,这个取消同步的过程就叫同步省略,也叫锁消除
有的对象可能不需要作为一个连续的内存结构存在,也可以被访问到,那么对象的部分(或全部)可以不存储在内存。而是存储在CPU寄存器中
标量是指一个无法再分解的更小的数据的数据。Java中原始数据类型就是标量
可以分解的数据叫聚合量,Java中的对象就是聚合量,因为他可以分解成其他聚合量和标量
标量替换参数:-XX:EliminateAllocations,默认打开