理解java虚拟机内存收集

学习《深入理解Java虚拟机》时个人的理解笔记

1、为什么要去了解垃圾收集和内存回收技术?

当需要排查各种内存溢出、内存泄漏问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,我们就必须对这些“自动化”的技术实施必要的监控和调节。

2、“哲学三问”内存收集

what?when?how?

  1. 那些内存需要回收?
  2. 什么时候回收?
  3. 如何回收?

这是一个整体的问题,确定了什么状态的内存可以回收,才可以在内存“死”掉时及时地回收它们。只有了解了“死”掉内存的特性,才可以确定合理的回收方式。

3、如何确定内存已经“死”掉呢?

在Java的世界,内存承载的都是对象,内存的“死”去,代表着对象的“死”去,即对象不再被需要了(任何途径都再能使用到了)。

这里有两种方式去确定:

3.1、引用计数算法(Reference Counting)

在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零就是不可能再被使用的。

然而:

在Java领域,至少主流的Java虚拟机里面都没有选用引用计数来管理内存,主要原因是,这个看似简单的算法有很多例外情况要考虑,必须要配合大量额外处理才能保证正确地工作,譬如单纯的引用计数就很难解决对象之间相互循环引用的问题。

3.2、可达性分析算法(Reachability Analysis)

基本思路:通过一系列称为“GC Roots”的根对象作为起始节点集,从这些节点开始根据引用关系向下搜索,搜索过程所走过的路径称为“引用链”(Reference Chain),如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象时不可能再被使用的。

Java技术系统下,作为GC Roots的对象:

  1. 在虚拟机栈(栈帧中的本地变量表)中引用的对象,譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。
  2. 在方法区中类静态属性引用的对象,譬如Java类的引用类型静态变量。
  3. 在方法区中常量引用的对象,譬如字符串常量池(String Table)里的引用。
  4. 在本地方法栈中JNI(即通常所说的Native方法)引用的对象。
  5. Java虚拟机内部的引用,如基本数据类型对应的Class对象,一些常驻的异常对象(比如NullPointException、OutOfMemoryError)等,还有系统类加载器。
  6. 所有被同步锁(synchronized关键字)持有的对象。
  7. 反映Java虚拟机内部情况的JMXBean、JVMTI中的注册的回调、本地代码缓存等。

3.3、再谈引用

在JDK1.2以后,java对引用的概念进行了扩充,将引用分为强引用(Strongly Reference)软引用(Soft Reference)弱引用(Weak Reference)虚引用(Phantom Reference)四种。按强度依次逐渐减弱。

  • 强引用是最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似“Object obj = new Object()”这种引用关系。无论任何情况下,只要强引用关系存在,垃圾收集器就永远不会回收掉被引用的对象。
  • 软引用是用来描述一些还有用,但非必须的对象。只被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围内,进行第二次回收。如果回收后还是内存不够,就是抛出内存溢出异常。JDK 1.2 以后 SoftReference 类来实现软引用。
  • 弱引用也是用来描述那些非必须对象,在下次垃圾回收时被回收。JDK 1.2 以后 WeakReference 类来实现。
  • 虚引用也成为“幽灵引用”或者“幻影引用”,它时最弱的一钟引用关系。存在不影响其生存。唯一的功能是在被回收时收到一个系统通知。JDK 1.2 以后 PhantomReference 类来实现虚引用。

4、那些内存需要回收呢?

根据Java虚拟机规范,当一个台Java虚拟机运行起来时,其主要内存区域有如下:

线程共享

  • 方法区(Method Area)
  • 堆(Heap)

线程隔离

  • 虚拟机栈(VM Stack)
  • 本地方法栈(Native Method)
  • 程序计数器(Program Counter Register)

当然还有其他一些,但是这些并不直接和客户程序关联,暂时不关心。

线程隔离的区域,虚拟机栈、本地方法栈、程序计数器在线程产生时写入内存,在线程结束时自动回收,一般不需要太多管理。

线程共享的区域:

  • 方法区

在Java虚拟机规范中没有要求必须实现垃圾收集,本身的回收率也不高。但是也可以进行回收的。其回收的主要内容为:废弃的常量和不再使用的类型。

  • 堆(Heap)

这里才是Java世界中,回收的主要战场。

5、何如进行垃圾收集呢?

从如何判定对象的消亡角度,收集算法可以划分为“引用计数式来垃圾收集(Reference Counting GC)”和“追踪式垃圾收集(Trace Counting GC)”。同判定对象“死亡”一样。我们主要关注在后者。

遵循分代收集理论去设计垃圾收集器。
理论假说:

  1. 弱分代假说(Weak Generational Hypothesis):绝大部分对象都是朝生夕灭的。
  2. 强分代假说(Strong Generational Hypothesis):熬过越多次垃圾收集过程的对象就越难以消灭。

扩展
3. 跨代引用假说(Intergenerational Reference Hypothesis):跨代引用相对于同代引用来说仅占极少数。

基于分代收集理论的三种收集算法。

  • 标记-清除算法
  • 标记-复制算法
  • 标记-整理算法

如下图:

理解java虚拟机内存收集_第1张图片

理解java虚拟机内存收集_第2张图片

6、一句理解垃圾收集

主要发生在堆中,不可达对象,通过收集算法进行回收。

参考

《深入理解Java虚拟机》第三版,周志明著。

你可能感兴趣的:(JVM)