回顾了一下三年多前写的文章https://www.ibm.com/developerworks/cn/java/j-lo-langref/,发现还是有一些错误之处,转载于此,并一并改正。
概述
Java.lang.ref 是 Java 类库中比较特殊的一个包,它提供了与 Java 垃圾回收器密切相关的引用类。这些引用类对象可以指向其它对象,但它们不同于一般的引用,因为它们的存在并不防碍 Java 垃圾回收器对它们所指向的对象进行回收。其好处就在于使用者可以保持对使用对象的引用,同时 JVM 依然可以在内存不够用的时候对使用对象进行回收。因此这个包在用来实现与缓存相关的应用时特别有用。同时该包也提供了在对象的“可达”性发生改变时,进行提醒的机制。本文通过对该包进行由浅入深的介绍与分析,使读者可以加深对该包的理解,从而更好地利用该包进行开发。
java.lang.ref 包的介绍
我们可以先来看一下 java.lang.ref 这个包的结构,如下图所示:
该包中各类的继承关系如下图所示:
Reference 是一个抽象类,而 SoftReference,WeakReference,PhantomReference 以及 FinalReference 都是继承它的具体类。接下来我们来分别介绍和分析强引用以及 java.lang.ref 包下各种虚引用的特性及用法。
StrongReference, SoftReference, WeakReference 以及 PhantomReference 的特性及用法
StrongReference:
我们都知道 JVM 中对象是被分配在堆(heap)上的,当程序运行中不再有引用指向这个对象时,这个对象就可以被垃圾回收器所回收。这里所说的引用也就是我们一般意义上申明的对象类型的变量(如 String, Object, ArrayList 等),区别于原始数据类型的变量(如 int, short, long 等)也称为强引用。
我们一般都是使用强引用来对对象进行引用。如:
String tag = new String("T");
此处的 tag 就称为强引用。而强引用有以下特征:
- 强引用可以直接访问目标对象。
- 强引用所指向的对象在任何时候都不会被系统回收。
- 强引用可能导致内存泄漏。
我们接下来要讨论的三种 Reference 较之于强引用而言都属于“弱引用”,也就是他们所引用的对象只要没有强引用,就会根据条件被 JVM 的垃圾回收器所回收,它们被回收的时机以及用法各不相同。下面分别来进行讨论。
SoftReference:
SoftReference 在“弱引用”中属于最强的引用。SoftReference 所指向的对象,当没有强引用指向它时,会在内存中停留一段的时间,垃圾回收器会根据 JVM 内存的使用情况(内存的紧缺程度)以及 SoftReference 的 get() 方法的调用情况来决定是否对其进行回收。(后面章节会用几个实验进行阐述)
具体使用一般是通过 SoftReference 的构造方法,将需要用弱引用来指向的对象包装起来。当需要使用的时候,调用 SoftReference 的 get() 方法来获取。当对象未被回收时 SoftReference 的 get() 方法会返回该对象的引用。如下:
SoftReference<Bean> bean = new SoftReference<Bean>(new Bean("name", 10)); System.out.println(bean.get());// “name:10”
软引用有以下特征:
- 软引用使用 get() 方法取得对象的引用从而访问目标对象。
- 软引用所指向的对象按照 JVM 的使用情况(Heap 内存是否临近阈值)来决定是否回收。
- 软引用可以避免 Heap 内存不足所导致的异常。
当垃圾回收器决定对其回收时,会先清空它的 SoftReference,也就是说 SoftReference 的 get() 方法将会返回 null,然后再调用对象的 finalize() 方法,并在下一轮 GC 中对其真正进行回收。
WeakReference:
WeakReference 是弱于 SoftReference 的引用类型。弱引用的特性基本与软引用相似,区别就在于弱引用所指向的对象只要满足进行系统垃圾回收的条件(没有强引用),不管内存使用情况如何,永远对其进行回收(get() 方法返回 null)。
完全可以通过和 SoftReference 一样的方式来操作 WeakReference,这里就不再复述。
弱引用有以下特征:
- 弱引用使用 get() 方法取得对象的引用从而访问目标对象。
- 一旦系统内存回收,无论内存是否紧张,弱引用指向的对象都会被回收。
- 弱引用也可以避免 Heap 内存不足所导致的异常。
PhantomReference:
PhantomReference 是所有“弱引用”中最弱的引用类型。不同于软引用和弱引用,虚引用无法通过 get() 方法来取得目标对象的引用从而使用目标对象,观察源码可以发现 get() 被重写为永远返回 null。
那虚引用到底有什么作用?其实虚引用主要被用来跟踪对象被垃圾回收的状态,通过查看引用队列中是否包含对象所对应的虚引用来判断它是否即将被垃圾回收,从而采取行动。它并不被期待用来取得目标对象的引用,而目标对象被回收前,它的虚引用会被放入一个 ReferenceQueue 对象中,从而达到跟踪对象垃圾回收的作用。
所以具体用法和之前两个有所不同,它必须传入一个 ReferenceQueue 对象。当虚引用所引用对象被垃圾回收后,虚引用会被添加到这个队列中:
public static void main(String[] args) { ReferenceQueue<String> refQueue = new ReferenceQueue<String>(); PhantomReference<String> referent = new PhantomReference<String>( new String("T"), refQueue); System.out.println(referent.get());// null System.gc(); System.runFinalization(); System.out.println(refQueue.poll() == referent); //true }
值得注意的是,对于对象回收方面,虚引用由于无法通过get()得到对象的引用,所以还是需要使用强引用来使用对象,因而不会自动根据内存情况对目标对象回收,Client 需要自己对其进行处理以防 Heap 内存不足异常。
虚引用有以下特征:
- 虚引用永远无法使用 get() 方法取得对象的引用从而访问目标对象。
- 虚引用所指向的对象在被系统内存回收前,虚引用自身会被放入 ReferenceQueue 对象中从而跟踪对象垃圾回收。
- 虚引用不会根据内存情况自动回收目标对象。
另外值得注意的是,其实 SoftReference, WeakReference 以及 PhantomReference 的构造函数都可以接收一个 ReferenceQueue 对象。当 SoftReference 以及 WeakReference 被清空的同时,也就是 Java 垃圾回收器准备对它们所指向的对象进行回收时,调用对象的 finalize() 方法之前,它们自身会被加入到这个ReferenceQueue对象
中,此时可以通过 ReferenceQueue 的 poll() 方法取到它们。而 PhantomReference 只有当 Java 垃圾回收器对其所指向的对象真正进行回收时,会将其加入到这个ReferenceQueue 对象
中,这样就可以追综对象的销毁情况。
各种引用类型总结
下表对于各种引用类型的特征进行了小结:
引用类型 | 取得目标对象的方式 | 垃圾回收条件 | 是否可能内在泄漏 |
强引用 | 直接引用 | 不回收 | 可能 |
软引用 | 通过get()方法 | 无强引用时,视内存情况及get()调用情况回收 | 不可能 |
弱引用 | 通过get()方法 | 无强引用时,永远回收 | 不可能 |
虚引用 | 无法取得 | 无强引用时,永远回收 | 不可能 |
注意:
如果想使用这些相对强引用来说较弱的引用来进行对象操作的时候,就必须保证没有强引用指向被操作对象。否则将会被视为强引用指向,不会具有任何的弱引用的特性。
FinalReference 以及 Finzlizer
FinalReference 和 Finalizer 在java.lang.ref 里是package权限的类,不被公开。因为他们都是被JVM用来执行与内存相关的一些操作。FinalReference内仅有一个构造函数,调用父类构造函数进行初始化。而Finalizer是它的继承类,当JVM在生成一个Object时,如果它的finalize()方法被覆盖了, 并且不为空时,JVM实际上会调用Finalizer的register方法:
/* Invoked by VM */ static void register(Object finalizee) { new Finalizer(finalizee); }
这里finalizee就是新生成的对象。而Finalizer构造函数,会在一个静态成员中保存所有新生成的Fianlizer的引用:
private Finalizer(Object finalizee) { super(finalizee, queue); add(); } private void add() { synchronized (lock) {//当多线程同时产生新Object时防止遗漏,所以要同步。 //unfinalized是Finalizer的静态成员,记录了所有新生成并没有执行过引用对象的finalize方法的Finalizer的instance if (unfinalized != null) { this.next = unfinalized; unfinalized.prev = this; } unfinalized = this; } }
所以那些覆写了finalize()方法的Object,都会(间接地)被Finalizer这个类的静态变量引用。所以当它们没有强引用时不会被JVM立即回收,但如同别的Reference一样,Finalizer指向的Object在没有强引用时,JVM(在GC时)会将这些Finalizer放入他们的ReferenceQueue中。而Finalizer这个类在初始化时,会启动一些守护线程(FinalizerThread):
static { ThreadGroup tg = Thread.currentThread().getThreadGroup(); for (ThreadGroup tgn = tg; tgn != null; tg = tgn, tgn = tg.getParent()); Thread finalizer = new FinalizerThread(tg); finalizer.setPriority(Thread.MAX_PRIORITY - 2); finalizer.setDaemon(true); finalizer.start(); } private static class FinalizerThread extends Thread { private volatile boolean running; FinalizerThread(ThreadGroup g) { super(g, "Finalizer"); } public void run() { if (running) return; running = true; for (;;) { try { Finalizer f = (Finalizer)queue.remove(); f.runFinalizer(); } catch (InterruptedException x) { continue; } } } }
可以看到,守护线程会一直监控Finalizer的ReferenceQueue,将被JVM移入Queue中的Finalizer取出,执行它们所指向的Object的finalize()方法,并将它们从Finalizer维护的静态链表(unfinalized对象)
中移除,从而使他们以及他们所指向的对象可以在下个GC中被回收:
private void runFinalizer() { synchronized (this) { if (hasBeenFinalized()) return; remove(); } try { Object finalizee = this.get(); if (finalizee != null && !(finalizee instanceof java.lang.Enum)) { invokeFinalizeMethod(finalizee); /* Clear stack slot containing this variable, to decrease the chances of false retention with a conservative GC */ finalizee = null; } } catch (Throwable x) { } super.clear(); }
而System.runFinalizer()会调用Runtime.getRuntime().funFinalization()从而调用Finalizer.runFinalization()。Finalizer的这个方法作用和FinalizerThread完全一样。
StrongReference, SoftReference, WeakReference 以及 PhantomReference 的各种特性实验分析
为了更好地描述它们的特性,先以表格进行归纳,再以示例程序加以说明。
- JVM 使用 Oracle 的 Java SE6
- 首先将 JVM 运行环境的初始以及最大 Heap 数设到最低以便更明显地看出结果:
public static void main(String[] args) { Bean bean = new Bean("name", 10); System.gc(); System.runFinalization(); System.out.println(bean);// “name:10” }总结:强引用所指向的对象在任何时候都不会被系统回收。
public static void main(String[] args) { SoftReference<Bean> bean = new SoftReference<Bean>(new Bean("name", 10)); System.gc(); System.runFinalization(); System.out.println(bean.get());// “name:10” }总结:弱引用所指向的对象只要进行 GC,就会自动进行回收, get() 返回 null。
public static void main(String[] args) { Bean[] referent = new Bean[100000]; for (int i=0;i<referent.length;i++){ referent[i] = new Bean("mybean:" + i,100);// 抛 Exception } }总结:在新生成 100000 个 Bean 对象时,由于强引用永远不会被系统回收,当 Heap 使用量达到 2m 时,系统就会报出 Heap 不足的异常。
public static void main(String[] args) { Reference<Bean>[] referent = new SoftReference[100000]; for (int i=0;i<referent.length;i++){ referent[i] = new SoftReference<Bean>(new Bean("mybean:" + i,100)); } System.out.println(referent[100].get());// “null” }
总结:在新生成 100000 个 Bean 对象时,由于软引用会视内存使用情况来判断是否自动回收,所以当 Heap 使用量达到 2m 时,系统自动回收最前面生成的对象,取第 100 个对象时,返回为 null。
public static void main(String[] args) { Reference<Bean>[] referent = new WeakReference[100000]; for (int i=0;i<referent.length;i++){ referent[i] = new WeakReference<Bean>(new Bean("mybean:" + i,100)); } System.out.println(referent[100].get());// “null” }总结:WeakReference 指向的对象在内存不够用时会自动回收。取第 100 个对象时,返回为 null。