在微软公司的COM(Component Object Model)技术、使用ActionScript的FlashPlayer、Python语言和在游戏脚本领域被广泛应用的Squirrel中都使用了引用计数算法进行内存管理。
引用计数算法就是给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就相应减1;当计数器值为0时,对象就是不可能再被使用了,这时候就将这个对象回收掉了。这种算法听起来实现不难,判定的效率也高,但是也存在一些问题,比如他就很难解决对象之间相互循环引用的问题。比如class Obj
中有一个成员属性为Object instance
对象objA与对象objB都有instance字段,然后赋值objA.instance = objB;objB.instance = objA;
它们之间相互引用,但除此之外再无其他任何引用,在引用计数算法中并不会把他们进行回收,实际上这两个对象已经不可能再被访问了。
在一些主流的商用语言(java、C#、Lisp等)的主流实现中,都是称通过可达性分析(Reachability Analysis)来判断对象是否存活的。
可达性分析算法的基本思路就是通过一系列的称为GC Roots
的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到达GC Roots
没有任何引用链相连时,则证明此对象是不可用的,即可回收。
在java语言中,可作为GC Roots的对象包括下面几种:
1.虚拟机栈(栈帧中的本地变量表)中引用的对象。
2.方法区中类静态属性引用的对象。
3.方法区中常量引用的对象。
4.本地方法栈中JNI(即一般说的Native方法)引用对象。
在java中引用分成四种:
强引用就是指在程序代码之中普遍存在的,类似Object obj = new Object();
这类的引用,只要强引用还存在,垃圾收集器就永远不会回收掉被引用的对象。
软引用是用来描述一些还有用但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。使用SoftReference来实现软引用。
弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾回收之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。使用WeakReference类是实现弱引用。
虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。使用PhantomReference类来实现虚引用。
在可达性分析算法中不可达的对象,也不一定马上就会被回收,要真正回收它们至少需要经历两次标记过程:如果对象在进行可达性分析之后发现没有与GC Roots
任何相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过了,虚拟机将这两种情况都视为“没有必要执行”。基本在第二次标记的时候就会被回收掉了。
如果这个对象被判定有必要执行finalize()方法,那么这个对象将会被放置在一个叫做F-Queue的队列之中,并在稍后由一个由虚拟机自动建立的、优先级低的Finalizer线程去执行它。这里所谓的执行是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环(更极端的情况),将很有可能导致F-Queue队列中其他的对象永久处于等待,甚至导致整个内存回收系统崩溃。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量,那么第二次标记时它将被移除回收集合,如果对象这时候还没有逃脱,那基本上就真的被回收了。
下面展示一个使用finalize()自救并存活的例子
public class FinalizeEscapeGC {
public static FinalizeEscapeGC SAVE_HOOK = null;
public void isAlive() {
System.out.println("yes,i am still alive:)");
}
@Override
protected void finalize() throws Throwable {
super.finalize();
System.out.println("finalize mehtod executed");
FinalizeEscapeGC.SAVE_HOOK = this;
}
public static void main(String[] args) throws InterruptedException {
SAVE_HOOK = new FinalizeEscapeGC();
SAVE_HOOK.isAlive();
SAVE_HOOK = null;
System.gc();
Thread.sleep(500);
if(SAVE_HOOK!=null)
SAVE_HOOK.isAlive();
else {
System.out.println("no, i am dead :(");
}
SAVE_HOOK = null;
System.gc();
Thread.sleep(500);
if(SAVE_HOOK!=null)
SAVE_HOOK.isAlive();
else {
System.out.println("no, i am dead :(");
}
}
}
运行结果:
yes,i am still alive:)
finalize mehtod executed
yes,i am still alive:)
no, i am dead :(
通过这个程序我们可以看在第一次SAVE_HOOK = null;
进行gc回收的时候,GC调用了finalize()方法,导致对象再回收前成功逃脱。
在第二次SAVE_HOOK = null;
进行gc回收的时候,对象的finalize()已经被GC调用过一次了,所以不会再次被调用,至此对象被回收掉了。
但是finalize()是不建议使用的,它仅仅是java诞生时为了使C/C++程序员更容易接受做出的一个妥协,它的运行代价昂贵,不确定大且无法保证各个对象的调用顺序。