python里也同java一样采用了垃圾收集机制,不过不一样的是: python采用的是引用计数机制为主,标记-清除和分代收集两种机制为辅的策略。
python里每一个东西都是对象,它们的核心就是一个结构体:PyObject。
typedef struct_object {
int ob_refcnt;
struct_typeobject *ob_type;
} PyObject;
PyObject是每个对象必有的内容,其中ob_refcnt就是做为引用计数。当一个对象有新的引用时,它的ob_refcnt就会增加,当引用它的对象被删除,它的ob_refcnt就会减少。
当引用计数为0时,该对象生命就结束了。
引用计数具有实时性:一旦没有引用,内存就直接释放了。不用像其他机制等到特定时机。实时性还带来一个好处:处理回收内存的时间分摊到了平时。
但是遇到循环引用时,如:
class Node:
def __init__(self, val):
self.val = val
n1 = Node("a")
n2 = node("b")
n1.next = n2
n2.prev = n1
n1与n2相互引用,如果不存在其他对象对它们的引用,n1与n2的引用计数也仍然为1,所占用的内存永远无法被回收。
继上述程序,我们的两个节点使用循环引用的方式构成了一个双向链表。此时 a和b 的引用计数值已经增加到了2。这里有两个指针指向了每个节点:首先是 n1 以及 n2,其次是 next 以及 prev。
假定我们的程序不再使用这两个节点了,我们将 n1 和 n2 都设置为null。此时,每个节点的引用计数减少到1。
Python使用一种不同的链表来持续追踪活跃的对象,Python的内部C代码将其称为零代。
每次当你创建一个对象的时候,Python会将其加入零代链表。当到达一定的阈值时,python解释器会把零代链上的所有对象的引用计数减一,生存下来的对象移到一代链上。当零代链清理到一定次数时,一代链上的所有对象的引用计数减一,然后生存下来的对象移到二代链上。当一代链清理到一定次数时,二代链上的所有对象的引用计数减一。
垃圾收集的频率随着“代”的存活时间的增大而减小,也就是说活得越长的对象,就越不可能是垃圾。