概述:引用计数为主,标记清除,分代回收为辅
1引用计数
python程序中创建的所有的对象都是放在一个双向环状循环链表refchain上的
如下对象被创建时,在C语言底层实际结构
name='string'
c语言内底部创建成 [上一个对象,下一个对象,类型,引用个数]
age=18
c语言内底部创建成[上一个对象,下一个对象,类型,引用个数,val=18]
hobby=['篮球', '撸铁',‘玩’]
c语言内底部创建成[上一个对象,下一个对象,类型,引用个数,item=元素, 元素个数]
当python程序运行时,会根据数据类型的不同找到其对应的结构体,根据结构体中的字段来进行创建相关的数据,然后将对象添加到refchain双向链表中
每个对象中有ob_refcnt就是应用计数器,默认为1,当有其他变量引用对象时,引用计数器就会+1
当引用计数器为0时,意味着没人使用这个对象了,这个对象就是垃圾,就会回收
回收步骤:1对象从refchain链表移除 2将对象销毁,内存回收
2 标记清除
为什么要标记清除:为了解决引用计数器循环引用的不足,循环引用可能导致内存泄漏
实现:在python的底层,再维护一个链表,链表中专门放那些可能存在循环引用的对象(list/tuple/dict/set)
在python内部,某种情况下触发,回去扫描可能存在循环引用链表中的每个元素,检查是否是循环引用,如果有,则让双方的引用计数器-1,如果是0,则垃圾回收
3 分代回收
为什么要分代回收:不知道什么情况下触发扫描,可能存在循环引用的链表扫描代价大,每次扫描很久
将可能存在循环引用的对象维护成3个链表
0代:0代中对象个数达到700个扫描一次
1代:0代扫描10次,则1代扫描1次
2代:1代扫描10次,则2代扫描1次
过程:当我们创建了一个对象a=1,这个对象只会加到refchain链表中,而当我们创建了一个可能存在循环引用的对象b=[]一个列表时,这个对象不但会加到refchain链表中,还会加到分带回收的0代链表中,当0代链表中对象达到700个,GC开始扫描,如果是循环引用,那就自减1,减完以后,如果是垃圾,那就自动回收,如果不是垃圾,那就将这些对象升级到1代链表中,就这样扫描一遍,此时0代链表也会记录自己扫描了1次,等到下次0代链表的对象又达到了700个,继续上述步骤,就这样执行了10次,才会触发执行扫描1代链表,1代链表和2代链表中的操作和0代中一样。
4 小结(面试可以这么说)
在python中,维护了一个refchain的双向循环环状链表,这个链表中存储程序创建的所有对象,每种类型的对象中都有一个0b_refcnt引用计数器的值,默认为1,当引用计数器变为0时会进行垃圾回收(对象销毁,refchain中移除)
但是,在python 中,对于那些可以有多个元素组成的对象可能会存在循环引用的问题,为了解决这个问题,python又引入了标记清除和分代回收,在其内部维护了四个链表
refchain
0代 700个对象触发
1代 0代十次执行一次1代
2代 1代十次执行一次2代
当 每个链表达到阈值时,就会触发扫描链表进行标记清除操作,有循环则各自-1,为0时,直接回收,销毁,清除
But, 在上面的垃圾回收机制的步骤中,python提供了优化机制
缓存
小整数对象池
为了避免重复创建和销毁一些常用对象,维护了一个小整数对象池
-5~257的地址内存是一定的,这些对象是pyhton事先帮我们创建好了
free_list(会有大小限制)
当一个对象的引用计数为0时,按理说应该回收,但是python没有回收,而是把这个对象放到了一个free_list中当缓存,以后再去使用时,不在重新开辟内存,而是直接使用free_list
比如现在一个对象V=3.14 ,我现在把他del V, 代表引用计数为0 了,但是这块地址我不会回收,而是放到free_list中,然后我又创建了一个新的对象v1=999,这个对象不会开辟一块新内存,而是直接从free_list中去获取对象,然后把对象内部的数据进行初始化成999,再放到refchain中去,需要注意的是,free_list有大小限制,如果free_list链表满了,当一个对象的引用计数为0时,会直接回收这块地址,而不会放到free_list中进行缓存
float: 维护了free_list长度为100
int:不是基于free_list, 而是维护一个small_list保持常见的数据(小数据池),重复使用不会开辟新的内存
str: 内存将所有的ascii字符缓存起来,以后使用的时候不会反复创建
list: 维护了free_list长度为80
tuple:根据元素个数来维护free_list长度
dict:维护了free_list长度为80