python——内存管理和垃圾回收机制

python内存管理和垃圾回收机制

这个知识点是面试时大多都会问到的,所以在此做整理以便加强记忆。

python的内存管理机制主要是为了有针对性地提高代码性能,接下来我们就大致了解一下:

内存管理机制

从较浅的层面来说,python的内存管理有三种:
(1)引用计数;
(2)垃圾回收;
(3)内存池。

1.引用计数

在python中,每个对象都有指向该对象的引用总数——“引用计数”。引用计数是一种非常高效的内存管理手段,当一个python对象被引用时其引用计数增加1,当其不再被引用时引用计数减1,当引用计数等于0时,对象就被删除了。
光用文字表达的话可能显得有些不够直观,在此援引别的网站图片来说明:对于C语言来讲,我们创建一个变量A时就会为该变量申请一个内存空间,并将变量值放入该空间中,当将变量赋给另一变量B时会为B申请一个新的内存空间,并将变量值放入到B的内存空间中,这也是为什么A和B的指针不一致的原因。如图:python——内存管理和垃圾回收机制_第1张图片
而python的情况不一样,其处理方式类似于javascript,
如图所示,变量更像是附在对象上的标签(和引用的定义类似),当变量被绑定在一个对象上的时候,该变量的引用计数就是1,系统会自动维护这些标签,并定时扫描,当某标签的引用计数变为0的时候,该对象就会被回收。
python——内存管理和垃圾回收机制_第2张图片

查看对象的引用计数:sys.getrefcount()
(1)普通引用
我们可以用getrefcount()来查看对象的引用计数。这里需要注意的一点是,当使用某个引用作为参数,传递给getrefcount()时,参数实际上创建了一个临时的引用,所以getrefcount()所得到的结果,总会比期望的多1。

import sys

a = [1,2,3]
num1 = sys.getrefcount(a)
print(num1)

(2)容器对象
Python的一个容器对象(比如表、字典等),可以包含多个对象,容器对象中包含的并不是对象本身,是指向各个元素对象的引用。

(3)引用计数增加
python——内存管理和垃圾回收机制_第3张图片
(4)引用计数减少

python——内存管理和垃圾回收机制_第4张图片

2.垃圾回收

当python中的对象越来越多,占据越来越大内存,启动垃圾回收(garbage collection),将没用的对象清除。

python的垃圾回收机制主要是:采用的是以引用计数机制为主,标记-清除和分代收集(隔代回收)两种机制为辅的策略。

垃圾回收机制主要分为三点:
1)引用计数;
2)标记-清除;
引用计数能够解决大多数垃圾回收的问题,但是遇到两个对象相互引用的情况,del语句可以减少引用次数,但是引用计数不会归0,对象也就不会被销毁,从而造成了内存泄漏问题。针对该情况,Python引入了标记-清除机制。
python——内存管理和垃圾回收机制_第5张图片
python——内存管理和垃圾回收机制_第6张图片

3)分代回收
Python将所有的对象分为0,1,2三代;
所有的新建对象都是0代对象;
当某一代对象经历过垃圾回收,依然存活,就被归入下一代对象。
python——内存管理和垃圾回收机制_第7张图片

3.内存池机制

python——内存管理和垃圾回收机制_第8张图片
python的内存机制以金字塔型,-1,-2层主要有操作系统进行操作;
第0层是C中的malloc,free等内存分配和释放函数进行操作;
第1层和第2层是内存池,有Python的接口函数PyMem_Malloc函数实现,当对象小于256K时有该层直接分配内存;
第3层是最上层,也就是我们对Python对象的直接操作;

Python中所有小于256个字节的对象都使用pymalloc实现的分配器,而大的对象则使用系统的 malloc。另外Python对象,如整数,浮点数和List,都有其独立的私有内存池,对象间不共享他们的内存池。也就是说如果你分配又释放了大量的整数,用于缓存这些整数的内存就不能再分配给浮点数。故可以总结为:
Python以256K为界限分为大内存和小内存:1、大内存使用malloc进行分配;
2、小内存使用内存池进行分配。

你可能感兴趣的:(Python开发菜鸟升级之路,python)