Python学习 day12-2021.3.10(Python垃圾回收机制)


Python入门课程系列:

  • Python学习 day1:认识Python
  • Python学习 day2:判断语句与循环控制
  • Python学习 day3:高级数据类型
  • Python学习 day4:函数基础
  • Python学习 day5:函数
  • Python学习 day6:内置函数
  • Python学习 day7:面向对象基础·上
  • Python学习 day8:面向对象基础·中
  • Python学习 day9:面向对象基础·下
  • Python学习 day10:飞机大战游戏
  • Python学习 day11:文件操作与模块

程序的垃圾回收
电脑运行一段时间会变慢,对于这种情况有很多处理方法,比如:
1.关掉不用的程序
2.结束一些进程
3.关闭一些服务
4.重启电脑
我们会发现,重启的效果是最明显的,原因就在于,程序永远不会完美,通过前三张方式无法释放内存资源,而垃圾回收就是为了尽可能的使程序完美。

1. 引用计数机制(重点)

概述:
垃圾回收 Garbage collection (GC)
现在的高级语言如java、c#等,都采用了垃圾收集机制,而不再是c、c++里用户自己管理维护内存的方式。自己管理内存极其自由,可以任意申请内存,但如同一把双刃剑,为大量内存泄漏、悬空指针等bug埋下隐患。
对于一个字符串、列表、类甚至数值都是对象,且定位简单易用的语言,自然不会让用户去处理如何分配回收内存的问题。
python里也同java一样采用了垃圾回收机制,不过不一样的是:python采用的是引用计数机制为主,标记-清除分代收集两种机制为辅的策略。

引用计数原型:
python里每个东西都是对象,它们的核心就是一个结构体:PyObject

PyObject是每个对象必有的内容,其中ob_refcnt就是做为引用计数。当一个对象有新的引用时,它的ob_refcnt就会增加 ,但引用它的对象被删除,它的ob_refcnt就会减少。


当引用计数为0时,该对象生命就结束了。

import sys #导入系统模块
a=[]
print(sys.getrefcount(a)) #通过sys.getrefcount函数查看引用的数量
#2
b=a
print(sys.getrefcount(a)) #print执行完就会释放掉
#3
引用计数优点:
  1. 简单
  2. 实时性:一旦没有引用,内存就直接释放了。不用像其他机制需要等到特定时机。实时性还带来一个好处:处理回收内存的时间分摊到了平时
引用计数缺点:
  1. 维护引用计数会耗费资源
  2. 循环引用
list1=[]
list2=[]
list1.append(list2)
list2.append(list1)

list1和list2相互引用,如果不存在其他对象对它们的引用,list1和list2的引用计数也仍然为1,所占的内存永远无法被回收,这将是致命的。
对于如今的强大软件,缺点1尚可接受。但是循环阴影导致内存泄露,注定python还将引入新的回收机制(标记清除和分代收集)。

2. Python中的循环数据结构及引用计数(难点)

import sys
import psutil 
import os
def showMemSize(tag):
    pid=os.getpid() #得到进程id
    p=psutil.Process(pid) #通过进程id得到进程对象
    info=p.memory_full_info() #进程占用的内存信息
    memory=info.uss/1024/1024 #进程占用的内存大小,将字节转化为MB
    print('{} memory used:{}MB'.format(tag,memory))
    pass
#验证循环引用的情况
def func():
    showMemSize('初始化')
    a=[i for i in range(1000000)]
    b=[i for i in range(1000000)]
    a.append(b)
    b.append(a)
    showMemSize('创建列表对象a b之后')
    print(sys.getrefcount(a))
    print(sys.getrefcount(b))
    pass
func()
showMemSize('完成时候的')
# 初始化 memory used:5.74609375MB
# 创建列表对象a b之后 memory used:88.43359375MB
# 3
# 3
#完成时候的 memory used:88.47265625MB
import sys
import psutil
import os
import gc
def showMemSize(tag):
    pid=os.getpid()
    p=psutil.Process(pid)
    info=p.memory_full_info()
    memory=info.uss/1024/1024
    print('{} memory used:{}MB'.format(tag,memory))
    pass
def func():
    showMemSize('初始化')
    a=[i for i in range(1000000)]
    b=[i for i in range(1000000)]
    a.append(b)
    b.append(a)
    showMemSize('创建列表对象a b之后')
    pass
func()
gc.collect() #❗️手动调用垃圾回收功能 
showMemSize('完成时候的')
#初始化 memory used:5.7421875MB
#创建列表对象a b之后 memory used:88.43359375MB
#完成时候的 memory used:9.96484375MB

对循环数据结构 ,引用计数就显得力不从心。这时候就需要引用新的回收机制:标记清除和分代收集。
标记清除机制:
顾名思义,首先标记对象(垃圾检测),然后清除垃圾(垃圾回收)

分代回收建立在标记清除的基础之上。
Python程序运行的时候它将会建立一定数量的“浮点数垃圾”,python的GC不能够处理未使用的对象因为应用计数值不会到零。这也是为什么python要引用Generation GC算法的原因!Python使用一种不同的链表来持续追踪活跃的对象,python内部的C代码将其称为零代(Generation Zero)。每次当你创建一个对象或者其他什么值的时候,python就会将其加入零代链表。

Python中的GC阈值

3. Python中的GC模块(重点)

python中垃圾回收是以引用计数为主,分代收集为辅。

  • GC负责的主要任务:
    1.为新生成的对象分配内存
    2.识别那些垃圾对象
    3.从垃圾对象那里回收内存
  • 导致引用计数+1的情况:
    1.对象被创建
    2.对象被引用
    3.对象被作为一个参数,传入到一个函数中
    4.对象作为一个元素,存储在容器中
  • 导致引用次数-1的情况:
    1.对象的别名被显式销毁
    2.对象的别名被赋予新的对象
    3.一个对象离开它的作用域。例如f函数执行完毕时,func函数中的局部变量(全部变量不会)
    4.对象所在的容器被销毁或从容器中移除对象
  • 有三种情况会触发垃圾回收:
    1.当gc模块的计数器达到阈值的时候,自动回收垃圾
    2.调用gc.collect(),手动回收垃圾
    3.程序退出的时候,python解释器来回收垃圾

4. Python内存优化

5. Python pep8规范(重点)

6. Python命令行参数(难点)

你可能感兴趣的:(Python学习 day12-2021.3.10(Python垃圾回收机制))