Python的弱引用、控制台的_变量、WeakValueDictionary的介绍

弱引用

因为有引用,对象才能在内存中存在。当对象的引用数量归零后,垃圾回收程序会把对象销毁。

但是有时候需要引用对象,但是不想影响对象的生命周期,这经常用在缓存中。

弱引用不会增加对象的引用数量。引用的目标对象称为所指对象(referent)。因此弱引用不会妨碍所指对象被当做垃圾回收。

 

弱引用在缓存应用中很有用,因为我们不想因为缓存占用着对象,而不被回收。

使用weakref.ref获取所指对象的弱引用。如果对象存在,调用弱引用可以返回对象,否则返回None。

 

示例,使用weakref.ref创建对象的弱引用。

import weakref  # weakref:弱引用

a_set = {1, 2}
wref = weakref.ref(a_set)  # 创建一个对于a_set对象引用{1,2}的弱引用对象wred

print(wref)
print(wref())  # wref()会返回被引用的对象

a_set = {3, 4}
print(wref())  # 此时{1,2}已经没有了强引用,所以已经不存在了,这里返回None
打印结果


{1, 2}
None

控制台的_变量

在Python的控制台会话中,控制台会自动把 _ 变量绑定到结果不为None的表达式结果上。这样对跟踪对象导致多了一个意料之外的引用。

以下是在控制台的演示:

>>> import weakref

>>> a_set = {1, 2}

>>> wref = weakref.ref(a_set)

>>> wref()   # wref() 返回了被引用的对象

{1, 2}

 

>>> a_set = {3, 4}  # 此时a_set已经不再指向{1,2}集合。但是控制台的_变量依然指向{1,2}。

>>> wref()

{1, 2}

 

>>> wref() is None  # 计算这个表达式的时候,{0,1}存在所以不是None。但是随后变量_就绑定到了结果值False。然后{1,2}就没有强引用了。

False

>>> wref() is None

True

 

weakref模块的文档指出,weakref.ref类是底层接口,供高级用途使用,多数程序应该该是WeakKeyDictionary、WeakValueDictionary、weakset和finalize(在内部使用弱引用),不要自动动手创建并处理weakref.ref示例。

 

WeakValueDictionary的介绍

WeakValueDictionary类实现的是一种可变映射,里面的值是对象的弱引用。被引用的对象在程序的其他地方被垃圾回收后,对应的键会自动从WeakValueDictionary中删除。因此常用于缓存。

 

示例,简单的使用

import weakref


class Cheese:
    """各种奶酪"""

    def __init__(self, kind):
        self.kind = kind  # 奶酪种类

    def __repr__(self):
        return 'Cheese(%r)' % self.kind


stock = weakref.WeakValueDictionary()

catalog = [Cheese('A'), Cheese('B'), Cheese('C'), Cheese('D'), ]

for cheese in catalog:
    stock[cheese.kind] = cheese

print(sorted(stock.keys()))
del catalog
print(sorted(stock.keys()))  # 删除catalog之后,还有'D',说明还存在一个强引用,那就是cheese保存了循环中的最后一个值

del cheese
print(sorted(stock.keys()))  # 删除cheese后,所有强引用都没了,WeakValueDictionary也变为空了
打印结果
['A', 'B', 'C', 'D']
['D']
[]

 

知识点:

for x in list 循环中的x其实是全局变量,会一直存在,除非显式 的删除(del)。这就说明了上面代码中对象"D"的引用没有消失,因为还有cheese引用到了它。

比如这个简单的示例

for x in range(3):

   print(x)

 

print(x)  # x的结果为2
print(locals())  # 结果中可以找到'x': 2

 

弱引用的局限

不是所有的Python对象都可以作为弱引用的目标(或称所指对象)。

  • list和dit实例不能作为所指对象,但是他们的子类可以解决这个问题:

import weakref

 

class MyList(list):

   """list的子类,实例可以作为弱引用的目标"""

my_list = MyList()

wref_to_a_list = weakref.ref(my_list)

  • set实例和用户自定义类型可以作为所指对象
  • int和tuple实例不能作为弱引用的目标,甚至是子类也不行。

 

以上的这些局限,都是CPython的实现细节,在其他的Python解释器中的情况可能不一样。

 

Python对不可变类型的把戏

 

惊讶的发现,对于元组t来说,t[:]按照理解来说应该是做了浅拷贝生成了副本,但是返回的确实一个对象的引用。还有tuple(t)获得的也是同一个元组的引用。

>>> t = (1,2)

>>> t2 = t[:]

>>> t2 is t

True

>>> t3 = tuple(t)

>>> t3 is t

True

还有str、bytes和frozenset也有这种行为。但是frozenset实力不是序列,不能是使用fs[:],但是fs.copy()也有同样的效果,会返回一个对象的引用,而不是创建副本。

 

共享字符串字面量是一种优化措施,称为驻留(interning)。CPython还会在小的整数上用这个优化措施,防止重复创建“热门”数字,这就是小整数池

Python中,对于整数对象,如果其值处于[-5,256]的闭区间内,则值相同的对象是同一个对象

观察源码:

#ifndef NSMALLPOSINTS
#define NSMALLPOSINTS           257
#endif
#ifndef NSMALLNEGINTS
#define NSMALLNEGINTS           5
#endif

从_PyInt_Init的实现上,我们可以看到被放入small_ints的数字范围是-5到256。因此,你可以通过修改源代码的方式,将这个范围任意的扩展。

 

以上一些列行为,是Python“善意的谎言”,能节省内存,提高解释器的速度。

简单的总结

  • 简单的赋值不会创建副本。而是增加了别名。
  • 对于+=或者*=这种增量赋值来说,如果左边的变量绑定是不可变对象,会创建新对象;如果是可变对象,会就地修改。
  • 为现有的变量赋予新值,不会修改之前绑定的变量对象。这叫重新绑定:现在变量绑定了其他对象。如果变量是之前那个对象的最后一个引用,对象会被当做垃圾回收。
  • 函数的参数以别名传递。这意味着函数可以修改通过参数传入的可变对象。除非在函数内创建副本,或者使用不可变对象,否则无法避免。
  • 使用可变类型作为函数的参数的默认值很危险,如果就地修改了参数,默认值也就变了,这会影响以后使用默认值的调用。
  • 在CPython中,对象的引用计数归零后,对象会被立即销毁。如果出了循环引用之外没有其他的引用,那这两个对象都会被销毁。
  • 用户自定义的类,其实例默认是可变,多数面向对面语言都是如此。
  • 可变性对象还是导致多线程编程难以处理的主要原因,因为某个线程改动对象后,如果不正确的同步,那就会损坏数据。但是过度的同步又会导致死锁。

你可能感兴趣的:(流畅的Python读书笔记,python)