Python中的不可变集合

Python内置了一个不可变(immutable)集合对象:frozenset,顾名思义,这种集合对象,一旦创建了就不能修改。

概念

下面的代码演示了可变和不可变集合使用上的差别:

l = [1, 2, 3, 4]
new_set = set(l)
new_set.remove(1)
print (new_set)

fset = frozenset(l)
fset.remove(1)

如果运行这段代码,它的输出会是:

{2, 3, 4}

Traceback (most recent call last):
  File "main.py", line 9, in 
    fset.remove(1)
AttributeError: 'frozenset' object has no attribute 'remove'

可以看到frozenset实例根本没有remove方法,当然它也没有append方法,不能用index给元素赋值。

作用

除了不可修改以外,frozenset所有的用法都和普通set一样。

这样一个不可变的集合,有什么用呢?对性能应该没有什么帮助,曾经有文章指出它比普通的set还稍慢一点,主要价值还是体现在可读性和安全性上:

  • 显式地声明了该集合是不可更改的,给使用者明确提示,一旦误用了,运行时也会友好报错;
  • 如果想把这个集合,放到另一个set里面,或者作为dict的key,那它就必须是不可更改的

这第二点,主要是因为dict的key要求是唯一的(或者set内的元素也是唯一的),要是传一个对象,python会尝试调用它的hash方法生个哈希串,作为判断是否唯一的依据,而如果这个对象居然是可变的,它的内容就会影响哈希串的值。所以在python里,可变对象根本就没有内置hash方法,避免它被当做key。

比如下面这段代码:

fset = frozenset({4, 5})
s = {1, 2, fset}
print (s)

s = {1, 2, {4, 5}}

首先定义了一个frozenset,把它插入一个普通set;最后一句试图在普通set里面,初始化另外一个普通set。输出结果如下:

{frozenset({4, 5}), 1, 2}

Traceback (most recent call last):
  File "main.py", line 27, in 
    s = {1, 2, {4, 5}}
TypeError: unhashable type: 'set'

可见普通set是不能作为另外一个set的元素的,但frozenset就可以。‘

为什么Java没有这个限制

Java程序员可能会觉得奇怪,在hashset里放一个可变对象,不是很正常么?凭什么不行啊,我们Java经常这样写:

HashSet> masterCollection = new HashSet>();
ArrayList a = new ArrayList();
masterCollection.add(a);
a.add("Hello, World");
for(ArrayList list : masterCollection) {
    // do something to list
}

完全不会报错么。

So,难道Java的实现机制和Python不一样?

答案是并没有,Java只是“容忍”了可能发生的错误——这个帖子解释得很清楚。简单来说:

Java和Python都是用一个对象的hash值作为key的,相比Python更重视数据一致性,Java更看中灵活性,所以如果我们真的在HashSet里放了一个可变对象,并且事后改变了它的值,那么就会发现,HashSet集合,已经检测不到它的存在了!

Python中的不可变集合_第1张图片

你可能感兴趣的:(Python中的不可变集合)