import collections
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
# defaultdict
d = collections.defaultdict(list)
for k, v in s:
d[k].append(v)
print(d.items())
输出:dict_items([('yellow', [1, 3]), ('blue', [2, 4]), ('red', [1])])
import collections
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = collections.defaultdict(set)
for k, v in s:
d[k].add(v)
print(d.items())
输出:dict_items([('yellow', {1, 3}), ('blue', {2, 4}), ('red', {1})])
import collections
s = 'mississippi'
d = collections.defaultdict(int)
for k in s:
d[k] += 1
print(d.items())
输出:dict_items([('m', 1), ('i', 4), ('s', 4), ('p', 2)])
通过示例1、2、3 的输出结果可以看出,结果类型是dict字典类型,defaultdict翻译为默认字典就更好理解了。key值可自定义,value的类型与collections.defaultdict()括号中设置类型的相同,比如collections.defaultdict(list)对应的是[1, 3]、[2, 4]、[1]这样的list类型,而其值与具体操作相关,上例中对应的是相同key的value值。
所以示例明白学会了,其他的对象类型也不难理解。
python文档数据类型使用说明如下:
class collections.defaultdict([default_factory[, …]])
返回一个新的类似字典的对象。 defaultdict 是内置 dict 类的子类。它重载了一个方法并添加了一个可写的实例变量。其余的功能与 dict 类相同,此处不再重复说明。
第一个参数 default_factory 提供了一个初始值。它默认为 None 。所有的其他参数都等同与 dict 构建器中的参数对待,包括关键词参数。
defaultdict 对象除了支持 dict 的操作,还支持下面的方法作为扩展:
missing(key)
如果 default_factory 是 None , 它就升起一个 KeyError 并将 key 作为参数。
如果 default_factory 不为 None , 它就会会被调用,不带参数,为 key 提供一个默认值, 这个值和 key 作为一个对被插入到字典中,并返回。
如果调用 default_factory 升起了一个例外,这个例外就被扩散传递,不经过改变。
这个方法在查询键值失败时,会被 dict 中的 getitem() 调用。不管它是返回值或升起例外,都会被 getitem() 传递。
注意 missing() 不会 被 getitem() 以外的其他方法调用。意思就是 get() 会向正常的dict那样返回 None ,而不是使用 default_factory 。
defaultdict 支持以下实例变量:
default_factory
这个属性被 missing() 方法使用;它从构建器的第一个参数初始化,如果提供了的话,否则就是 None 。
说了半天,越看越糊涂。找的大佬的解释如下:
defaultdict
dict subclass that calls a factory function to supply missing values。
解释:defaultdict属于内建函数dict的一个子类,调用工厂函数提供缺失的值。
工厂函数又是什么呢?来自python 核心编程的解释,工厂函数看上去有点像函数, 实质上他们是类。当你调用它们时, 实际上是生成了该类型的一个实例, 就像工厂生产货物一样。
较熟悉的有:
int(), long(), float(), complex() ,str(), unicode(), basestring() ,list(), tuple() ,type(),set()
除此之外:
dict() ,bool(),frozenset(),object(),classmethod() ,staticmethod(),super(),property() ,file()
这里的defaultdict(function_factory)构建的是一个类似dictionary的对象,其中keys的值可自定义,但是values的类型,是function_factory的类实例,而且具有默认值。比如defaultdict(int)则创建一个类似dictionary对象,里面任何的values都是int的实例,而且就算是一个不存在的key, d[key] 也有一个默认值,这个默认值是int()的默认值0.
函数 int() 总是返回0,是常数函数的特殊情况。一个更快和灵活的方法是使用lambda函数,可以提供任何常量值(不只是0)。
参考:
https://www.cnblogs.com/herbert/archive/2013/01/09/2852843.html