collection.defaultdict的用法

 collections.defaultdict([default_factory[, ...]])

返回一个新的类似字典的对象。 defaultdict 是内置 dict 类的子类,它重载了一个方法并添加了一个可写的实例变量。

第一个参数 default_factory 提供了一个初始值。它默认为 None 。所有的其他参数都等同与 dict 构建器中的参数对待,包括关键词参数。

  • 使用 list 作为 default_factory ,很容易将序列作为键值对加入字典:
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
for k, v in s:
    d[k].append(v)

sorted(d.items())

out:[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

当字典中没有的键第一次出现时,default_factory自动为其返回一个空列表,list.append()会将值添加进新列表;再次遇到相同的键时,list.append()将其它值再添加进该列表。

  • 设置 default_factory 为 int ,使 defaultdict 在计数方面发挥好的作用,设置 default_factory 为(lambda: 0) 也可以实现计数操作
s = 'mississippi'
d = defaultdict(int)
for k in s:
    d[k] += 1

sorted(d.items())
out: [('i', 4), ('m', 1), ('p', 2), ('s', 4)]

当一个字母首次遇到时,它就查询失败,所以 default_factory 调用 int() 来提供一个整数0作为默认值。自增操作然后建立对每个字母的计数。

函数 int() 总是返回0,是常数函数的特殊情况。一个更快和灵活的方法是使用lambda函数,可以提供任何常量值(不只是0):

s = 'mississippi'
d = defaultdict(lambda: 0)
for k in s:
    d[k] += 1

sorted(d.items())
out: [('i', 4), ('m', 1), ('p', 2), ('s', 4)]
  • 设置 default_factory 为 set 使 defaultdict 用于构建字典集合:
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d = defaultdict(set)
for k, v in s:
    d[k].add(v)

sorted(d.items())
out: [('blue', {2, 4}), ('red', {1, 3})]

 

你可能感兴趣的:(Python)