在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter、deque、defaultdict、namedtuple和OrderedDict等。
namedtuple
生成可以使用名字来访问元素内容的tuple。
from collections import namedtuple
Point = namedtuple('point', ['x', 'y'])
p = Point(1, 2)
print("横坐标为", p.x)
print("纵坐标为", p.y)
Circle = namedtuple('circle', ['x', 'y', 'r'])
c = Circle(1, 2, 3)
print("横坐标为", c.x)
print("纵坐标为", c.y)
print("半径为", c.r)
结果:
横坐标为 1
纵坐标为 2
横坐标为 1
纵坐标为 2
半径为 3Process finished with exit code 0
deque
使用list存储数据时,按索引访问元素很快,但是插入和删除元素很慢,因为list是线性存储,数据量大的时候,插入和删除效率很低。
deque是为了高效实现插入和删除操作的双向列表,适合用于队列和栈:
from collections import deque
q = deque(['a', 'b', 'c'])
q.append('x') # 追加x
print('append:', q)
q.appendleft('y') # 左边追加y
print('appendleft:', q)
q.pop() # 删除x
print('pop:', q)
q.popleft() # 左边删除y
print('popleft:', q)
结果:
append: deque(['a', 'b', 'c', 'x'])
appendleft: deque(['y', 'a', 'b', 'c', 'x'])
pop: deque(['y', 'a', 'b', 'c'])
popleft: deque(['a', 'b', 'c'])Process finished with exit code 0
OrderedDict
有序字典,使用dict时,Key是无序的。在对dict做迭代时,我们无法确定Key的顺序。如果要保持Key的顺序,可以用OrderedDict:
from collections import OrderedDict
d = dict([('pear', 1), ('orange', 2), ('banana', 3), ('watermelon', 4)])
print("key无序的字典")
print(d)
od = OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('watermelon', 4)])
print("key有序的字典")
print(od)
结果:
key无序的字典
{'pear': 1, 'orange': 2, 'banana': 3, 'watermelon': 4}
key有序的字典
OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('watermelon', 4)])Process finished with exit code 0
注意,OrderedDict
的Key会按照插入的顺序排列,不是Key本身排序:
defaultdict
带有默认值的字典
例题:有如下值集合 [11,22,33,44,55,66,77,88,99,90...],将所有大于 66 的值保存至字典的第一个key中,将小于 66 的值保存至第二个key的值中。
即: {'k1': 大于66 , 'k2': 小于66}
from collections import defaultdict
values = [11, 22, 33, 44, 55, 66, 77, 88, 99]
my_dict = defaultdict(list)
for value in values:
if value > 66:
my_dict['k1'].append(value)
else:
my_dict['k2'].append(value)
print(my_dict)
结果:
defaultdict(
, {'k2': [11, 22, 33, 44, 55, 66], 'k1': [77, 88, 99]}) Process finished with exit code 0
Counter
Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。Counter类和其他语言的bags或multisets很相似。
from collections import Counter
c = Counter('sfsfdfdsferegfaahtjjfggfgfh')
print(c)
结果:
Counter({'f': 8, 'g': 4, 's': 3, 'd': 2, 'e': 2, 'a': 2, 'h': 2, 'j': 2, 'r': 1, 't': 1})
Process finished with exit code 0