Python标准库itertools模块

我们知道,迭代器在Python中是一种非常高效又好用的数据结构,迭代器的特点是可以做到惰性求值**(lazy evaluation的概念)** ,什么意思呢?就是只有当迭代到某个值的时候它才会被计算产生,比如要遍历一个大文件或者庞大的数据集时,使用传统的遍历就需要将它们一次性全部储存在内存中,而使用迭代器显而易见的好处则是每次只从对象中读取一条数据,不会造成内存的过大开销。

itertools中的函数大多是返回各种迭代器对象,其中很多函数的作用我们平时要写很多代码才能达到,而在运行效率上反而更低,所以直接使用现有系统库才是明智之选。

来看看几个非常有用的itertools库里的方法。

accumulate()

accumulate()方法是用于计算累积的值,简单的说就是累加:

from itertools import accumulate

for item in accumulate([1, 2, 3, 4, 5]):
    print(item)
    
# 输出如下:
# 1
# 3
# 6
# 10
# 15
# 1

combinations()

combinations()方法可以返回允许重复的元素组合,第一个参数输入可迭代iterable类型,第二个参数输入预期组合的个数。

from itertools import combinations

for i in combinations([1,2,3], 2):
    print(i)

# 输出如下:
# (1, 2)
# (1, 3)
# (2, 3)

如上例子可以发现,我们在1,2,3元素中,可以获得(1,2)和(1,3)和(2,3)组合,这里面顺序组合是无关的。

cycle()

cycle()方法是无限的将它的参数之间循环迭代,直到人为停止。

from itertools import cycle

for item in cycle([1, 2, 3]):
    print(item)

# 输出如下:
# 1
# 2
# 3  
# 1
# 2
# 3 
# ......
# 1
# 2
# 3  

chain()

chain()方法可以连接多个列表或者迭代器。

from itertools import chain

for item in chain([1,2,4,'a'], range(0,5)):
    print(item)
    
# 输出如下:
# 1
# 2
# 4
# a
# 0
# 1
# 2
# 3
# 4

itertools库中还有不少方法函数,但是只有经常使用才能够熟练,如上是一些比较常用的函数。

你可能感兴趣的:(Python)