这篇是看wklken的《Python进阶-Itertools模块小结》 学习itertools模块的学习笔记
在看itertools中各函数的源代码时,刚开始还比较轻松,但后面看起来就比较费劲。。。
1、itertools.count(start=0,step=1)
此函数用来创建一个迭代器,生成从n开始的连续整数,如果忽略n,则从0开始计算
如果超出了sys.maxint,计数器将溢出并继续行-sys.maxint-1开始计算
定义:
def count(start=0, step=1): #count(10) --> 10, 11, 12, 13..... # count(2.5, 0.5)--> 2.5, 3.0, 3.5 .... n = start while True: yield n n += step
使用:
from itertools import * for i in izip(count(i), ['a', 'b', 'c']): print i out: (1, 'a') (2, 'b') (3, 'c')
2、itertools.cycle(iterable)
创建一个迭代器,对iterable中的元素反复执行循环操作,内部会生成iterable中的元素的一个副本, 次副本用于返回循环中的重复项
定义:
def cycle(iterable): # cycle('ABCD') --> A B C D A B C D .... saved = [] for element in iterable: yield element saved.append(element) while saved: for element in saved: yield element
使用:
from itertools import * i = 0 for item in cycle(['a', 'b', 'c']): i += 1 if i == 6: break print (i, item) out: (1, 'a') (2, 'b') (3, 'c') (4, 'a') (5, 'b')
3、itertools.repeat(object[, times])
创建一个迭代器,重复生成object, times (如果已提供) 指定重复计数, 如果未提供times, 将无尽返回该对象
定义:
def repeat(object, times=None): # repeat(10, 3) --> 10, 10, 10 if times is None: while True: yield object else: for i in xrange(time): yield object
使用:
from itertools import * for i in repeat('over-and-over', 3): print i out: over-and-over over-and-over over-and-over
4、itertools.chain(*iterables)
将多个迭代器作为参数,但只返回单个迭代器,它产生所有参数迭代器的内容,就好像他们来自于一个单一的序列。
定义:
def chain(*iterables): # chain('ABC', 'DEF') --> A B C D E F for it in iterables: for element in it: yield element
使用:
from itertools import * for i in chain([1, 2, 3], ['a', 'b', 'c']): print i out: 1 2 3 a b c
5、itertools.compress(data, selectors)
提供一个选择列表, 对原始数据进行筛选
定义:
def compress(data, selectors): # compress('ABCDEF', [1, 0, 1, 0, 1, 1]) --> A C E F return (d for d, s in izip(data, selectors) if s)
6、itertools.product(*iterables[, repeat])
笛卡尔积
创建一个迭代器,生成item1, item2等中的项目的笛卡尔积的元组, repeat是一个关键字参数,指定重复生成序列的次数。
def product(*args, **kwds): # product('ABCD', 'xy') --> Ax, Ay, Bx, By, Cx, Cy, Dx, Dy # product(range(2), repeat=3) --> 000 001 010 011 100 101 110 111 pools = map(tuple, args) * kwds.get(repeat, 1) result = [[]] for pool in pools: result = [x+[y] for x in result for y in pool] for prod in result: yield tuple(prod)
import itertools a = (1, 2, 3) b = ('a', 'b', 'c') c = itertools.product(a, b) for elem in c: print elem out: (1, 'A') (2, 'B') (3, 'C') (2, 'A') (2, 'B') (2, 'C') (3, 'A') (3, 'B') (3, 'C')
这个模块函数有好多,有好多敲了一遍忘了保存,懒得再敲了,但也记得差不多了,所以就这样吧