生成器
摘录自《利用 Python 进行数据分析》第三版 3.2.6
迭代器协议是一种令对象可遍历的通用方式。比如用 for 循环来遍历一个字典 some_dict,Python 解释器会先尝试根据 some_dict 生成一个迭代器,即一种用于在上下文中向 Python 解释器生成对象的对象。
大部分以列表或列表型对象为参数的方法都可以接收任意迭代器对象,如 min, max, sum, list 和 tuple。
生成器是构造新的可遍历对象的一种非常简洁的方式。普通函数执行并一次返回单个结果,而生成器则“惰性”地返回一个多结果序列,在每个元素产生之后暂停,直到下一个请求。
如需创建一个生成器,只需要在函数中返回关键字 return 替换为 yield 关键字。
def squares(n=10):
print('Generating squares from 1 to {0}'.format(n ** 2))
for i in range(1, n+1):
yield i ** 2
当实际调用生成器时,代码并不会立即执行。
直到请求生成器中的元素时,它才会执行它的代码。
生成器表达式
创建一个生成器表达式,只需要将列表推导式的中括号替换为小括号即可。
生成器使用总结:
1.生成器的好处是可以一边循环一边进行计算,不用一下子就生成一个很大的集合,占用内存空间。生成器的使用节省内存空间。
2.生成器保存的是算法,而列表保存的计算后的内容,所以同样内容的话生成器占用内存小,而列表占用内存大。每次调用 next(G) ,就计算出 G 的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出 StopIteration 的异常。
3.使用for 循环来遍历生成器内容,因为生成器也是可迭代对象。通过 for 循环来迭代它,不需要关心 StopIteration 异常。但是用for循环调用generator时,得不到generator的return语句的返回值。如果想要拿到返回值,必须用next()方法,且捕获StopIteration错误,返回值包含在StopIteration的value中。
4.在 Python 中,使用了 yield 的函数都可被称为生成器(generator)。生成器是一个返回迭代器的函数,只能用于迭代操作。更简单点理解生成器就是一个迭代器。
5.一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,保存当前所有的运行信息,并返回一个迭代值,下次执行next() 方法时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。生成器不仅“记住”了它数据状态;生成器还“记住”了它在流控制构造中的位置。
【参考】
[1] Python中生成器的原理与使用详解