【Python基础】生成器

因学识经验有限,如有不正之处望读者指正,不胜感激;也望借此平台留下学习笔记以温故而知新。这一篇博客是Python基础之生成器,借此梳理下,希望对您有所帮助。

生成器概念

通过列表生成式,可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。

生成器就是一种迭代器。生成器拥有next方法并且行为与迭代器完全相同,这意味着生成器也可以用于Python的for循环中。另外,对于生成器的特殊语法支持使得编写一个生成器比自定义一个常规的迭代器要简单不少,所以生成器也是最常用到的特性之一。

要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

生成器表达式(generator expression)

L = [x + 1 for x in range(10)]
print(L)

实现列表元素加1,列表生成式与其它方法比较:

#普通方法1
b = []
for i in range(10):
    b.append(i+1)
print(b)

#普通方法2
a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
for index,i in enumerate(a):
    a[index] +=1
print(a)

#map,lambda
a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
a = map(lambda x:x+1, a)
print(list(a))

结果如下:

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
g = (x + 1 for x in range(10))
print(g)

结果如下:

 at 0x7fe03ad859a8>

创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。

我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?

如果要一个一个打印出来,可以通过next()函数(or __next__())获得generator的下一个返回值:

next(g)
1
g.__next__()
2

generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误

上面这种不断调用next(g)实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象:

g = (x * x for x in range(10))
for n in g:
    print(n,end=";")
0;1;4;9;16;25;36;49;64;81;

通过使用yield关键字定义
生成器对象是通过使用yield关键字定义的函数对象,因此,生成器也是一个函数。生成器用于生成一个值得序列,以便在迭代器中使用。

"""
第一是直接作为脚本执行,
第二是import到其他的python脚本中被调用(模块重用)执行。
因此if __name__ == '__main__': 的作用就是控制这两种情况执行代码的过程,
在if __name__ == '__main__':下的代码只有在第一种情况下(即文件作为脚本直接执行)才会被执行,而import到其他脚本中是不会被执行的。
"""

def myYield(n):
    while n>0:
        print('开始生成。。。')
        yield n
        print('完成一次。。。')
        n -= 1
if __name__ == '__main__':
    a = myYield(3)
    print('已经实例化生成器对象')
#     a.__next__()
#     print('第二次调用__next__()方法:')
#     a.__next__()
已经实例化生成器对象

yield 语句是生成器中的关键语句,生成器在实例化时并不会被执行,而是等待调用其__next__()方法才开始运行。并且当程序运行完yield语句后就会“吼(hold)住”,即保持当前状态且停止运行,等待下一次遍历时才恢复运行。

程序运行的结果中的空行后的输出“已经实例化生成器对象”之前,已经实例化了生成器对象,但生成器并没有运行(没有输出‘开始生成’)。当第一次手工调用__next__()方法之后,才输出‘开始生成’,标志着生成器已经运行,而在输出‘’第二次调用__next__()方法‘’之前并没有输出‘完成一次’,说明yield语句运行之后就立即停止了。而第二次调用__next__()方法之后,才输出‘完成一次’,说明生成器的回复运行是从yield语句之后开始运行的

return_value = a.__next__()
print(return_value)
开始生成。。。
3
print('第二次调用__next__()方法:')
第二次调用__next__()方法:
return_value = a.__next__()
print(return_value)
完成一次。。。
开始生成。。。
2

生成器并行

def gen():
    a = yield 1
    print('yield a % s' % a)
    b = yield 2
    print('yield b % s' % b)
    c = yield 3
    print('yield c % s' % c)
    return "happy ending"


r = gen()
x = next(r)
print('next x %s' % x)
y = r.send(10)
print('next y %s' %y)
z = next(r)
print('next z %s' % z)
try:
    a = next(r)
except StopIteration as e:
    print(e)
next x 1
yield a 10
next y 2
yield b None
next z 3
yield c None
happy ending

运行过程说明:

第一步:r = gen(),实例化一个生成器对象
第二步:调用next() ,遇到yield 暂停,返回值1,赋值给x
第三步:打印x的值
第四步:传值10,在暂停处接受值10,赋值给a,继续运行,打印a的值,遇到第二个yield,暂停,返回值2,赋值给y
第五步:打印y的值
第六步:调用next() ,打印b值,遇到第三个yield暂停,返回值3,赋值给z
第七步:打印z值
第八步:调用next(),打印c的值,报StopIteration错误,用try。。。except捕获错误
 

参考资料

博客:https://blog.csdn.net/sunchengquan/article/details/84494101

你可能感兴趣的:(Python)