【一】什么是生成器?
- Python中的生成器是一种特殊的迭代器,可以在需要时生成数据,而不必提前从内存中生成并存储整个数据集。
- 通过生成器,可以逐个生成序列中的元素,而无需一次性生成整个序列。
- 生成器在处理大数据集时,具有节省内存、提高效率的特点。
【二】生成器有两种创建方式
【1】列表推导式
- 使用列表推导式时,可以将列表推导式的方括号改为圆括号,即可创建一个生成器。
# 列表生成式生成列表
start_list = [x * 2 for x in range(5)]
print(start_list)
# [0, 2, 4, 6, 8]
# 将列表改成元祖,看起来像元祖推导式,其实是一个生成器对象
G = (x * 2 for x in range(5))
print(G)
# at 0x000001873491CC80>
# 生成器对象可以强转成列表
print(list(G))
# [0, 2, 4, 6, 8]
- 怎么打印出生成器的每一个元素呢?
- 如果要一个一个打印出来,可以通过 next() 函数获得生成器的下一个返回值
- 生成器保存的是算法
- 每次调用 next(G) ,就计算出 G 的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出
StopIteration
的异常。
- 当然,这种不断调用 next() 实在是太变态了,正确的方法是使用 for 循环,因为生成器也是可迭代对象。
- 所以,我们创建了一个生成器后,基本上永远不会调用 next() ,而是通过 for 循环来迭代它,并且不需要关心
StopIteration
异常。
# 将列表改成元祖,看起来像元祖推导式,其实是一个生成器对象
G = (x * 2 for x in range(5))
# 生成器本身就是一种迭代器 , 可以for 遍历生成器对象
for i in G:
print(i)
# 0
# 2
# 4
# 6
# 8
【2】yield关键字
(1)yield关键字介绍
- 使用yield关键字定义一个生成器函数时,生成器函数中的yield语句会暂停函数执行并返回一个值,下一次调用该函数时会继续执行并返回下一个值。
def my_generator():
yield 1
yield 2
yield 3
g = my_generator()
print(next(g)) # 输出:1
print(next(g)) # 输出:2
print(next(g)) # 输出:3
- 在上面的代码中,my_generator()是一个生成器函数,通过yield关键字逐个生成值。
- 在调用该函数时,会得到一个生成器对象。
- 通过调用next()函数,可以逐个返回生成器中的值。
(2)yield关键字使用
def eater():
print('开始吃饭 ovo ')
while True:
food = yield
print(f'得到的食物是 :>>>> {food}, 开始吃饭喽 :>>>> {food}')
# 定义生成器
def eater():
print('开始吃饭 ovo ')
while True:
food = yield
print(f'得到的食物是 :>>>> {food}, 开始吃饭喽 :>>>> {food}')
# 得到生成器对象
food_eater = eater()
# 需要事先”初始化”一次,让函数挂起在food=yield,等待调用food_eater.send()方法为其传值
# food_eater.send(None)
# 等同于
next(food_eater)
# 开始吃饭 ovo
food_eater.send('包子')
# 得到的食物是 :>>>> 包子, 开始吃饭喽 :>>>> 包子
food_eater.send('鸡腿')
# 得到的食物是 :>>>> 鸡腿, 开始吃饭喽 :>>>> 鸡腿
- 编写装饰器来完成为所有表达式形式yield对应生成器的初始化操作
# 定义初始化装饰器
def init(func):
def wrapper(*args, **kwargs):
g = func(*args, **kwargs)
next(g)
return g
return wrapper
# 定义生成器 并 使用装饰器初始化
@init
def eater():
print('开始吃饭 ovo ')
while True:
food = yield
print(f'得到的食物是 :>>>> {food}, 开始吃饭喽 :>>>> {food}')
print("得到生成器对象之前")
# 得到生成器对象
food_eater = eater()
print("得到生成器对象之后")
# 得到生成器对象之前
# 开始吃饭 ovo
# 得到生成器对象之后
food_eater.send('包子')
# 得到的食物是 :>>>> 包子, 开始吃饭喽 :>>>> 包子
food_eater.send('鸡腿')
# 得到的食物是 :>>>> 鸡腿, 开始吃饭喽 :>>>> 鸡腿
def eater():
print('开始做饭 ovo ')
food_list = []
while True:
food = yield food_list
food_list.append(food)
print(f"做饭喽 :>>>> {food_list}")
# 得到生成器对象
food_eater = eater()
next(food_eater)
# 开始做饭 ovo
food_eater.send('包子')
# 做饭喽 :>>>> ['包子']
food_eater.send('鸡腿')
# 做饭喽 :>>>> ['包子', '鸡腿']
【三】yield+next详解
- 若函数体包含yield关键字,再调用函数,并不会执行函数体代码,得到的返回值即生成器对象
def my_range(start, stop, step=1):
print('start...')
while start < stop:
yield start
start += step
print('end...')
g = my_range(0, 3)
print(g) #
- 生成器内置有
__iter__
和__next__
方法
- 所以生成器本身就是一个迭代器
def my_range(start, stop, step=1):
print('start...')
while start < stop:
yield start
start += step
print('end...')
g = my_range(0, 3)
print(g) #
print(g.__iter__) #
print(g.__next__) #
# 生成方式一
g_iter = iter(g)
print(g_iter) #
# start...
print(next(g_iter))
# 0
print(next(g_iter))
# 1
def my_range(start, stop, step=1):
print('start...')
while start < stop:
yield start
start += step
print('end...')
g = my_range(0, 3)
print(g) #
print(g.__iter__) #
print(g.__next__) #
# 生成方式二
print(next(g))
# start...
print(next(g))
# 0
print(next(g))
# 1
def my_range(start, stop, step=1):
print('start...')
while start < stop:
yield start
start += step
print('end...')
g = my_range(0, 3)
print(g) #
print(g.__iter__) #
print(g.__next__) #
# 触发函数执行直到遇到yield则停止,将yield后的值返回,并在当前位置挂起函数
print(f"第一次 :>>>> {next(g)}")
# start...
# 第一次 :>>>> 0
# 再次调用next(g),函数从上次暂停的位置继续执行,直到重新遇到yield...
print(f"第二次 :>>>> {next(g)}")
# 第二次 :>>>> 1
# 周而复始...
print(f"第三次 :>>>> {next(g)}")
# 第三次 :>>>> 2
# end...
print(f"第四次 :>>>> {next(g)}")
'''
Traceback (most recent call last):
File "E:\PythonProjects\生成器.py", line 33, in
print(f"第四次 :>>>> {next(g)}")
StopIteration
'''
【四】生成器的特点
- 节约内存
- 迭代到下一次的调用时,所使用的参数都是第一次所保留下的
- 即是说,在整个所有函数调用的参数都是第一次所调用时保留的,而不是新创建的