引言:在上一章中我们介绍了从yield from的来源到async的使用,并在最后以
asyncio.wait()
方法实现协程,下面我们通过不同控制结构来实现协程,让我们一起来看看他们的不同作用吧~
在多个协程中的线性控制流很容易通过内置的关键词await
来管理。使用asyncio
模块中的方法可以实现更多复杂的结构,它可以并发地完成多个协程。
你可以将一个操作分成多个部分并分开执行,而wait(tasks)
可以被用于中断任务集合(tasks)中的某个被事件循环轮询到的任务,直到该协程的其他后台操作完成才被唤醒。
import time
import asyncio
async def taskIO_1():
print('开始运行IO任务1...')
await asyncio.sleep(3) # 假设该任务耗时3s
print('IO任务1已完成,耗时3s')
return taskIO_1.__name__
async def taskIO_2():
print('开始运行IO任务2...')
await asyncio.sleep(2) # 假设该任务耗时2s
print('IO任务2已完成,耗时2s')
return taskIO_2.__name__
async def main(): # 调用方
tasks = [taskIO_1(), taskIO_2()] # 把所有任务添加到task中
done,pending = await asyncio.wait(tasks) # 子生成器
for r in done: # done和pending都是一个任务,所以返回结果需要逐个调用result()
print('协程无序返回值:'+r.result())
if __name__ == '__main__':
start = time.time()
loop = asyncio.get_event_loop() # 创建一个事件循环对象loop
try:
loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束
finally:
loop.close() # 结束事件循环
print('所有IO任务总耗时%.5f秒' % float(time.time()-start))
执行结果如下:
开始运行IO任务1...
开始运行IO任务2...
IO任务2已完成,耗时2s
IO任务1已完成,耗时3s
协程无序返回值:taskIO_2
协程无序返回值:taskIO_1
所有IO任务总耗时3.00209秒
【解释】:wait()官方文档用法如下:
done, pending = await asyncio.wait(aws)
此处并发运行传入的aws
(awaitable objects),同时通过await
返回一个包含(done, pending)的元组,done表示已完成的任务列表,pending表示未完成的任务列表。
注:
①只有当给wait()
传入timeout
参数时才有可能产生pending
列表。
②通过wait()
返回的结果集是按照事件循环中的任务完成顺序排列的,所以其往往和原始任务顺序不同。
如果你只关心协程并发运行后的结果集合,可以使用gather()
,它不仅通过await
返回仅一个结果集,而且这个结果集的结果顺序是传入任务的原始顺序。
import time
import asyncio
async def taskIO_1():
print('开始运行IO任务1...')
await asyncio.sleep(3) # 假设该任务耗时3s
print('IO任务1已完成,耗时3s')
return taskIO_1.__name__
async def taskIO_2():
print('开始运行IO任务2...')
await asyncio.sleep(2) # 假设该任务耗时2s
print('IO任务2已完成,耗时2s')
return taskIO_2.__name__
async def main(): # 调用方
resualts = await asyncio.gather(taskIO_1(), taskIO_2()) # 子生成器
print(resualts)
if __name__ == '__main__':
start = time.time()
loop = asyncio.get_event_loop() # 创建一个事件循环对象loop
try:
loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束
finally:
loop.close() # 结束事件循环
print('所有IO任务总耗时%.5f秒' % float(time.time()-start))
执行结果如下:
开始运行IO任务2...
开始运行IO任务1...
IO任务2已完成,耗时2s
IO任务1已完成,耗时3s
['taskIO_1', 'taskIO_2']
所有IO任务总耗时3.00184秒
【解释】:gather()
通过await
直接返回一个结果集列表,我们可以清晰的从执行结果看出来,虽然任务2是先完成的,但最后返回的结果集的顺序是按照初始传入的任务顺序排的。
as_completed(tasks)
是一个生成器,它管理着一个协程列表(此处是传入的tasks)的运行。当任务集合中的某个任务率先执行完毕时,会率先通过await
关键字返回该任务结果。可见其返回结果的顺序和wait()
一样,均是按照完成任务顺序排列的。
import time
import asyncio
async def taskIO_1():
print('开始运行IO任务1...')
await asyncio.sleep(3) # 假设该任务耗时3s
print('IO任务1已完成,耗时3s')
return taskIO_1.__name__
async def taskIO_2():
print('开始运行IO任务2...')
await asyncio.sleep(2) # 假设该任务耗时2s
print('IO任务2已完成,耗时2s')
return taskIO_2.__name__
async def main(): # 调用方
tasks = [taskIO_1(), taskIO_2()] # 把所有任务添加到task中
for completed_task in asyncio.as_completed(tasks):
resualt = await completed_task # 子生成器
print('协程无序返回值:'+resualt)
if __name__ == '__main__':
start = time.time()
loop = asyncio.get_event_loop() # 创建一个事件循环对象loop
try:
loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束
finally:
loop.close() # 结束事件循环
print('所有IO任务总耗时%.5f秒' % float(time.time()-start))
执行结果如下:
开始运行IO任务2...
开始运行IO任务1...
IO任务2已完成,耗时2s
协程无序返回值:taskIO_2
IO任务1已完成,耗时3s
协程无序返回值:taskIO_1
所有IO任务总耗时3.00300秒
【解释】:从上面的程序可以看出,使用as_completed(tasks)
和wait(tasks)
相同之处是返回结果的顺序是协程的完成顺序,这与gather()恰好相反。而不同之处是as_completed(tasks)
可以实时返回当前完成的结果,而wait(tasks)
需要等待所有协程结束后返回的done
去获得结果。
以下aws
指:awaitable objects
。即可等待对象集合,如一个协程是一个可等待对象,一个装有多个协程的列表是一个aws
。
asyncio | 主要传参 | 返回值顺序 | await 返回值类型 |
函数返回值类型 |
---|---|---|---|---|
wait() | aws | 协程完成顺序 | (done,pending) 装有两个任务列表元组 |
coroutine |
as_completed() | aws | 协程完成顺序 | 原始返回值 | 迭代器 |
gather() | *aws | 传参任务顺序 | 返回值列表 | awaitable |
【参考文献】:
[1] Composing Coroutines with Control Structures
[2] Python 3.7.2文档.协程与任务
[3] 控制组合式 Coroutines