引言:在上一章中我们介绍了从yield from的来源到async的使用,并在最后以asyncio.wait()方法实现协程,下面我们通过不同控制结构来实现协程,让我们一起来看看他们的不同作用吧~
在多个协程中的线性控制流很容易通过内置的关键词await
来管理。使用asyncio
模块中的方法可以实现更多复杂的结构,它可以并发地完成多个协程。
一、asyncio.wait()
你可以将一个操作分成多个部分并分开执行,而wait(tasks)
可以被用于中断任务集合(tasks)中的某个被事件循环轮询到的任务,直到该协程的其他后台操作完成才被唤醒。
import time import asyncio async def taskIO_1(): print('开始运行IO任务1...') await asyncio.sleep(2) # 假设该任务耗时2s print('IO任务1已完成,耗时2s') return taskIO_1.__name__ async def taskIO_2(): print('开始运行IO任务2...') await asyncio.sleep(3) # 假设该任务耗时3s print('IO任务2已完成,耗时3s') return taskIO_2.__name__ async def main(): # 调用方 tasks = [taskIO_1(), taskIO_2()] # 把所有任务添加到task中 done,pending = await asyncio.wait(tasks) # 子生成器 for r in done: # done和pending都是一个任务,所以返回结果需要逐个调用result() print('协程无序返回值:'+r.result()) if __name__ == '__main__': start = time.time() loop = asyncio.get_event_loop() # 创建一个事件循环对象loop try: loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束 finally: loop.close() # 结束事件循环 print('所有IO任务总耗时%.5f秒' % float(time.time()-start))
执行结果如下:
开始运行IO任务1...
开始运行IO任务2...
IO任务1已完成,耗时2s
IO任务2已完成,耗时3s
协程无序返回值:taskIO_2
协程无序返回值:taskIO_1
所有IO任务总耗时3.00209秒
【解释】:wait()官方文档用法如下:
done, pending = await asyncio.wait(aws)
此处并发运行传入的aws(awaitable objects),同时通过await返回一个包含(done, pending)的元组,done表示已完成的任务列表,pending表示未完成的任务列表。
注:
①只有当给wait()传入timeout参数时才有可能产生pending列表。
②通过wait()返回的结果集是按照事件循环中的任务完成顺序排列的,所以其往往和原始任务顺序不同。
二、asyncio.gather()
如果你只关心协程并发运行后的结果集合,可以使用gather()
,它不仅通过await
返回仅一个结果集,而且这个结果集的结果顺序是传入任务的原始顺序。
import time import asyncio async def taskIO_1(): print('开始运行IO任务1...') await asyncio.sleep(3) # 假设该任务耗时3s print('IO任务1已完成,耗时3s') return taskIO_1.__name__ async def taskIO_2(): print('开始运行IO任务2...') await asyncio.sleep(2) # 假设该任务耗时2s print('IO任务2已完成,耗时2s') return taskIO_2.__name__ async def main(): # 调用方 resualts = await asyncio.gather(taskIO_1(), taskIO_2()) # 子生成器 print(resualts) if __name__ == '__main__': start = time.time() loop = asyncio.get_event_loop() # 创建一个事件循环对象loop try: loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束 finally: loop.close() # 结束事件循环 print('所有IO任务总耗时%.5f秒' % float(time.time()-start))
执行结果如下:
开始运行IO任务2... 开始运行IO任务1... IO任务2已完成,耗时2s IO任务1已完成,耗时3s ['taskIO_1', 'taskIO_2'] 所有IO任务总耗时3.00184秒
【解释】:gather()
通过await
直接返回一个结果集列表,我们可以清晰的从执行结果看出来,虽然任务2是先完成的,但最后返回的结果集的顺序是按照初始传入的任务顺序排的。
三、asyncio.as_completed()
as_completed(tasks)
是一个生成器,它管理着一个协程列表(此处是传入的tasks)的运行。当任务集合中的某个任务率先执行完毕时,会率先通过await
关键字返回该任务结果。可见其返回结果的顺序和wait()
一样,均是按照完成任务顺序排列的。
import time import asyncio async def taskIO_1(): print('开始运行IO任务1...') await asyncio.sleep(3) # 假设该任务耗时3s print('IO任务1已完成,耗时3s') return taskIO_1.__name__ async def taskIO_2(): print('开始运行IO任务2...') await asyncio.sleep(2) # 假设该任务耗时2s print('IO任务2已完成,耗时2s') return taskIO_2.__name__ async def main(): # 调用方 tasks = [taskIO_1(), taskIO_2()] # 把所有任务添加到task中 for completed_task in asyncio.as_completed(tasks): resualt = await completed_task # 子生成器 print('协程无序返回值:'+resualt) if __name__ == '__main__': start = time.time() loop = asyncio.get_event_loop() # 创建一个事件循环对象loop try: loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束 finally: loop.close() # 结束事件循环 print('所有IO任务总耗时%.5f秒' % float(time.time()-start))
执行结果如下:
开始运行IO任务2...
开始运行IO任务1...
IO任务2已完成,耗时2s
协程无序返回值:taskIO_2
IO任务1已完成,耗时3s
协程无序返回值:taskIO_1
所有IO任务总耗时3.00300秒
【解释】:从上面的程序可以看出,使用as_completed(tasks)和wait(tasks)相同之处是返回结果的顺序是协程的完成顺序,这与gather()恰好相反。而不同之处是as_completed(tasks)可以实时返回当前完成的结果,而wait(tasks)需要等待所有协程结束后返回的done去获得结果。
四、总结
以下aws
指:awaitable objects
。即可等待对象集合,如一个协程是一个可等待对象,一个装有多个协程的列表是一个aws
。
asyncio | 主要传参 | 返回值顺序 | await 返回值类型 |
函数返回值类型 |
wait() | aws | 协程完成顺序 | (done,pending) 装有两个任务列表元组 |
coroutine |
as_completed() | aws | 协程完成顺序 | 原始返回值 | 迭代器 |
gather() | *aws | 传参任务顺序 | 返回值列表 | awaitable |
【参考文献】:
[1] Composing Coroutines with Control Structures
[2] Python 3.7.2文档.协程与任务
[3] 控制组合式 Coroutines