python 百万并发_Python进阶:百万「并发」基础之异步编程(下篇)

Python进阶:百万「并发」基础之异步编程(下篇)HackPython致力于有趣有价值的编程教学

简介

在上一节中,了解了yield、yield from等概念,此时Python以及具有编写协程实现「回调」的能力,而「回调」是异步编程的基础,随后Python语言的开发者利用yield from能力,在Python3.4中引入了异步I/O框架asyncio,该框架在Python3.5中被完善并作为标准库之一,用于基于协程的异步I/O编程,本节就来讨论一下asyncio以及async/await等内容。

关键概念

在Python3.4中引入了asyncio.coroutine装饰器来标志函数作为协程函数,协程函数具有协程的特性并与asyncio的事件循环一同使用,实现异步编程的目的,为了避免生成器与协程之间的混淆,在Python3.5中引入了async/await,其中async替代asyncio.coroutine装饰器,await替代yield from,从而让协程的实现更加直观,async/await和yield frome这两种不同风格的协程在底层其实是相互复用相互兼容的,在Python3.6中asyncio库“转正”,成为正式的标注库。

这里只讨论新的写法,即async/await实现协程的方式,Python中协程主要的特性如下:

1.函数使用了async表达式开头,即使它不包含await表达式,也是一个协程函数 2.async协程函数中使用yield或者yield from会阐释SyntaxError错误,即新旧语法不可混合使用 3.与常规生成器类似,协程函数在调用时会返回一个coroutine对象 4.与yield方式实现的协程不同,yield在最后会抛出Stoplteration异常,而async中则是RuntimeError 5.当async创建的协程函数被垃圾回收时,一个未被await的协程会抛出RuntimeWarning异常。

在使用asyncio框架前,需要先了解其中几个概念。

Coroutine 协程

以async表达式开头的函数成为协程函数或简称为协程,如下:import asyncio

async def main():

print('hello')

await asyncio.sleep(1)

print('world')

asyncio.run(main())

上述代码中,main() 为协程函数,其写法是Python3.7的写法,Python3.7中对asyncio的使用做了简化, 如果你使用python3.6为主,其asyncio写法如下:import asyncio

async def main():

print('hello')

await asyncio.sleep(1)

print('world')

def run():

# 创建协程对象

coroutine = main()

# 创建事件循环

loop = asyncio.get_event_loop()

# 将协程对象添加到事件循环中,运行直到结束

loop.run_until_complete(coroutine)

# 关闭事件循环

loop.close()

run()

可以看出,Python3.6中asyncio的用法会复杂一下,在Python3.7中,run()方法已经为我们处理好了创建事件、添加协程对象到事件循环、关闭事件循环等事情 ,即loop asyncio.get_event_loop()

loop.run_until_complete(main())

loop.close()

# 在Python3.7中被替换为

asyncio.run()

当然,asyncio也支持传统的基于生成器的协程,不再多提。

Awaitables 可等待对象

「可等待对象」通常有3类,分别是:

1.协程 coroutine 2.任务 Task 3.未来对象 Future

一个直观的判断方法就是,如果一个对象能够被用在 await 表达式中,那么就可以称这个对象为 「可等待对象」

简单示例如下:import asyncio

async def myprint():

print('hello hackpython')

async def main():

# 直接调用,创建协程对象,不会执行协程中的内容

myprint()

# 协程对象成为被等待对象后,才会执行其中的内容

await myprint()

asyncio.run(main())

上述代码会输出如下内容:use_asyncio4.py:8: RuntimeWarning: coroutine 'myprint' was never awaited

myprint()

RuntimeWarning: Enable tracemalloc to get the object allocation traceback

hello hackpython

从输入内容可以看出,直接使用协程函数是不会执行其中的逻辑的,而且还会因为没有使用而触发相应的警告, 只有利用await成为可等待对象后,才会被asyncio事件循环去执行。await会将控制权交由可等待对象。

Task 任务

「任务」主要用于「并发」的调度协程。

一个协程可以通过asyncio.create_task()函数封装成一个Task,此时这个协程很快就会被自动调度执行,代码如下:import asyncio

async def fun1():

print('hackpython')

async def main():

# 创建任务

task = asyncio.create_task(fun1())

# 作为被等待对象

await task

asyncio.run(main())

asyncio.createtask() 是 Python 3.7 新增的方法,如果是Python3.6还可以用 asyncio.ensurefuture 和 loop.create_task 。

可以将Task理解为协程对象的进一步封装,其中包含着各种状态,简单使用如下:async def a():

print('a funtion start.')

await asyncio.sleep(2)

print('a function end.')

async def main():

# task = asyncio.ensure_future(a())

task = asyncio.create_task(a())

print(task)

print(task.done())

await task

print(task)

print(task.done())

if __name__ == '__main__':

asyncio.run(main())

上述代码输出如下:>

False

a funtion start.

a function end.

result=None>

True

从输出内容可以看出,一开始Task任务的状态为pending(等待状态),调用其done()方法可以判断该任务是否执行 ,可以看出,没有利用await将其转为可等待对象前,Task任务是没有执行的,使用await后,即将控制权交由task对象,此时再次打印,发现其状态改变为finshed(完成状态),调用done()方法后可得该任务被正常执行了 。

Future 未来对象

Future代表着一个未来对象,当异步操作结束后会将最终的结果设置到Future对象上,Future同样是对协程的封装,它是一个偏底层的类,具有比较多的方法可以做一些复杂的操作,但在日常开发时,并不会去使用 ,更多的是使用其Task任务,它其实是Future的一个子类 。

Eventloop事件循环

使用 asyncio 框架时,其实就是开启一个事件循环,事件循环对应的实例提供了注册、取消、执行与回调等方法,方便控制整个事件循环实例。

所谓事件循环,就是将协程函数、任务 Task、未来对象 Future 等注册到事件循环中,事件循环实例会循环执行这些函数 ,注意同一时刻下只执行某个函数对象,具体执行某个函数时,如果执行到函数中进行 I/O 耗时操作的部分,事件循环就会将该函数暂停,而去执行其他函数,等进行 I/O 耗时操作的函数执行完后,会再次加入循环队列,等事件循环下次循环到它时继续从此前位置执行,从而实现这些可异步操作对象的协同运行,达到并发的效果 。

结尾

asyncio是Python中比较复杂但又非常重要的概念,在 百万「并发」基础之异步编程 上、中、下三篇文章中比较系统的讨论了异步编程的概念以及在Python中的实现方式 ,但对生成器、yield from以及asyncio等依旧没有深入探讨 ,在HackPython后面的文章中,会系统性讨论这些概念,最后欢迎学习 HackPython 的教学课程并感觉您的阅读与支持。

你可能感兴趣的:(python,百万并发)