Python 的异步 IO:Aiohttp Client 代码分析

Python 的异步 IO:Aiohttp Client 代码分析

Aiohttp 是 Python 的一个 HTTP 框架,基于 asyncio,所以叫 Aiohttp。

想找教程的话,请移步 官方教程,写得还是挺不错的。


下面这个例子,通过 HTTP GET 列出 GitHub 的 public events:

import asyncio
import aiohttp

async def main():
    async with aiohttp.ClientSession() as session:
        async with session.get('') as resp:
            print(await resp.text())

loop = asyncio.get_event_loop()

Response 是一个 JSON 格式的文本:

    "id": "6888907432",
    "type": "PushEvent",
    "actor": {
      "id": 3956266,
      "login": "sekineh",
      "display_login": "sekineh",
      "gravatar_id": "",
      "url": "",
      "avatar_url": ""

ClientSession 是一个 Asynchronous Context Manager,所以搭配 async with 语句一起使用。像下面这样应该也是可以的:

async def main():
    session = aiohttp.ClientSession()
    await session.close()


ClientSession.get() 返回一个 ClientResponse 对象,通过 text() 方法,可以拿到 response 的文本:

print(await resp.text())

当然,text() 是一个协程:

    def text(self, encoding=None, errors='strict'):
        """Read response payload and decode."""


ClientSession 依赖 Connector 来创建连接,缺省为 TCPConnector,它继承自 BaseConnector,此外还有 UnixConnector(应该是 Unix Domain Socket)。

Connector 的接口比较简单,主要提供了 connect() 方法(也是协程):

    def connect(self, req):
        """Get from pool or create new connection."""

以及 close() 方法:

    def close(self):
        """Close all opened transports."""


ClientRequest 有个属性 connection_key

class ClientRequest:
    def connection_key(self):
        return ConnectionKey(, self.port, self.ssl)

它是一个 namedtuple

ConnectionKey = namedtuple('ConnectionKey', ['host', 'port', 'ssl'])

hostportssl 三个元素组成,这三个元素可以唯一定义一个连接,所以叫 ConnectionKey
文章开头的那个例子中,ConnectionKey 为:

ConnectionKey(host='', port=443, ssl=True)

全局函数 request()

Aiohttp 为 Client 程序提供了一个全局函数 request(),用法如下:

async def main():
    resp = await aiohttp.request('GET', '')
loop = asyncio.get_event_loop()

可见 request() 只是 ClientSession 的一个简单封装,其步骤大致为:

  • 创建 TCPConnector
  • 创建 ClientSession
  • 调用 ClientSession._request()

建议不要直接使用 request(),而只把它当成 ClientSession 的一个样例。因为 Aiohttp 官方文档是 这样说的:

Don’t create a session per request. Most likely you need a session per application which performs all requests altogether.

A session contains a connection pool inside, connection reusage and keep-alives (both are on by default) may speed up total performance.

即,一个 request 用一个 session,太浪费;通常是一个 application 用一个 session。



Request 里放了一个 response?

class ClientRequest:
    def send(self, conn):
        self.response = self.response_class(
            self.method, self.original_url,
            writer=self._writer, ...

        self.response._post_init(self.loop, self._session)
        return self.response

self.responseClientRequest 其他地方并没有用到,是否可以改成局部变量?

ClientResponse.start() 里的 _protocol 应该用局部变量吧?

class ClientResponse:
    def start(self, connection, read_until_eof=False):
        """Start response processing."""
        self._closed = False
        self._protocol = connection.protocol


Python 的异步 IO:Aiohttp Client 代码分析_第1张图片


Python 的异步 IO:Aiohttp Client 代码分析_第2张图片

The End
