Python编程:使用asyncio包处理并发

1.概括

        并发是指一次处理多件事,并行是指一次做多件事。二者不同,但是有一定的联系。一个关于结构,一个关于执行。并发用于制定方案,用来解决可能(但未必)并行的问题。真正的并行需要有多个核心,假设现在的电脑有四个CPU核心。但是通常不经意间就有唱过100个进程同时运行。因此,实际上大多数过程都是并发处理的,而不是并行处理。计算机始终UN行者100多个进程,确保每个进程都有机会取得进展,但是CPU同时做的事情不超过4件。

2.线程与协程对比

      下面给出一个函数的线程版和协程版。

import asyncio
import threading


def supervisor():
    signal = Signal()
    spinner = threading.Thread(target=spin, args=('thinking', signal))
    print('spinner object:', spinner)
    spinner.start()
    result = slow_function()
    signal.go = False
    spinner.join()
    return result

@asyncio.coroutine
def supervisor():
    spinner = asyncio.async(spin('thinking'))
    print('spinner object:', spinner)
    result = yield from slow_function()
    spinner.cancel()
    return result

          通过两段代码的比较,可以发现:

(1)asyncio.Task对象差不多与threading.Thread对象等效,Task对象像是协作式多任务的库中的绿色线程。

(2)Task对象用于驱动协程(含yield关键字),Thread对象用于调用可调用的对象,

(3)Task对象不能自己手动实例化,而是通过协程传给asyncio.async()函数或loop.create_task()方法获取。

(4)获取的Task对象已经排定了运行时间,Thread实例则必须调用start方法,明确告知它运行。

(5)在线程版的supervisor函数中,slow_function函数是普通的函数,直接由线程调用。在异步版supervisor函数中,solw_function函数是协程,由yield from驱动。

(6)没有API能从外部终止线程,因为线程随时可能中断,导致系统处于无效状态。如果想终止任务,可以使用Task.cancel()实例方法,在协程内部抛出异常。

(7)supervisor协程必须在main函数中由loop.run_until_complete方法执行。

        此外,还要注意一点,如果使用线程做过于重要的编程,写出程序会比较困难。因为调度程序在任何时候都能中断线程。所以要记住保留锁,去保护程序中重要的部分。而协程会默认做好全方位的保护,以防止中断。我们必须显式的产出才能让程序的余下部分运行。对协程来说,无需保留锁,在多个线程之间同步操作,协程自身就会同步,因为在任意时刻只有一个协程在运行。想交出控制权,可以使用yield或yield from把控制权交给调度程序。

3.避免阻塞型调用

        通常情况下,有两种方法能避免阻塞型调用终止整个应用程序的进程:

(1)在单独的线程中运行各个阻塞型操作。

(2)把每个阻塞型操作转换成非阻塞的异步调用。

        使用多个线程是可以的,但是这样做内内存的需求量太大,我们负担不起。所以,为了降低内存消耗,通过使用回调来实现异步调用,即使用回调时,我们不等待响应,而是注册一个函数,在发生某件事时调用。这样所有调用都是非阻塞的。

你可能感兴趣的:(python)