为什么 Event Loop 适合处理高并发?

在学习 Node 的时候,一定会被告知 Node 是基于 Event Loop 的,以及事件驱动、事件队列、非阻塞 IO 等概念,最终得出一个结论:Node 非常适合 IO 密集型的应用,能够以很少的资源消耗实现高并发。
但为什么 Event Loop 架构可以实现较高的并发呢?这个问题我一直也不明白,于是我在网上查了一些文章,大概明白了一点,便进行整理,方便以后查看。

场景模拟

我们来模拟一个典型的请求-响应模型:客户端向服务器发起请求,服务端收到请求后对请求进行处理,然后进行数据库读取,最后将读取的结果进行响应。示例图如下:


为什么 Event Loop 适合处理高并发?_第1张图片
请求-响应模型.png

在这个模型中,会经过三个阶段:

  • 服务器收到请求并处理
  • 读取数据库
  • 服务器处理数据并响应

在这三个阶段中,第一个阶段和最后一个阶段会由 CPU 进行计算,第二个阶段则是 IO 操作,只占用极少的 CPU。
我们假定这三个阶段各耗时 1ms,因此服务器处理每个请求所花的时间就为 3ms。
假如我们的服务器是单核 CPU,并只有一个线程,那么每秒钟可以处理的请求约等于 333 个,也就是服务器的 QPS 等于 333。
QPS 可以用来客观描述服务器的并发能力,QPS 越大,服务器的并发能力越好。

单核单线程的情况

假定我们的服务器是单核单线程的,那么其处理情况如下所示:


为什么 Event Loop 适合处理高并发?_第2张图片
单核单线程.png

服务器收到了两个请求:请求1和请求2。处理流程如下:

  1. 收到请求1,进行处理
  2. 读取数据库,由于是单线程,CPU 需要等待 IO 读取完成再进行后面的操作
  3. 处理读取到的数据,响应客户端
  4. 按上面的流程继续处理请求2

单线程的瓶颈在于无法充分利用 CPU 资源,在进行 IO 读取时,CPU 实际上是处于空闲状态,必须等待 IO 读取完成再进行后面的处理。对于每个请求,CPU 都会有一个较大的等待时期。在单线程模型下,服务器的 QPS 为 333。

单核多线程的情况

假定我们服务器是单核 CPU,但是开启了两个线程,其处理情况如下所示:


为什么 Event Loop 适合处理高并发?_第3张图片
单核多线程.png

采用单核多线程时,情况就不一样了,对于请求1和请求2,将由两个不同的线程进行处理,流程如下:

  1. (线程1)收到请求1的请求进行处理
  2. (线程1)请求1开始 IO 读取,CPU 空闲
  3. (线程2)CPU 切换到请求2所在的线程,并进行请求处理
  4. (线程2)请求2开始 IO 读取,CPU 空闲
  5. (线程1)请求1的 IO 读取完毕,CPU 切换到请求1所在的线程,处理数据并响应客户端,CPU 空闲
  6. (线程2)请求2的 IO 读取完毕,CPU 切换到请求2所在的线程,处理数据并响应客户端,CPU 空闲
  7. 按照上面的流程进行请求3和请求4的处理

在多线程的模型下,由于 CPU 不用等待 IO 读取完成,其核心得到了充分的利用,在这个模型下,处理完两个请求所耗时为 4ms,平均处理一个请求所耗时为 2ms,QPS 为 500,并发能力比单线程模型好多了。

多线程模型的问题

多线程模型最大的问题,莫过于线程上下文切换所带来的额外开销了。上面展示的情况,是没有上下文切换下的理想情况,但在真实的环境下,两个线程间进行切换,必定会产生开销的,而且还不小。因此上面的处理情况可能是这样:


为什么 Event Loop 适合处理高并发?_第4张图片
上下文切换开销.png

因此,由于频繁上下文切换造成的开销,上面的多线程模型的并发能力比理想情况下要弱。

单线程异步 IO 的情况

在多线程模型中,通过使用线程切换,避免了 CPU 因等待 IO 操作的闲置,最大程度上利用了 CPU 资源,但是线程间的频繁上下文切换也会产生很大的开销,同样会增加服务器的压力。因此,要想避免线程上下文切换的带来的开销,就只有使用单线程。
在使用单线程的情况下,能否实现非阻塞的 IO 呢?


为什么 Event Loop 适合处理高并发?_第5张图片
单线程异步IO.png

上面就是一个单线程非阻塞 IO 的模型,处理请求时的流程如下:

  1. 收到请求1,开始处理请求
  2. 进行请求1的 IO 读取,并注册一个回调函数(处理数据并响应客户端),同时线程不阻塞,继续处理请求2
  3. 进行请求2的 IO 读取,并注册一个回调函数(处理数据并响应客户端),同时线程不阻塞,继续处理剩下的请求
  4. 请求处理结束后,依次执行 IO 读取是注册的回调函数(处理数据并响应客户端),完成处理

假设服务器只接受到两个请求:请求1和请求2,按照上面的流程图,处理这两个请求的时间为 4ms,平均每个请求用时 2ms,此时服务器的 QPS 为 500。由于是单线程运行,没有频繁上下文切换带来的开销,因此这个单线程异步 IO 的模型比多线程模型占用的资源更少,对服务器配置要求更低。同时,从流程图也可以看到,这种架构具备很大的吞吐能力,十分适合 IO 密集型的应用。

总结

本文对几种常见的任务处理模型:单线程模型、多线程模型、单线程非阻塞 IO 模型进行了对比,依据是应用这些模型时的服务器 QPS 值,得出的结论是单线程非阻塞 IO 模型具备较强的并发处理能力,且占用更少的资源。
Node 的 Event Loop 基于这种单线程非阻塞 IO 模型,因此具备强大的并发能力,适合 IO 密集型的应用(如游戏、电商秒杀活动等)。

附:参考资料
Node.js为什么快
JavaScript 运行机制详解:再谈Event Loop
【朴灵评注】JavaScript 运行机制详解:再谈Event Loop
理解Node.js的event loop

完。

你可能感兴趣的:(为什么 Event Loop 适合处理高并发?)