关于select,poll,epoll3个网络编程异步模型的区别

事件驱动模型

在网络编程里的模型里面,有一类叫事件驱动(Event-driven)模型。(在其他的资料里面也叫 : io多路复用 )。

这类io模型的好处是:在于单个process就可以同时处理多个网络连接的IO。它的基本原理就是select,poll,epoll这个function会不断的轮询所负责的所有socket,当某个socket有数据到达了,就通知用户进程。

当用户进程调用了select/ poll/ epoll,那么整个进程会被block,而同时,kernel会“监视”所有select负责的socket,当任何一个socket中的数据准备好了,select就会返回。这个时候用户进程再调用read操作,将数据从kernel拷贝到用户进程。

这个图和blocking IO的并没有太大的不同,事实上,还更差一些。因为这里需要使用两个system call (select 和 recvfrom),而blocking IO只调用了一个system call (recvfrom)。但是,用select/ poll/ epoll的优势在于它可以同时处理多个connection。

这里有一个讲的很好的教程,推荐 :
http://lifeofzjs.com/blog/2015/05/16/how-to-write-a-server/
https://segmentfault.com/a/1190000003063859

如果有这么一个函数,在某个fd可以读的时候告诉我,而不是反复地去调用read。(这句话说的太好了,反复多读读)这种方式叫做事件驱动,在linux下可以用select/poll/epoll这些I/O复用的函数来实现,因为要不断知道哪些fd是可读的,所以要把这个函数放到一个loop里,这个就叫事件循环(event loop)。

示例代码如下:


关于select,poll,epoll3个网络编程异步模型的区别_第1张图片
image.png

在这个while里,调用epoll_wait会将进程阻塞住,直到在epoll里的fd发生了当时注册的事件。需要注明的是,select/poll不具备伸缩性,复杂度是O(n),而epoll的复杂度是O(1),在Linux下工业程序都是用epoll。


epoll的实现方式

epoll的逻辑是:

  1. 使用epoll_ctl 函数,维护socket的等待队列
    a. 比如把bind之后的socket加入队列,监听新加入的socket,进行accept。
    b. 或者把accept的socket加入队列,监听socket上面是否可读

  2. 把epoll_wait 函数,负责获得就绪列表

关于select,poll,epoll3个网络编程异步模型的区别_第2张图片
image.png
int wait_fds = epoll_wait(epoll_fd, evs, cur_fds, -1);

// wait_fds 返回的是这一次系统调用获得的可读的fd的数量
// evs是一个数量

// 比如wait_fds = 5, 那么表示这一次返回了5个可读的fd,他们被存放在evs数组中的0~5的位置上面

// 遍历这一次调用获得的可读的fd列表
for (i = 0; i < wait_fds; i++)
{
       // 处理新接入的accept
       // evs[i].data.fd 这个fd表示的真正的fd
      if (evs[i].data.fd == listen_fd && cur_fds < MAXEPOLL)
      {

      }
      else
      {      
            // 处理可读的fd
            nread = read(evs[i].data.fd, buf, sizeof(buf));
            if (nread <= 0) //!> 结束后者出错
            {
                    // xxxx  
            }
      }
}

select最早于1983年出现在4.2BSD中,它通过一个select()系统调用来监视多个文件描述符的数组,当select()返回后,该数组中就绪的文件描述符便会被内核修改标志位,使得进程可以获得这些文件描述符从而进行后续的读写操作。

select目前几乎在所有的平台上支持,其良好跨平台支持也是它的一个优点,事实上从现在看来,这也是它所剩不多的优点之一。
select的一个缺点在于单个进程能够监视的文件描述符的数量存在最大限制,在Linux上一般为1024,不过可以通过修改宏定义甚至重新编译内核的方式提升这一限制。

另外,select()所维护的存储大量文件描述符的数据结构,随着文件描述符数量的增大,其复制的开销也线性增长。同时,由于网络响应时间的延迟使得大量TCP连接处于非活跃状态,但调用select()会对所有socket进行一次线性扫描,所以这也浪费了一定的开销

关于select,poll,epoll3个网络编程异步模型的区别_第3张图片
image.png

在写server的时候的时候,经常要写一个client作为调代码的工具,后来发现一个好用的linux命令 ncat

#这个表明本地的8000端口建立tcp连接,然后下面就可以输入要给server发送的消息了。
ncat  127.0.0.1 8000 

代码放在github上面了:
demo-epoll


参考:
epoll 分析

其他:

一个基于python的单线程的echo服务器
http://www.jianshu.com/p/8f1941c4a549

基于python的一个多线程echo服务器
http://www.jianshu.com/p/2ffde49b55c3

一个基于select模型的echo服务器
http://www.jianshu.com/p/8a360a3f13aa

关于select,poll,epoll3个网络编程异步模型的区别
http://www.jianshu.com/p/3bf72e232fb8

你可能感兴趣的:(关于select,poll,epoll3个网络编程异步模型的区别)