程序设计过程中有时候会对多个输入进行操作,例如标准输入或者多个socket。那么如果在对某个进行处理的时候阻塞住的话,另外的输入进来的话会得不到及时的处理。(比如客户端程序调用fgets/cin的时候会阻塞在标准输入的地方,此时如果有监听的socket请求连接的话是得不到及时处理的)。
对于这种情况就需要当内核发现我们指定的IO条件就绪的时候主动的通知进程。这种行为就是IO复用,(个人认为复用的是进程而不是IO)
一个输入操作通常包含两个阶段:
针对如下场合就需要用到IO复用:
首先先介绍下Linux环境下一共具有的5种IO模型
前四种IO模型都是同步IO模型,因为其中真正的IO操作都是会阻塞进程的。
阻塞/非阻塞 以及 同步/异步 的区别
同步和异步的区别:数据拷贝的时候进程是否阻塞
阻塞和非阻塞的区别:应用程序的调用是否立即返回
上面介绍了基本概念之后,下面就来介绍下Linux系统中实现IO复用的函数。
#include
#include
int select(int maxfd1, fd_set *readset, fd_set *writeset, fd_set *exceptset,
const struct timeval *timeout);
返回:若有就绪描述符则为其数目,若超时则返回0,出错返回-1
上面的参数中,
第1个参数是使用的fd中最大的描述符+1,这个是告诉内核只需要测试的fd,而对于其余的fd是不需要进行检测的。比方说我们现在关心的描述符是1,4,7 那么这个参数应该传入8。这个参数完全是为了效率原因,我们告诉内核这个参数那么内核在进程与内核之间就无需复制描述集中不必要的部分,从而不测试那些总是为0的位,提高了效率。
第5个参数是一个timeout时间,告诉内核select需要阻塞多少,有三种可能:要么永远等待、要么等待一段固定时间、要么不等待(如果不等待的话那么就可以考虑设计成为定时器)
第2、3、4的参数分别就是我们关心的读、写和异常条件的描述符。如果有某个我们不关心的可以直接设置为NULL。这三个参数是值-结果参数,即select返回的时候结果也是在这三个参数里面的,在调用select之前我们把关心描述符设置为1,当返回的时候未就绪的会变成0,而就绪的就为1。
对于上面说到的fd_set类型有如下几个操作函数:
void FD_ZERO(fd_set *fdset);
void FD_SET(int fd, fd_set *fdset);
void FD_CLR(int fd, fd_set *fdset);
void FD_ISSET(int fd, fd_set *fdset);
调用select之前一定需要先将fd_set初始化,然后设置自己关心的描述符,当返回的时候调用FD_ISSET()
来查看哪些是就绪的。
如下例子:
void func(FILE *fp, int socketfd)
{
int maxfd1;
fd_set rset;
char sendline[MAXLINE], recvline[MAXLINE];
FD_ZERO(&rset);
for(; ;)
{
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfd1 = max(fileno(fd), socketfd)+1;
select(maxfd1, &rset, NULL, NULL, NULL);
if(FD_ISSET(sockfd, &rset))
{
/*socket is readable*/
}
if(FD_ISSET(fileno(fp), &rset))
{
/*input is readable*/
}
}
}
通常终止网络连接的方法是调用close()
函数,不过close有两个限制,却可以是用shutdown()
函数来避免。
#include
int shutdown(int sockfd, int howto);
返回:成功则为0,出错则为-1
第二个参数可以指定如下值:SHUT_RD、SHUT_WR、SHUT_RDWR分别指明需要关闭连接的哪一半
pselect相对于select来说主要是有两个区别,首先设置超时时间的参数类型变化了,这导致pselect可以精确到纳秒级别,而就结构只能指定微秒级别。第二个不同点是pselect增加了一个参数,指向信号掩码的指针。在调用pselect之前先保存当前进程的信号掩码,禁止递交某些信号。等到pselect返回之后再恢复信号掩码。防止了信号的丢失。
#include
#include
#include
int pselect(int maxfd1, fd_set *readset, fd_set *writeset, fd_set *exceptset,
const struct timespec *timeout, const sigset_t *sigmask);
返回:若有就绪描述符则为其数目,若超时则为0,若出错则为-1
对于poll函数其实机制和select差不多,区别就是poll()
是通过一个结构数组来指定关心的描述符,另外对于每个描述符可以分别指定触发的事件,这些都是通过 struct pollfd
结构体来实现的
struct pollfd {
int fd;
short events;
short revents;
}
#include
int poll(struct pollfd *fdarray, unsinged long nfds, int timeout);
返回:若有就绪描述符则为其数目,若超时则为0,若出错则为-1
pollfd结构体中第一个即为描述符,第二个成员即为关心的事件类型,第三个成员即为返回的时候该描述符发生的事件类型。注:这个不是值-参数类型的,而select函数是值-参数类型的,返回的时候结果还是在那三个参数中,而这个是分别在events和revents成员中的
select和poll函数是当关心的描述符如果有就绪事件发生,返回之后它们是不清楚哪个描述符发生了什么事的,必须去一个一个轮询,那么当描述符数量较多的时候效率很明显会下降,而epoll函数是通过为每个描述符注册一个callback回调函数,当描述符有就绪事件发生的时候,就会直接调用callback函数。不过当描述符较多的时候并且很多描述符都会激活的情况epoll的效率不一定比select/poll会高,select/poll适合那种描述符就绪状态变化频率较少的场景
另外epoll使用mmap用户空间映射到进程虚拟地址空间,加速了从内核空间到用户空间的消息传递。
epoll还区分是边缘触发(Edge Triggered)和水平触发(Level Triggered)。对于前者,只有在状态变化的时候才得到通知,即使缓冲区内还有未处理的数据也是得不到通知的。而后者是只要缓冲区有数据,就会一直有通知。