IO多路转接之select

IO多路转接之select

1. 初识select

系统提供select函数来实现多路复用输入/输出模型。

  • select系统调用是用来让我们的程序监视多个文件描述符的状态变化的;
  • 程序会停在select这里等待,直到被监视的文件描述符有一个或多个发生了状态改变;

2. select函数原型

IO多路转接之select_第1张图片

#include 
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

2.1 参数解释

  1. nfds:输入型参数,是需要监视的最大的文件描述符值 + 1;

  2. rdset,wrset,exset,timeout:输入输出型参数

    rdset:需要检测的可读文件描述符的集合,wrset:可写文件描述符的集合,exset:异常文件描述符的集合;

    timeout:timeval结构体,用来设置select()的等待时间,共有三个可以被设置的选项:

    • NULL:阻塞等待,直到某个文件描述符上发生了事件;

    • 0:非阻塞等待,然后立即返回。

    • 具体的时间:指定的时间段里阻塞等待,如果等待成功返回剩余时间,否则将超时返回。

  3. 函数返回值:

    n > 0 :n个文件描述符就绪;

    n == 0:超时返回

    n < 0 :等待失败

2.2 fd_set结构

IO多路转接之select_第2张图片

其实这个结构就是一个“位图”。使用位图中对应的位来表示要监视的文件描述符。完成用户和内核之间的信息的互相传递。

这里提供了一组操作fd_set的接口,来比较方便的操作位图。

void FD_CLR(int fd, fd_set *set); 	// 用来清除描述词组set中相关fd 的位
int FD_ISSET(int fd, fd_set *set); 	// 用来测试描述词组set中相关fd 的位是否为真
void FD_SET(int fd, fd_set *set); 	// 用来设置描述词组set中相关fd的位
void FD_ZERO(fd_set *set); 			// 用来清除描述词组set的全部位

2.3 timeval结构

timeval结构用于描述一段时间长度,如果在这个时间内,需要监视的描述符没有事件发生则函数返回,返回值为0。

/* A time value that is accurate to the nearest
   microsecond but also has a range of years.  */
struct timeval
  {
    __time_t tv_sec;		/* Seconds.  */
    __suseconds_t tv_usec;	/* Microseconds.  */
  };

2.4 函数返回值

  1. 执行成功则返回文件描述词状态已改变的个数,
  2. 如果返回0代表在描述词状态改变前已超过timeout时间,没有返回
  3. 当有错误发生时则返回-1,错误原因存于errno,此时参数readfds,writefds, exceptfds和timeout的值变成不可预测。

错误值可能为:

  • EBADF 文件描述词为无效的或该文件已关闭
  • EINTR 此调用被信号所中断
  • EINVAL 参数n 为负值。
  • ENOMEM 核心内存不足

3. 理解select执行过程

理解select模型的关键在于理解fd_set,取fd_set长度为1字节,fd_set中的每一bit位可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。

(1)执行fd_set set;FD_ZERO(&set);则set用位表示是0000,0000

(2)若fd=5,执行FD_SET(fd, &set);后set变为0001,0000(第5个bit位 置为1)

(3)若再加入fd=2,fd = 1,则set变为0001,0011

(4)执行select(6, &set, NULL, NULL, NULL) 阻塞等待。

(5)若fd = 1,fd = 2上都发生可读事件,则select返回,此时set变为0000,0011

注意:没有事件发生的fd = 5被清空。

4. socket就绪条件

4.1 读就绪

  1. socket内核中,接收缓冲区中的字节数 大于等于低水位标记SO_RCVLOWAT。此时可以无阻塞的读该文件描述符,并且返回值大于0;
  2. socket TCP通信中,对端关闭连接,此时对该socket读,则返回0;
  3. 监听的socket上有新的连接请求;
  4. socket上有未处理的错误;

4.2 写就绪

  1. socket内核中,发送缓冲区中的可用字节数(发送缓冲区的空闲位置大小),大于等于低水位标记SO_SNDLOWAT,此时可以无阻塞的写,并且返回值大于0;
  2. socket的写操作被关闭(close或者shutdown)。 对一个写操作被关闭的socket进行写操作,会触发SIGPIPE信号;
  3. socket使用非阻塞connect连接成功或失败之后;
  4. socket上有未读取的错误;

5. select的特点

  1. 可监控的文件描述符个数取决与sizeof(fd_set)的值。我的服务器上sizeof(fd_set)=128,每bit表示一个文件描述符,则我服务器上支持的最大文件描述符是128*8=1024。

  2. 将fd加入select监控集的同时,还要再使用一个数据结构fdarray[]保存放到select监控集中的fd

    • 一是用于再select 返回后,fdarray[]作为源数据和fd_set进行FD_ISSET判断。

    • 二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始select前都要重新从fdarray[]取得fd逐一加入(FD_ZERO最先),扫描fdarray[]的同时取得fd最大值maxfd,用于select的第一个参数。

6. select缺点

  1. 每次调用select,都需要手动设置fd集合,从接口使用角度来说也非常不便。
  2. 每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大。
  3. 同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大。
  4. select支持的文件描述符数量太小。

你可能感兴趣的:(Linux,知识,网络,linux)