最近刚接触Linux下的select用法,查阅了很多资料终于懂得了一丁点,故将自己查阅后有用的资料整理在这下面。博客链接都是很有价值,写的很好的文章。在研读源码时主要看的是这篇文章:深入select多路复用内核源码加驱动实现 自己能力精力有限,没有办法自己写一篇完完整整的文章,故只能当个搬运工了,文章先后顺序尽量按照了知识点的先后~~如果有什么问题欢迎一起探讨学习~
在开始接触select之前,你需要先对IO的同步,异步,阻塞,非阻塞有个基本的了解,知道什么是IO多路复用。下面这篇文章可以帮助你快速区分这几种模型:IO - 同步,异步,阻塞,非阻塞 (亡羊补牢篇)
要了解select,你必须得先接触过socket编程,了解什么是文件描述符(fd),文件描述符表,文件指针,可以参阅下面这三篇博文: Linux的SOCKET编程详解 Linux下 文件描述符(fd)与 文件指针(FILE*) file结构体详解
select的使用场景:
select需要使用两个system call (select 和 recvfrom),而blocking IO只调用了一个system call (recvfrom)。但是,用select的优势在于它可以同时处理多个connection。(多说一句。所以,如果处理的连接数不是很高的话,使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server性能更好,可能延迟还更大。select/epoll的优势并不是对于单个连接能处理得更快,而是在于能处理更多的连接。)
在IO multiplexing Model中,实际中,对于每一个socket,一般都设置成为non-blocking,但是,如上图所示,整个用户的process其实是一直被block的。只不过process是被select这个函数block,而不是被socket IO给block。
int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);
int maxfdp是一个整数值,是指集合中所有文件描述符的范围,即所有文件描述符的最大值加1,不能错!在Windows中这个参数的值无所谓,可以设置不正确。
struct fd_set可以理解为一个集合,这个集合中存放的是文件描述符(file descriptor),即文件句柄。fd_set集合可以通过一些宏由人为来操作。
FD_ZERO(fd_set *fdset):清空fdset与所有文件句柄的联系。
FD_SET(int fd, fd_set *fdset):建立文件句柄fd与fdset的联系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd与fdset的联系。
FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否可读写,>0表示可读写。
struct timeval用来代表时间值,有两个成员,一个是秒数,另一个是毫秒数。 若将NULL以形参传入,即不传入时间结构,就是将select置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;第二,若将时间值设为0秒0毫秒,就变成一个纯粹的非阻塞函数,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回0,有变化返回一个正值;第三,timeout的值大于0,这就是等待的超时时间,即select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回。
struct timeval{
long tv_sec; /*秒 */
long tv_usec; /*微秒 */
}
参考:linux中select()函数分析
表示的是文件描述符的数量,从0开始所以比最大的描述符多1,详情参考博客: 为什么linux select函数的第一个参数总应该是fdmax + 1 ?——poll和epoll不需要+1
理解select模型的关键在于理解fd_set,为说明方便,取fd_set长度为1字节,fd_set中的每一bit可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。
(1)执行fd_set set; FD_ZERO(&set);则set用位表示是0000,0000。
(2)若fd=5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)
(3)若再加入fd=2,fd=1,则set变为0001,0011
(4)执行select(6,&set,0,0,0)阻塞等待
(5)若fd=1,fd=2上都发生可读事件,则select返回,此时set变为0000,0011。注意:没有事件发生的fd=5被清空。
所以,我们可以得到select模型的特点:
(1) 文件描述符个数有限,一般来说这个数目和系统内存关系很大。select使用位域的方式来传递关心的文件描述符,位域就有最大长度。select使用位域的方式传回就绪的文件描述符,调用者需要循环遍历每一个位判断是否就绪,当文件描述符个数很多,但是空闲的文件描述符大大多于就绪的文件描述符的时候,效率很低。
(2) 将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集中的fd,一是用于再select 返回后,array作为源数据和fd_set进行FD_ISSET判断。二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始 select前都要重新从array取得fd逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个 参数。
(3) 可见select模型必须在select前循环array(加fd,取maxfd),select返回后循环array(FD_ISSET判断是否有时间发生)。
参考:
Linux中select IO复用机制&使用代码实例
select处理带外数据&解决socket中多用户问题代码
Linux通过socket睡眠队列来管理所有等待socket的某个事件的process,同时通过wakeup机制来异步唤醒整个睡眠队列上等待事件的process,通知process相关事件发生。通常情况,socket的事件发生的时候,其会顺序遍历socket睡眠队列上的每个process节点,调用每个process节点挂载的callback函数。在遍历的过程中,如果遇到某个节点是排他的,那么就终止遍历,总体上会涉及两大逻辑:(1)睡眠等待逻辑;(2)唤醒逻辑。
参考:大话 Select、Poll、Epoll
asmlinkage long sys_select(int n, fd_set __user *inp, fd_set __user *outp, fd_set __user *exp, struct timeval __user *tvp) {
//从用户进程拷贝超时时间,将超时时间换成jiffies。
//使用转化后的时间调用ret = core_sys_select(n, inp, outp, exp, &timeout)函数
//将剩余时间拷贝回用户空间进程
}
staticint core_sys_select(int n, fd_set __user *inp, fd_set __user *outp, fd_set __user *exp, s64 *timeout) {
//读取当前进程的文件描述符表,如果传入的n大于当前进程最大的文件描述符,给予修正。
//尝试使用栈分配内存,不够则用堆。需要使用6倍于最大描述符的描述符个数
//get_fd_set调用copy_from_user从用户空间拷贝了fd_set
//执行ret = do_select(n, &fds, timeout);
//将修改后的fd_set写回用户空间
}
do_select函数中,遍历所有n个fd,对每一个fd调用对应驱动程序中的poll函数。poll函数调用poll_wait函数,poll_wait函数调用__pollwait(),这个函数会初始化等待队列项(有个pollwake函数),并将该等待队列项添加到从驱动程序中传递过来的等待队列头中去。驱动程序在得知设备有IO事件时(通常是该设备上IO事件中断),会调用wakeup,wakeup –> _wake_up_common -> curr->func(即pollwake)。pollwake函数里面调用_pollwake函数, 通过pwq->triggered = 1
将进程标志为唤醒。再调用default_wake_function(&dummy_wait, mode, sync, key)
这个默认的通用唤醒函数唤醒调用select的进程。 请注意,poll函数会返回一个mask码值,通过这个值我们可以判断是否可读写。更详细的必须看 do_select源码。
参考:
分析源码时看的是这篇博客
Linux内核select源码剖析
这篇比较简单
在第一次所有监听都没有事件时,调用 select 都需要把进程挂到所有监听的文件描述符一次。
有事件到来时,不知道是哪些文件描述符有数据可以读写,需要把所有的文件描述符都轮询一遍才能知道。
通知事件到来给用户进程,需要把整个 bitmap 拷到用户空间,让用户空间去查询。
socket、端口、进程的关系
从glibc源码看系统调用原理
堆区和栈区内存分配区别
在上面的简单理解select模型中,我觉得表述可能有点问题,fd_set的大小是1024,那么能表示的应该是0-1023才对。个人觉得,如果fd = 5的话,可能是在第六位。具体怎样才是正确得之后有机会试一下。
参考:一种linux下扩展select模型管理能力的方法