Linux Poll 使用方法和实现

Linux socket之四:使用POLL机制处理多连接


        使用select函数可以处理socket多连接的问题(select的用法参见:http://blog.csdn.net/zhandoushi1982/article/details/5070107),使用POLL也可以实现同样的功能,且调用方式更加简单。原型是:

[cpp] view plain copy
  1. struct pollfd {  
  2.  int fd;        //文件描述符  
  3.  short events;  //要求查询的事件掩码  
  4.  short revents; //返回的事件掩码  
  5. };  
  6. int poll(struct pollfd *ufds, unsigned int nfds, int timeout);  

         poll函数使用pollfd类型的结构来监控一组文件句柄,ufds是要监控的文件句柄集合,nfds是监控的文件句柄数量,timeout是等待的毫秒数,这段时间内无论I/O是否准备好,poll都会返回。timeout为负数表示无线等待,timeout为0表示调用后立即返回。执行结果:为0表示超时前没有任何事件发生;-1表示失败;成功则返回结构体中revents不为0的文件描述符个数。pollfd结构监控的事件类型如下:

[cpp] view plain copy
  1. #define POLLIN 0x0001  
  2. #define POLLPRI 0x0002  
  3. #define POLLOUT 0x0004  
  4. #define POLLERR 0x0008  
  5. #define POLLHUP 0x0010  
  6. #define POLLNVAL 0x0020  
  7.   
  8. #define POLLRDNORM 0x0040  
  9. #define POLLRDBAND 0x0080  
  10. #define POLLWRNORM 0x0100  
  11. #define POLLWRBAND 0x0200  
  12. #define POLLMSG 0x0400  
  13. #define POLLREMOVE 0x1000  
  14. #define POLLRDHUP 0x2000  

      如上是events事件掩码的值域,POLLIN|POLLPRI类似于select的读事件,POLLOUT|POLLWRBAND类似于select的写事件。当events属性为POLLIN|POLLOUT,表示监控是否可读或可写。在poll返回时,即可通过检查revents变量对应的标志位与events是否相同,比如revents中POLLIN事件标志位被设置,则表示文件描述符可以被读取。代码段示例:

[cpp] view plain copy
  1. int sockfd;             //套接字句柄  
  2. struct pollfd pollfds;  
  3. int timeout;  
  4.   
  5. timeout = 5000;  
  6. pollfds.fd = sockfd;                //设置监控sockfd  
  7. pollfds.events = POLLIN|POLLPRI;            //设置监控的事件  
  8.   
  9. for(;;){  
  10.     switch(poll(&pollfds,1,timeout)){       //开始监控  
  11.     case -1:                    //函数调用出错  
  12.         printf("poll error \r\n");  
  13.     break;  
  14.     case 0:  
  15.         printf("time out \r\n");  
  16.     break;  
  17.     default:                    //得到数据返回  
  18.         printf("sockfd have some event \r\n");  
  19.         printf("event value is 0x%x",pollfds.revents);  
  20.     break;  
  21.     }  
  22. }  

原文:http://blog.csdn.net/zhandoushi1982/article/details/7738424

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Linux poll()解析

poll()函数:这个函数是某些Unix系统提供的用于执行与select()函数同等功能的函数,下面是这个函数的声明:

#include

int poll(struct pollfd fds[], nfds_t nfds, int timeout);

参数说明:

fds:是一个struct pollfd结构类型的数组,用于存放需要检测其状态的Socket描述符;每当调用这个函数之后,系统不会清空这个数组,操作起来比较方便;特别是对于 socket连接比较多的情况下,在一定程度上可以提高处理的效率;这一点与select()函数不同,调用select()函数之后,select() 函数会清空它所检测的socket描述符集合,导致每次调用select()之前都必须把socket描述符重新加入到待检测的集合中;因 此,select()函数适合于只检测一个socket描述符的情况,而poll()函数适合于大量socket描述符的情况;

nfds:nfds_t类型的参数,用于标记数组fds中的结构体元素的总数量;

timeout:是poll函数调用阻塞的时间,单位:毫秒;

返回值:

>0:数组fds中准备好读、写或出错状态的那些socket描述符的总数量;

==0:数组fds中没有任何socket描述符准备好读、写,或出错;此时poll超时,超时时间是timeout毫秒;换句话说,如果所检测的 socket描述符上没有任何事件发生的话,那么poll()函数会阻塞timeout所指定的毫秒时间长度之后返回,如果timeout==0,那么 poll() 函数立即返回而不阻塞,如果timeout==INFTIM,那么poll() 函数会一直阻塞下去,直到所检测的socket描述符上的感兴趣的事件发 生是才返回,如果感兴趣的事件永远不发生,那么poll()就会永远阻塞下去;

-1:  poll函数调用失败,同时会自动设置全局变量errno;

如果待检测的socket描述符为负值,则对这个描述符的检测就会被忽略,也就是不会对成员变量events进行检测,在events上注册的事件也会被忽略,poll()函数返回的时候,会把成员变量revents设置为0,表示没有事件发生;

另外,poll() 函数不会受到socket描述符上的O_NDELAY标记和O_NONBLOCK标记的影响和制约,也就是说,不管socket是阻塞的还是非阻塞 的,poll()函数都不会收到影响;而select()函数则不同,select()函数会受到O_NDELAY标记和O_NONBLOCK标记的影 响,如果socket是阻塞的socket,则调用select()跟不调用select()时的效果是一样的,socket仍然是阻塞式TCP通讯,相 反,如果socket是非阻塞的socket,那么调用select()时就可以实现非阻塞式TCP通讯;

所以poll() 函数的功能和返回值的含义与 select() 函数的功能和返回值的含义是完全一样的,两者之间的差别就是内部实现方式不一样,select()函数基本上可以在所有支持文件描述符操作的系统平台上运 行(如:Linux 、Unix 、Windows、MacOS等),可移植性好,而poll()函数则只有个别的的操作系统提供支持(如:SunOS、Solaris、AIX、HP提供 支持,但是Linux不提供支持),可移植性差;

strust pollfd结构说明:

typedef struct pollfd {
        int fd;                               /* 需要被检测或选择的文件描述符*/
        short events;                   /* 对文件描述符fd上感兴趣的事件 */
        short revents;                  /* 文件描述符fd上当前实际发生的事件*/
} pollfd_t;

typedef unsigned long   nfds_t;

经常检测的事件标记: POLLIN/POLLRDNORM(可读)、POLLOUT/POLLWRNORM(可写)、POLLERR(出错)

如果是对一个描述符上的多个事件感兴趣的话,可以把这些常量标记之间进行按位或运算就可以了;

比如:对socket描述符fd上的读、写、异常事件感兴趣,就可以这样做:struct pollfd  fds;

fds[nIndex].events=POLLIN | POLLOUT | POLLERR;

当 poll()函数返回时,要判断所检测的socket描述符上发生的事件,可以这样做: struct pollfd  fds;

检测可读TCP连接请求:

if((fds[nIndex].revents & POLLIN) == POLLIN){//接收数据/调用accept()接收连接请求}

检测可写:

if((fds[nIndex].revents & POLLOUT) == POLLOUT){//发送数据}

检测异常:

if((fds[nIndex].revents & POLLERR) == POLLERR){//异常处理}



 每一个pollfd结构体指定了一个被监视的文件描述符,可以传递多个结构体,指示poll()监视多个文件描述符。每个结构体的events域是监视该文件描述符的事件掩码,由用户来设置这个域。revents域是文件描述符的操作结果事件掩码。内核在调用返回时设置这个域。events域中请求的任何事件都可能在revents域中返回。合法的事件如下:
POLLIN
有数据可读。
POLLRDNORM
有普通数据可读。
POLLRDBAND
有优先数据可读。
POLLPRI
有紧迫数据可读。
POLLOUT
写数据不会导致阻塞。
POLLWRNORM
写普通数据不会导致阻塞。
POLLWRBAND
写优先数据不会导致阻塞。
POLLMSG
SIGPOLL 消息可用。

此外,revents域中还可能返回下列事件:
POLLER
指定的文件描述符发生错误。
POLLHUP
指定的文件描述符挂起事件。
POLLNVAL
指定的文件描述符非法。

这些事件在events域中无意义,因为它们在合适的时候总是会从revents中返回。使用poll()和select()不一样,你不需要显式地请求异常情况报告。
POLLIN | POLLPRI等价于select()的读事件,POLLOUT |POLLWRBAND等价于select()的写事件。POLLIN等价于POLLRDNORM |POLLRDBAND,而POLLOUT则等价于POLLWRNORM。
例如,要同时监视一个文件描述符是否可读和可写,我们可以设置 events为POLLIN |POLLOUT。在poll返回时,我们可以检查revents中的标志,对应于文件描述符请求的events结构体。如果POLLIN事件被设置,则文件描述符可以被读取而不阻塞。如果POLLOUT被设置,则文件描述符可以写入而不导致阻塞。这些标志并不是互斥的:它们可能被同时设置,表示这个文件描述符的读取和写入操作都会正常返回而不阻塞。
timeout参数指定等待的毫秒数,无论I/O是否准备好,poll都会返回。timeout指定为负数值表示无限超时;timeout为0指示poll调用立即返回并列出准备好I/O的文件描述符,但并不等待其它的事件。这种情况下,poll()就像它的名字那样,一旦选举出来,立即返回。


返回值和错误代码
成功时,poll()返回结构体中revents域不为0的文件描述符个数;如果在超时前没有任何事件发生,poll()返回0;失败时,poll()返回-1,并设置errno为下列值之一:
EBADF
一个或多个结构体中指定的文件描述符无效。
EFAULT
fds指针指向的地址超出进程的地址空间。
EINTR
请求的事件之前产生一个信号,调用可以重新发起。
EINVAL
nfds参数超出PLIMIT_NOFILE值。
ENOMEM
可用内存不足,无法完成请求。

 

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

linux的poll机制

Poll就是监控文件是否可读的一种机制,作用与select一样。

应用程序的调用函数如下:

int poll(struct pollfd *fds,nfds_t nfds, int timeout);

Poll机制会判断fds中的文件是否可读,如果可读则会立即返回,返回的值就是可读fd的数量,如果不可读,那么就进程就会休眠timeout这么长的时间,然后再来判断是否有文件可读,如果有,返回fd的数量,如果没有,则返回0. 

内核实现流程:

当应用程序调用poll函数的时候,会调用到系统调用sys_poll函数,该函数最终调用do_poll函数,do_poll函数中有一个死循 环,

在里面又会利用do_pollfd函数去调用驱动中的poll函数(fds中每个成员的字符驱动程序都会被扫描到),驱动程序中的Poll函数的工作 有两个,

一个就是调用poll_wait 函数,把进程挂到等待队列中去(这个是必须的,你要睡眠,必须要在一个等待队列上面,否则到哪里去唤醒你呢??),

另一个是确定相关的fd是否有内容可 读,如果可读,就返回1,否则返回0,如果返回1 ,do_poll函数中的count++,    

然后  do_poll函数然后判断三个条件(if (count ||!timeout || signal_pending(current)))如果成立就直接跳出,如果不成立,

就睡眠timeout个jiffes这么长的时间(调用schedule_timeout实现睡眠),如果在这段时间内没有其他进程去唤醒它,

那么第二次执行判断的时候就会跳出死循环。如果在这段时间内有其他进程唤醒它,那么也可以跳出死循环返回

(例如我们可以利用中断处理函数去唤醒它,这样的话一有数据可读,就可以让它立即返回)。


1.      sys_poll函数位于fs/select.c文件中,代码如下:

asmlinkagelong sys_poll(struct pollfd __user *ufds, unsigned int nfds, long timeout_msecs)

{        

 s64 timeout_jiffies;

         if (timeout_msecs > 0) {

#ifHZ > 1000

             /* We can only overflow if HZ >1000 */

             if (timeout_msecs / 1000 >(s64)0x7fffffffffffffffULL / (s64)HZ)

                 timeout_jiffies = -1;

             else

#endif

                 timeout_jiffies =msecs_to_jiffies(timeout_msecs);

         } 

else

 {

             /* Infinite (< 0) or no (0)timeout */

             timeout_jiffies = timeout_msecs;

         } 

         return do_sys_poll(ufds,nfds, &timeout_jiffies);

}

它对超时参数稍作处理后,直接调用do_sys_poll。 

2.      do_sys_poll函数也位于位于fs/select.c文件中,我们忽略其他代码:

intdo_sys_poll(struct pollfd __user *ufds, unsigned int nfds, s64 *timeout)

{

……

poll_initwait(&table);

……

         fdcount = do_poll(nfds, head,&table, timeout);

……

poll_initwait函数非常简单,它初始化一个poll_wqueues变量table:

poll_initwait> init_poll_funcptr(&pwq->pt, __pollwait); > pt->qproc = qproc;

即table->pt->qproc= __pollwait,__pollwait将在驱动的poll函数里用到。 

3.      do_sys_poll函数位于fs/select.c文件中,代码如下:

 

static int do_poll(unsigned int nfds,  struct poll_list *list,   struct poll_wqueues *wait, s64 *timeout)

{

01 ……

02   for (;;){

03 ……

04                   if(do_pollfd(pfd, pt)) {

05                           count++;

06                           pt = NULL;

07                   }

08 ……

09       if(count || !*timeout || signal_pending(current))

10           break;

11       count= wait->error;

12       if(count)

13           break;14

15       if(*timeout < 0) {

16           /*Wait indefinitely */

17           __timeout= MAX_SCHEDULE_TIMEOUT;

18       }else if (unlikely(*timeout >= (s64)MAX_SCHEDULE_TIMEOUT-1)) {

19           /*

20           * Wait for longer than MAX_SCHEDULE_TIMEOUT. Do it in

21           * a loop

22           */

23           __timeout= MAX_SCHEDULE_TIMEOUT - 1;

24           *timeout-= __timeout;

25       }else {

26           __timeout= *timeout;

27           *timeout= 0;

28       }29

30       __timeout= schedule_timeout(__timeout); // 休眠时间由应用提供

31       if(*timeout >= 0)

32           *timeout+= __timeout;

33   }

34   __set_current_state(TASK_RUNNING);

35   returncount;

36 } 

分析其中的代码,可以发现,它的作用如下:

①    从02行可以知道,这是个循环,它退出的条件为:

a.      09行的3个条件之一(count非0,超时、有信号等待处理)

count顺0表示04行的do_pollfd至少有一个成功。

b.      11、12行:发生错误

②    重点在do_pollfd函数,后面再分析

③    第30行,让本进程休眠一段时间,注意:应用程序执行poll调用后,如果①②的条件不满足,进程就会进入休眠。那么,谁唤醒呢?除了休眠到指定时间被系统唤醒外,还可以被驱动程序唤醒──记住这点,这就是为什么驱动的poll里要调用poll_wait的原因,后面分析。 

4.      do_pollfd函数位于fs/select.c文件中,代码如下:

static inline unsigned int do_pollfd(struct pollfd*pollfd, poll_table *pwait)

{

……

             if(file->f_op && file->f_op->poll)

                     mask= file->f_op->poll(file, pwait);

……

可见,它就是调用我们的驱动程序里注册的poll函数。 

二、驱动程序:

驱动程序里与poll相关的地方有两处:一是构造file_operation结构时,要定义自己的poll函数。二是通过poll_wait来调用上面说到的__pollwait函数,pollwait的代码如下:

staticinline void poll_wait(struct file * filp, wait_queue_head_t * wait_address,poll_table *p)

{

         if (p && wait_address)

             p->qproc(filp, wait_address, p);

}

p->qproc就是__pollwait函数,从它的代码可知,它只是把当前进程挂入我们驱动程序里定义的一个队列里而已。它的代码如下:

staticvoid __pollwait(struct file *filp, wait_queue_head_t *wait_address,  poll_table *p)

{

         struct poll_table_entry *entry =poll_get_entry(p);

         if (!entry)

             return;

         get_file(filp);

         entry->filp = filp;

         entry->wait_address = wait_address;

         init_waitqueue_entry(&entry->wait,current);

         add_wait_queue(wait_address,&entry->wait);

执行到驱动程序的poll_wait函数时,进程并没有休眠,我们的驱动程序里实现的poll函数是不会引起休眠的。让进程进入休眠,是前面分析的do_sys_poll函数的30行“__timeout = schedule_timeout(__timeout)”。

poll_wait只是把本进程挂入某个队列,应用程序调用poll > sys_poll> do_sys_poll > poll_initwait,do_poll > do_pollfd > 我们自己写的poll函数后,再调用schedule_timeout进入休眠。如果我们的驱动程序发现情况就绪,可以把这个队列上挂着的进程唤醒。可见,poll_wait的作用,只是为了让驱动程序能找到要唤醒的进程。即使不用poll_wait,我们的程序也有机会被唤醒:chedule_timeout(__timeout),只是休眠__time_out这段时间。

 

现在来总结一下poll机制:

1. poll > sys_poll > do_sys_poll >poll_initwait,poll_initwait函数注册一下回调函数__pollwait,它就是我们的驱动程序执行poll_wait时,真正被调用的函数。 

2. 接下来执行file->f_op->poll,即我们驱动程序里自己实现的poll函数

   它会调用poll_wait把自己挂入某个队列,这个队列也是我们的驱动自己定义的;

   它还判断一下设备是否就绪。 

3. 如果设备未就绪,do_sys_poll里会让进程休眠一定时间,这个时间是应用提供的“超时时间” 

4. 进程被唤醒的条件有2:一是上面说的“一定时间”到了,二是被驱动程序唤醒。驱动程序发现条件就绪时,就把“某个队列”上挂着的进程唤醒,这个队列,就是前面通过poll_wait把本进程挂过去的队列。 

5. 如果驱动程序没有去唤醒进程,那么chedule_timeout(__timeou)超时后,会重复2、3动作1次,直到应用程序给定的时间, 然后返回。


驱动的poll函数编写模板如下:

static DECLARE_WAIT_QUEUE_HEAD(my_waitq);  //休眠要挂的等待队列

static unsigned drv_poll(struct file *file, poll_table *wait)
{
unsigned int mask = 0;
poll_wait(file, &my_waitq, wait); // 不会立即休眠
if (有数据)
mask |= POLLIN | POLLRDNORM;
return mask;
}


你可能感兴趣的:(Network网络技术,Linux-Android,基础)