Unix select()的使用

 

转载:http://fanqiang.chinaunix.net/a4/b7/20010913/0900001283.html,部分不明白的地方做了补充

用过 WinSock API 网友们知道:WinSock 编程中有一很方便的地方便是其消息驱动机制,不管是底层API 的 WSAAsyncSelect() 还是 MFC 的异步Socket类:CAsyncSocket,都提供了诸如 FD_ACCEPT、FD_READ、FD_CLOSE 之类的消息供编程人员捕捉并处理。

FD_ACCEPT 通知进程有客户方Socket请求连接,  

FD_READ通知进程本地Socket有东东可读,

FD_CLOSE通知进程对方Socket已关闭。

那么,BSD Socket 是不是真的相形见拙呢?  

非也! 'cause cpu love unix so.  

  BSD UNIX中有一系统调用芳名select()完全可以提供类似的消息驱动机制。cpu郑重宣布:WinSock的WSAAsyncSeclet()不过是此select()的fork版!  

select()的机制中提供一fd_set的数据结构,实际上是一long类型的数组, 每一个数组元素都能与一打开的文件句柄(不管是Socket句柄,还是其他文件或命名管道或设备句柄)建立联系,建立联系的工作由程序员完成,当调用select()时,由内核根据IO状态修改fd_set的内容,由此来通知执行select()的进程哪一Socket或文件可读,下面具体解释: 

包含头文件:

#include  <sys/types.h>  

#include  <sys/times.h> 

#include  <sys/select.h>  

函数格式:

int select(int nfds, fd_set * readfds, fd_set * writefds, fd_set * exceptfds, struct timeval * timeout)  

其中,

ndfs:select监视的文件句柄数,视进程中打开的文件数而定,一般设为呢要监视各文件中的最大文件号加一

readfds:select监视的可读文件句柄集合

writefds: select监视的可写文件句柄集合

exceptfds:select监视的异常文件句柄集合

timeout:本次select()的超时结束时间。(见/usr/sys/select.h,可精确至百万分之一秒!)  

返回:

当readfds或writefds中映象的文件可读或可写或超时,本次select() 就结束并返回。

程序员利用一组系统提供的宏在select()结束时便可判断哪一文件可读或可写。对Socket编程特别有用的就是readfds。 

补充

关于ndfs的说明:

nfds:is the highest-numbered file descriptor in any of the three sets,  plus 1.

即,该参数是最大的文件描述符(本身为整型)+1,而非select()函数监控的文件(或套接字  int型)的个数。

关于timeout的说明:

1. 结构体struct timeval

struct timeval {long tv_sec, long tv_usec}

第一个表示秒,第二个数值表示毫秒;

2. 赋值

(1)定义时直接赋值,例如:struct timeval time={s, us};

注意,这里为花括号" { } ",类似与结构体的形式!

(2)对结构体中的两个值分别定义

3. 取值含义

当timeout参数取NULL时,则select()阻塞等待

当timeout参数结构体中两个项都为0时,则select()立即返回,相当于轮询;

当timeout参数结构体中不全为0时,等待指定时间后返回。

4. select()函数会修改timeout中的值,以表示函数返回距离设定的时间之间的差,即剩余时间。因此,每次循环需要对timeout重新设值。

几个相关的宏解释如下:  

FD_ZERO(fd_set *fdset):清空fdset与所有文件句柄的联系。  

FD_SET(int fd, fd_set *fdset):建立文件句柄fd与fdset的联系。  

FD_CLR(int fd, fd_set *fdset):清除文件句柄fd与fdset的联系。  

FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否可读写,>0表示可读写。  

(关于fd_set及相关宏的定义见/usr/include/sys/types.h)  

这样,你的socket只需在有东东读的时候才读入,大致如下:  

 
... 
int     sockfd; 
fd_set  fdR; 
struct  timeval timeout = ..; 
... 
for(;;) { 
        FD_ZERO(&fdR); 
        FD_SET(sockfd, &fdR); 
        switch (select(sockfd + 1, &fdR, NULL, &timeout)) { 
                case -1: 
                        error handled by u; 
                case 0: 
                        timeout hanled by u; 
                default: 
                        if (FD_ISSET(sockfd)) { 
                                now u read or recv something; 
                                /* if sockfd is father and  
                                server socket, u can now 
                                accept() */ 
                        } 
        } 

}  

所以一个FD_ISSET(sockfd)就相当通知了sockfd可读。至于struct timeval在此的功能,请man select。不同的timeval设置使select()表现出超时结束、无超时阻塞和轮询三种特性。由于timeval可精确至百万分之一秒,所以Windows的SetTimer()根本不算什么。你可以用select()做一个超级时钟。

FD_ACCEPT的实现

依然如上,因为客户方socket请求连接时,会发送连接请求报文,此时select()当然会结束,FD_ISSET(sockfd)当然大于零,因为有报文可读嘛!至于这方面的应用,主要在于服务方的父Socket,你若不喜欢主动accept(),可改为如上机制来accept()。  

至于FD_CLOSE的实现及处理,颇费了一堆cpu处理时间。

仍然是本地Socket有东东可读,因为对方Socket关闭时,会发一个关闭连接通知报文,会马上被select()检测到的。关于TCP的连接(三次握手)和关闭(四次挥手)机制,敬请参考有关TCP/IP的书籍。  

不知是什么原因,UNIX好象没有提供通知进程关于Socket或Pipe对方关闭的信号,也可能是cpu所知有限。总之,当对方关闭,一执行recv()或read(),马上会返回-1,此时全局变量errno的值是115,相应的errno
为"Connect refused"(请参考/usr/include/sys/errno.h)。所以,在上篇的for(;;)...select()程序块中,当有东西可读时,一定要检查recv()或read()的返回值,返回-1时要作出关断本地Socket的处理,否则select()会一直认为有东西读,其结果曾几令cpu伤心欲断针脚。不信你可以试试:不检查recv()返回结果,且将收到的东东(实际没收到)写至标准输出... 

在有名管道的编程中也有类似问题出现。至于主动写Socket时对方突然关闭的处理则可以简单地捕捉信号SIGPIPE并作出相应关断本地Socket等等的处理。SIGPIPE的解释是:写入无读者方的管道。  

在此不作赘述,请详man signal。 
 
以上是cpu在作tcp/ip数据传输实验积累的经验,若有错漏,请狂炮击之。  
  
 
补充关于 select在异步(非阻塞)connect中的应用,刚开始搞socket编程的时候我一直都用阻塞式的connect,非阻塞connect的问题是由于当时搞proxy scan而提出的呵呵 
通过在网上与网友们的交流及查找相关FAQ,总算知道了怎么解决这一问题.同样用select可以很好地解决这一问题.大致过程是这样的: 
 
1.将打开的socket设为非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完成(有的系统用FNEDLAY也可).  

2.发connect调用,这时返回-1,但是errno被设为EINPROGRESS,意即connect仍旧在进行还没有完成.  

3.将打开的socket设进被监视的可写(注意不是可读)文件集合用select进行监视, 如果可写,用getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int));  来得到error的值,如果为零,则connect成功.  

你可能感兴趣的:(数据结构,编程,unix,socket,struct,Descriptor)