原文http://blog.csdn.net/hanchaoman/article/details/5392639
如果客户端想连接一个服务器端,但是不能肯定服务器端是否存在,如果存在了是否能连上,怎么判断呢? connect函数的默认行为是阻塞的,会一直等待在那里。为了判断各种情况,以及遇到错误时结束连接,我们需要使用非阻塞的socket。一个例子程序:
#include
#include
#include
#include
#include
#include
#include
#include
int main(void)
{
int s,r,ret,len,error;
char buf[20];
struct sockaddr_in sock;
fd_set rset,wset;
struct timeval tv;
tv.tv_sec=10;
s=socket(AF_INET,SOCK_STREAM,0);
if(-1==s)
{
printf("socket() failed/n");
return 1;
}
if(0>fcntl(s,F_SETFL,fcntl(s,F_GETFL,0)|/*O_NDELAY*/O_NONBLOCK))
{
printf("fcntl failed/n");
return 1;
}
sock.sin_family=PF_INET;
sock.sin_port =htons(10080);
sock.sin_addr.s_addr=inet_addr("197.0.0.9");/*htons(INADDR_ANY);,if a none exist ip, timeout takes effect*/
if(-1==(ret=connect(s,(struct sockaddr*)&sock,sizeof(struct sockaddr_in))))
{
if(EINPROGRESS!=errno)
{
/*if not fcntl->O_NDELAY, fall here*/
printf("connect() failed:%s/n",strerror(errno));
return 1;
}
}
if(ret==0)
{
printf("connection ok at once/n");
close(s);
return 0;
}
FD_ZERO(&rset);
FD_SET(s,&rset);
wset=rset;
if(-1==(ret=select(s+1,&rset,&wset,NULL,&tv)))
{
close(s);
printf("select error/n");
return 1;
}
if(0==ret)
{
close(s);
printf("timeout/n");
return 1;
}
if(FD_ISSET(s,&rset)||FD_ISSET(s,&rset))
{
len=sizeof(error);
errno=0;
if(0>(ret=getsockopt(s,SOL_SOCKET,SO_ERROR,(void*)&error,&len)))
{
printf("getsockopt error:%s/n",strerror(error));
close(s);
return 1;
}
if(error!=0)
{
printf("getsockopt set error:%s/n",strerror(error));
close(s);
return 1;
}
printf("getsockopt success/n");
}
else
{
close(s);
printf("FD_ISSET error/n");
return 1;
}
if(-1==(ret=read(s,buf,sizeof(buf))))
{
printf("read() failed/n");
return 1;
}
printf("ret=%d/n",ret);
buf[ret-1]='/0';
printf("read:%s/n",buf);
close(s);
return 0;
}
解释:
1. socket()得到的句柄使用fcntl函数设置了非阻塞的特性。
程序中的ip地址197.0.0.9并不存在,connect失败,select会等待(10秒),一直到timeval超时结束。
2. 如果把ip地址改为一个存在的地址,例如127.0.0,1这样,那么connect函数返回的错误值就是ECONNREFUSED。并且这种情况下select函数会立刻返回,getsockopt函数设置&error,这个可以被strerror()函数打印。----tcp协议是这么规定的。如果连接一个存在的ip,但是这个ip的机器没有监听你要连接的端口,它会返回rst报文。(当然首先是那个ip的机器支持tcp/ip协议,不过这点现在机器都支持)如果发生连接错误, 也会让socket可读和可写. 服务器没有启动, 所以肯定会发生连接错误, 这时, 连接已可读可写, select没有必要等待超时.
3. connect函数失败以后,socket句柄的状态是未定义的,应该close(s)再生成一个。
select的作用是检查描述符的状态,是否有数据过来,比如
要查读描述符,那就检查读描述符的状态,有数据来,就会返回,否则,一直等待,知道你设定的超时时间退出。
而你上面的connect的问题,不是这个。
对于tcp/ip,每个机器只要支持tcp/ip协议,那么它一启动,就相当于有个负责tcp/ip的进程在后台运行着。再说connect,connect的过程 就是 发包收包的过程,用抓包工具可以看到。
connect的过程是:比如a去连b,以下是正常连接的情况。
a:首先发送一个数据包给b
b:收到a的包后给a回一个包。
a:收到b回的包后再给b回一个包。
这三次完成后,就是connect成功连接上,返回了。
上面的程序改为连一个存在的ip(127.0.0.1),但是对方没有在你要连得端口监听会像下面这样:
a:发一个包给b
b:发现没有监听,回rst给a
然后connect没连上结束了。
4. 其他的分析:
最初的地址如果用 INADDR_ANY,会报地址错误。
如果用合法地址,对方没有侦听,报连接被拒绝。Connection refused
如果对方在听了,但没有向你发送消息,select 认为文件描述符是不可读的。
如果三路握手完成,则 select 认为文件描述符是可写的。
写一个服务去听,客户在 select 时把 *wset 参数 设 NULL 就可以观察到 timeout。