C语言Socket入门非阻塞socket(connect timieout问题)

原文http://blog.csdn.net/hanchaoman/article/details/5392639

如果客户端想连接一个服务器端,但是不能肯定服务器端是否存在,如果存在了是否能连上,怎么判断呢? connect函数的默认行为是阻塞的,会一直等待在那里。为了判断各种情况,以及遇到错误时结束连接,我们需要使用非阻塞的socket。一个例子程序:

#include
#include
#include
#include
#include
#include
#include
#include
int main(void)
{
	int s,r,ret,len,error;
	char buf[20];
	struct sockaddr_in sock;
	fd_set rset,wset;
	struct timeval tv;
	tv.tv_sec=10;
	s=socket(AF_INET,SOCK_STREAM,0);
	
	if(-1==s)
	{ 
		printf("socket() failed/n"); 
		return 1; 
	}

	if(0>fcntl(s,F_SETFL,fcntl(s,F_GETFL,0)|/*O_NDELAY*/O_NONBLOCK))
	{
		printf("fcntl failed/n"); 
		return 1; 
	}

	sock.sin_family=PF_INET;
	sock.sin_port  =htons(10080);
	sock.sin_addr.s_addr=inet_addr("197.0.0.9");/*htons(INADDR_ANY);,if a none exist ip, timeout takes effect*/

	if(-1==(ret=connect(s,(struct sockaddr*)&sock,sizeof(struct sockaddr_in))))
	{
		if(EINPROGRESS!=errno)
		{	
			/*if not fcntl->O_NDELAY, fall here*/
			printf("connect() failed:%s/n",strerror(errno)); 
			return 1; 
		}
	}
	if(ret==0)
	{ 
		printf("connection ok at once/n"); 
		close(s); 
		return 0; 
	}
	FD_ZERO(&rset);
	FD_SET(s,&rset);
	wset=rset;
	if(-1==(ret=select(s+1,&rset,&wset,NULL,&tv)))
	{
		close(s); 
		printf("select error/n"); 
		return 1; 
	}
	if(0==ret)
	{ 
		close(s); 
		printf("timeout/n"); 
		return 1; 
	}
	if(FD_ISSET(s,&rset)||FD_ISSET(s,&rset))
	{
		len=sizeof(error);
		errno=0;
		if(0>(ret=getsockopt(s,SOL_SOCKET,SO_ERROR,(void*)&error,&len)))
		{
			printf("getsockopt error:%s/n",strerror(error));
			close(s);
			return 1;
		}
		if(error!=0)
		{ 
			printf("getsockopt set error:%s/n",strerror(error)); 
			close(s); 
			return 1; 
		}
		printf("getsockopt success/n");
	}
	else
	{ 
		close(s); 
		printf("FD_ISSET error/n"); 
		return 1; 
	}
	if(-1==(ret=read(s,buf,sizeof(buf))))
	{ 
		printf("read() failed/n"); 
		return 1;
	}
	printf("ret=%d/n",ret);
	buf[ret-1]='/0';
	printf("read:%s/n",buf);
	close(s);
	return 0;
}




解释:
1. socket()得到的句柄使用fcntl函数设置了非阻塞的特性。
程序中的ip地址197.0.0.9并不存在,connect失败,select会等待(10秒),一直到timeval超时结束。

2. 如果把ip地址改为一个存在的地址,例如127.0.0,1这样,那么connect函数返回的错误值就是ECONNREFUSED。并且这种情况下select函数会立刻返回,getsockopt函数设置&error,这个可以被strerror()函数打印。----tcp协议是这么规定的。如果连接一个存在的ip,但是这个ip的机器没有监听你要连接的端口,它会返回rst报文。(当然首先是那个ip的机器支持tcp/ip协议,不过这点现在机器都支持)如果发生连接错误, 也会让socket可读和可写. 服务器没有启动, 所以肯定会发生连接错误, 这时, 连接已可读可写, select没有必要等待超时.

3. connect函数失败以后,socket句柄的状态是未定义的,应该close(s)再生成一个。
select的作用是检查描述符的状态,是否有数据过来,比如
要查读描述符,那就检查读描述符的状态,有数据来,就会返回,否则,一直等待,知道你设定的超时时间退出。
而你上面的connect的问题,不是这个。
   对于tcp/ip,每个机器只要支持tcp/ip协议,那么它一启动,就相当于有个负责tcp/ip的进程在后台运行着。再说connect,connect的过程 就是 发包收包的过程,用抓包工具可以看到。
connect的过程是:比如a去连b,以下是正常连接的情况。
a:首先发送一个数据包给b
b:收到a的包后给a回一个包。
a:收到b回的包后再给b回一个包。
这三次完成后,就是connect成功连接上,返回了。

上面的程序改为连一个存在的ip(127.0.0.1),但是对方没有在你要连得端口监听会像下面这样:
a:发一个包给b
b:发现没有监听,回rst给a
然后connect没连上结束了。

4. 其他的分析:
最初的地址如果用 INADDR_ANY,会报地址错误。
如果用合法地址,对方没有侦听,报连接被拒绝。Connection refused
如果对方在听了,但没有向你发送消息,select 认为文件描述符是不可读的。
如果三路握手完成,则 select 认为文件描述符是可写的。
写一个服务去听,客户在 select 时把 *wset 参数 设 NULL  就可以观察到 timeout。

你可能感兴趣的:(程序设计)