2019独角兽企业重金招聘Python工程师标准>>>
socket 的读写超时时间超过十分钟,数据包会重传16次。参考:http://my.oschina.net/lowkey2046/blog/694229
我们可以通过设置 socket 选项 SO_SNDTIMEO 和 SO_RCVTIMEO 来减少读写 socket 的等待时间。
1. 程序源码
在源码 http://my.oschina.net/lowkey2046/blog/693852 基础上进行修改。
在创建 socket 后,通过 setsockopt 函数修改读写超时时间即可。测试时只修改客户端 socket 的超时。
client
int main(int argc, char **argv)
{
struct timeval tv;
/*
* 省略
*/
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) < 0) {
perror("socket");
exit(EXIT_FAILURE);
}
/* 设置套接字读写超时 */
tv.tv_sec = 3;
tv.tv_usec = 0;
setsockopt(sockfd, SOL_SOCKET, SO_SNDTIMEO, &tv, sizeof(tv));
setsockopt(sockfd, SOL_SOCKET, SO_RCVTIMEO, &tv, sizeof(tv));
/*
* 省略
*/
}
2. 测试过程
1) 启动服务端程序
服务器程序在树莓派上,IP 地址为 192.168.1.24。
2) 启动客户端
测试客户端为 PC 机,IP 地址为 192.168.1.21。
启动客户端程序后,输入一行 "hello world" 测试网络是否连通。
./client 192.168.1.24
hello world
hello world
客户端收到了服务端的数据,说明连接正常。
3) 断开树莓派网络,客户端再次发送数据
在客户端输入 "hello world":
hello world
str_cli: server terminated prematurely
可以看到,大 3 秒后 read 函数出错返回,程序终止。如果通过 perror 查看出错原因:Resource temporarily unavailable;而未设置超时的时候 perror 输出:Connection timed out。出错原因是不一样的。
read 出错位置如下:
if ((recvn = read(sockfd, recvbuf, sizeof(recvbuf)-1)) < 0) {
fprintf(stderr, "str_cli: server terminated prematurely");
return;
} else if(recvn == 0) {
fprintf(stderr, "str_cli: read EOF\n");
return;
}
3. wireshark
可以看到,在 15.46 秒时,客户端程序发送了一个数据包,之后一直重传该数据包,尝试得到服务端的响应。
在 18.46 秒时,客户端程序发送了一个 FIN。此时的客户端程序因为读超时而终止。
之后,之前的数据包和 FIN 被作为一个 TCP 重传。重传时间超过了一分钟。(后面应该没了,我等了好久都没有数据包)
需要注意的是,客户端程序终止后,系统仍旧在重传数据包。这意味着,设置 socket 的读写超时选项 SO_RCVTIMEO、SO_SNDTIMEO 只会影响 read、write等读写 socket 函数,系统并不会在超时后停止重传,也不会标记该 socket 为错误。这也意味着,程序将数据写入系统 socket 缓冲区后,就不用担心程序终止时系统会将 socket 缓冲区数据直接丢弃(对方连接正常且缓冲区数据还未发送成功的情况下)。
如果在 read 超时后继续向该 sockt 写入数据呢?在系统 socket 缓冲区未满的情况下 write 不会阻塞,可以继续写入数据。(下次在写个代码证实)
另外 read 出错返回,说明了 write 返回时成功的,但此时服务器并没有接收到数据。这说明 write 只负责将数据成功的写到系统 socket 缓冲区,至于对方有没有收到数据是不管的。
Q: 为什么是一分钟?之前 read 不是超过10分钟吗,重传16次吗?
原因在这:
netstat -nat | grep 9000
tcp 0 8 192.168.1.21:45602 192.168.1.24:9000 FIN_WAIT1
客户端终止后,发送 FIN,此时连接进入 'FIN_WAIT1' 阶段。
参考资料
《UNP》