正常情况下,TCP连接的终止需要经历四次挥手阶段,体现在代码上就是某一端主动调用close函数关闭套接字,随后TCP向对端发送FIN位被置为1的报文段标志着连接的结束,同时对端响应应答报文段,并在随后的某一时刻同样调用close函数,发送FIN报文段,当确认完成后就标志着TCP连接正常终止。
然而,考虑一种情况,在TCP连接建立成功后,客户端主机突然崩溃(断电,断网等),导致客户端的TCP还没来得及将FIN发送给服务器就已经关闭了(或者由于断网导致FIN无法到达对端),而服务器通常又不会主动发送数据给客户端。在这种情况下,客户端已经关闭,服务器却不知道,依然保持着维护一个连接应该有的所有东西(包括文件描述符,TCP缓冲区等),一个还好,当有大量这种半开连接存在于服务器中,会造成大量的浪费
在TCP协议中,有一个被称作保活定时器的组件,它就是为了解决上述问题被引进的。该定时器的原理也非常简单,当通信双方在定时器规定的这段时间内没有进行数据交互,那么开启保活选项的一端TCP就会发送一个探查报文段,当对端TCP接收到报文段发现这是个探查报文时,会响应应答信息。
上述过程是TCP独立于应用程序进行的,应用程序不会知道探查报文的发送和到达
此外,保活定时器的定时时间是两小时,是系统级别的参数,可以更改,但是最好不要更改,会影响到系统进程
如果一个连接在两小时内没有任何数据交互,则服务器就向客户端发送一个探查报文段(假设服务器开启保活定时器),此时客户端主机有四中可能的状态
下面通过tcpdump抓包分析后三种情况,分析时假设崩溃的一方是服务器,随后观察客户端TCP探查报文段发送情况
借用
观察tcpdump输出结果(省略了三次握手的报文段)
结果中前三行表示客户端发送”hello world”报文段,服务器对该报文段进行应答并回显”hello world”报文段,客户端对服务器的报文段进行应答
随后的四小时内,客户端先后两次尝试探查服务器是否关闭,首先看到的是一个ARP请求和ARP应答,随后发送探查报文段并得到回应
接下来断开服务器以太网电缆,并在两个小时之后又进行探查,然而由于服务器主机以太网断开,无法回应客户端ARP请求,随后的每75秒进行一次超时重传,最终放弃,错误码为“连接超时”
ARP请求主要用来获取对端的物理地址,首先需要知道对方地址,才能发送数据,而由于服务器以太网断开无法回应ARP请求,所以上述过程没有看到TCP报文的发送就已经可以确认对方崩溃
借用
观察tcpdump输出结果(省去了连接建立过程)
可以看到,由于服务器以太网连接正常,ARP请求得到应答,随后客户端发送探查报文段,但是服务器已经重启,没有关于该连接的信息,只能返回一个复位报文段
再次使用
观察tcpdump输出结果(省略掉连接的建立过程)
前三行是正常的回显流程,4,5行是两小时后的探查报文,随后的若干行由于中间链路被断开,引发来自客户端主机路由器的ICMP不可达错误,随后又连续发送了9个探查报文,最终返回给应用程序“没有到达主机的路由”错误
linux内核中有关于保活定时器的三个参数
如果要更改,可以在/etc/sysctl.conf文件中写入(值自己设置)
net.ipv4.tcp_keepalive_time =
net.ipv4.tcp_keepalive_probes =
net.ipv4.tcp_keepalive_intvl =
保存后执行sysctl -p生效。这里是直接修改了内核参数,此后所有的进程的SO_KEEPALIVE时间都被更改
但是由于上述三个参数都是系统级别的参数,也就是说如果更改,那么就会影响开启了SO_KEEPALIVE的系统进程,可能造成意想不到的后果
如果只想在某个应用程序中修改时间,除了开启SO_KEEPALIVE选项外,需要同时设计三个TCP参数
#include
/* fd : 套接字描述符
* time : 空闲时间,当time时间没有数据交互的话就发送探查报文 */
int enableKeepAlive(int fd, int time)
{
int val = 1;
::setsockopt(fd, SOL_SOCKET, SO_KEEPALIVE, &val, sizeof(val));
val = time; //空闲时间
::setsockopt(fd, IPPROTO_TCP, TCP_KEEPIDLE, &val, sizeof(val));
val = time / 3; //探查报文的发送间隔
::setsockopt(fd, IPPROTO_TCP, TCP_KEEPINTVL, &val, sizeof(val));
val = 3; //探查报文的发送次数
::setsockopt(fd, IPPROTO_TCP, TCP_KEEPCNT, &val, sizeof(val));
}