一 基本原理

TCP的Keepalive可以简单理解成为keep tcp alive,用来检测TCP sockets的连接是否正常或是已经断开。

Keeplived的原理很简单,当建立一个TCP连接时,发送端就会创建一些计时器,其中一些计时器就是处理keeplaive相关问题的。当keepalive的计时器计数到0时,发送端就会向对端发送一些不含数据的keepalive数据包并开启ACK标志。如果得到keepalive探测包的回复,就可以认为当前的TCP连接正常,不用担心用户层面的具体实现。事实上,TCP允许处理数据流,而不是数据包,所以对于用户程序来说零字节的数据包没有危害。

开启keepalive会对防火墙或者路由器产生额外的流量。

keepalive主要承担两个任务:

  1. 检测死掉的对端连接

    keepalive可以用于在对端死掉并发送通知之前检测到对端的连接状态。内核错误或者强制终止对端的应用程序进程都可能造成这种情况发生。还有一种情况使用keepalive来检测对端是否死掉是对端依然存活但是连接到对端之前的网络已经断开。

    假想主机A和主机B之前一个简单的TCP连接:在A与B之间有一个简单的三次握手,A发送SYN到B,然后B发送SYN+ACK到A,最后A发送ACK到B。现在就建立起了一个稳定的TCP连接,等待某方通过这个通道传输数据。现在问题就来了:拔掉主机B的电源,主机B在没有任何通知主机A当前连接即将关闭的情况会立即关机。对于主机A,正准备接收数据,但是不知道主机B已经关机。现在主机B开机,主机A和主机B又处于正常状态,主机A知道还有一个与主机B的活动连接,但是主机B不知道。当主机A尝试通过这个死掉的连接向主机B发送数据时,主机B会返回RST,主机A就会主动关掉这个连接。

    keepalived可以在对端主机不可达的情况通知发送端,减少误报的风险。实际上,如果网络中的两个主机存在这种问题,keepalive会在标记一个连接端口之前等待一段时间并重新尝试发送keepalive数据包

 _____                                                     _____
   |     |                                                   |     |
   |  A  |                                                   |  B  |
   |_____|                                                   |_____|
      ^                                                         ^
      |--->--->--->-------------- SYN -------------->--->--->---|
      |---<---<---<------------ SYN/ACK ------------<---<---<---|
      |--->--->--->-------------- ACK -------------->--->--->---|
      |                                                         |
      |                                       system crash ---> X
      |
      |                                     system restart ---> ^
      |                                                         |
      |--->--->--->-------------- PSH -------------->--->--->---|
      |---<---<---<-------------- RST --------------<---<---<---|
      |                                                         |




2. 在网络断开的情况下阻止与对端的TCP连接断开。

   _____           _____                                     _____
   |     |         |     |                                   |     |
   |  A  |         | NAT |                                   |  B  |
   |_____|         |_____|                                   |_____|
      ^               ^                                         ^
      |--->--->--->---|----------- SYN ------------->--->--->---|
      |---<---<---<---|--------- SYN/ACK -----------<---<---<---|
      |--->--->--->---|----------- ACK ------------->--->--->---|
      |               |                                         |
      |               | <--- connection deleted from table      |
      |               |                                         |
      |--->- PSH ->---| <--- invalid connection                 |
      |               |                                         |


二 在Linux下使用TCP的keepalive

tcp_keepalive_time

    一个连接需要TCP开始发送keepalive探测数据包之前的空闲时间。以秒为单位


tcp_keepalive_probes

    发送TCP keepalive探测数据包的最大数量,默认是9.如果发送9个keepalive探测包后对端仍然没有响应,就关掉这个连接



tcp_keepalive_intvl

    发送两个TCP keepalive探测数据包的间隔时间,默认是75秒


$ cat /proc/sys/net/ipv4/tcp_keepalive_time 
7200
$ cat /proc/sys/net/ipv4/tcp_keepalive_probes 
9
$ cat /proc/sys/net/ipv4/tcp_keepalive_intvl 
75


可以通过echo临时修改

echo "300" >  /proc/sys/net/ipv4/tcp_keepalive_time


也可以通过修改/etc/sysctl.conf永久生效

$ grep net.ipv4.tcp_keepalive_time /etc/sysctl.conf
net.ipv4.tcp_keepalive_time = 300
$ sysctl -p|grep net.ipv4.tcp_keepalive_time
net.ipv4.tcp_keepalive_time = 300




参考资料:

http://tldp.org/HOWTO/TCP-Keepalive-HOWTO/index.html