tcp_fin_timeout TIME_WAIT TCP
目录结构
正确理解tcp_fin_timeout到底起什么作用?TCP连接中TIME_WAIT状态,对tcp_fin_timeout的错误理解,批改ulimit参数和tcp的time wait参数。
批改ulimit参数和tcp的time wait参数
修改ulimit参数和tcp的time wait参数
1.linux下tcp的TIME_WAIT参数调整
netstat -na|awk '/^tcp/ {++S[$NF]} END {for(i in S) print i,S[i]}'
查看网络节点的tcp连接状态,如果发现系统存在大量的TIME_WAIT状态的连接,通过调整内核参数解决:
vi /etc/sysctl.conf
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_keepalive_time = 1200
net.ipv4.tcp_max_syn_backlog = 8192
net.ipv4.tcp_max_tw_buckets = 5000
然后执行以下命令让参数生效:/sbin/sysctl -p
TCP参数说明:
net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;
net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;
net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。
net.ipv4.tcp_fin_timeout = 30 表示如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间。
net.ipv4.tcp_keepalive_time = 1200 表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。
net.ipv4.ip_local_port_range = 1024 65000 表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。
net.ipv4.tcp_max_syn_backlog = 8192 表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。
net.ipv4.tcp_max_tw_buckets = 5000表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。默认为180000,改为5000。
对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。
上述四次握手描述的是客户段主动关闭,服务器被动关闭的流程,其一般过程如下:
客户端发送FIN报文段,进入FIN_WAIT_1状态。
服务器端收到FIN报文段,发送ACK表示确认,进入CLOSE_WAIT状态。
客户端收到FIN的确认报文段,进入FIN_WAIT_2状态。
服务器端发送FIN报文端,进入LAST_ACK状态。
客户端收到FIN报文端,发送FIN的ACK,同时进入TIME_WAIT状态,启动TIME_WAIT定时器,超时时间设为2MSL。
服务器端收到FIN的ACK,进入CLOSED状态。
客户端在k时间内没收到对端的任何响应,TIME_WAIT超时,进入CLOSED状态。
2.linux下ulimit参数调整
vi /etc/security/limits.conf
work soft nofile 65535
work hard nofile 65535
ulimit -SHn 65536
ulimit -n
TCP连接中TIME_WAIT状态
tcp_fin_timeout
对tcp_fin_timeout的错误理解
查询秀岭邮件提到的tcp_retrans_collapse时,意外发现了一段文档,按照文档的说法,貌似长久以来我对于tcp_fin_timeout的理解都是错误的!
先备份在这里,再验证文档来源:http://www.pgsqldb.org/mwiki/index.php/Linux%E5%86%85%E6%A0%B8%E5%8F%82%E6%95%B0
文档内容:
提高Linux应对短连接的负载能力
在存在大量短连接的情况下,Linux的TCP栈一般都会生成大量的 TIME_WAIT 状态的socket。你可以用下面的命令看到:
netstat -ant| grep -i time_wait
有时候,这个数目是惊人的:
netstat -ant|grep -i time_wait |wc -l
可能会超过三四万。这个时候,我们需要修改 linux kernel 的 tcp time wait的时间,缩短之,有个 sysctl 参数貌似可以使用,它是 /proc/sys/net/ipv4/tcp_fin_timeout,缺省值是 60,也就是60秒,很多网上的资料都说将这个数值设置低一些就可以减少netstat 里面的TIME_WAIT状态,但是这个说法是错误的。
经过认真阅读Linux的内核源代码,我们发现这个数值其实是输出用的,修改之后并没有真正的读回内核中进行使用,而内核中真正管用的是一个宏定义,在 $KERNEL/include/net/tcp.h 里面,有下面的行:
#define TCP_TIMEWAIT_LEN (60*HZ) /* how long to wait to destroy TIME-WAIT
* state, about 60 seconds */
而这个宏是真正控制 TCP TIME_WAIT 状态的超时时间的。如果我们希望减少 TIME_WAIT 状态的数目(从而节省一点点内核操作时间),那么可以把这个数值设置低一些,根据我们的测试,设置为 10 秒比较合适!
转载自51it技术博客:正确理解tcp_fin_timeout到底起什么作用?