在服务器日常维护中会使用命令

[root@iZ28e9gp03vZ ~]# ss -ant|sort|awk '{++s[$1]} END {for (a in s) {print a,s[a]}}'


显示如下:

State 1

ESTAB 106

FIN-WAIT-2 6

TIME-WAIT 129

CLOSE-WAIT 3

LISTEN 51

常用的三个状态是:ESTABLISHED 表示正在通信,TIME_WAIT 表示主动关闭,CLOSE_WAIT 表示被动关闭。


因为linux分配给一个用户的文件句柄是有限的而TIME_WAIT和CLOSE_WAIT两种状态如果一直被保持,那么意味着对应数目的通道就一直被占着,一旦达到句柄数上限,新的请求就无法被处理了,接着就是大量Too Many Open Files异常,tomcat崩溃。。。

解决思路很简单,就是让服务器能够快速回收和重用那些TIME_WAIT的资源。

 

下面来看一下我们网管对/etc/sysctl.conf文件的修改:

    #对于一个新建连接,内核要发送多少个 SYN 连接请求才决定放弃,不应该大于255,默认值是5,对应于180秒左右时间   

    net.ipv4.tcp_syn_retries=2  

    #net.ipv4.tcp_synack_retries=2  

    #表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为300秒  

    net.ipv4.tcp_keepalive_time=1200  

    net.ipv4.tcp_orphan_retries=3  

    #表示如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间  

    net.ipv4.tcp_fin_timeout=30    

    #表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。  

    net.ipv4.tcp_max_syn_backlog = 4096  

    #表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN***,默认为0,表示关闭  

    net.ipv4.tcp_syncookies = 1  


    #表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭  

    net.ipv4.tcp_tw_reuse = 1  

    #表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭  

    net.ipv4.tcp_tw_recycle = 1  

    ##减少超时前的探测次数   

    net.ipv4.tcp_keepalive_probes=5   

    ##优化网络设备接收队列   

    net.core.netdev_max_backlog=3000  

注:以上参数都可以通过/proc/sys/net/*来调节 


修改完之后执行/sbin/sysctl -p让参数生效。

 

这里头主要注意到的是net.ipv4.tcp_tw_reuse

net.ipv4.tcp_tw_recycle
net.ipv4.tcp_fin_timeout
net.ipv4.tcp_keepalive_*

这几个参数。

 

net.ipv4.tcp_tw_reuse和net.ipv4.tcp_tw_recycle的开启都是为了回收处于TIME_WAIT状态的资源。

net.ipv4.tcp_fin_timeout这个时间可以减少在异常情况下服务器从FIN-WAIT-2转到TIME_WAIT的时间。

net.ipv4.tcp_keepalive_*一系列参数,是用来设置服务器检测连接存活的相关配置。