记录一次阿里云服务器故障排查思路

公司网络是nat 环境

问题:

同一个服务有两台服务器 172.19.19.252  172.19.19.187 
两台服务器 要连node5  发现172.19.19.252 这台服务器连不通

思路:

1.两台服务器是同一个安全组  环境相同  所以排除安全组 防火墙的问题
2. ping node5  发现可以ping通 telnet 不通

tcpdump 抓包
        尝试抓包,主机能收到,但是没有给出响应

经过查找资料找到解决办法:
修改内核参数
在node5 机器上添加参数
vi /etc/sysctl.conf
加入如下内容

net.ipv4.tcp_tw_recycle=0
net.ipv4.tcp_timestamps=0

然后执行systctl -p  telnet正常。 接口正常

网上看了下也有遇到这个问题的。

NAT网络下  tcp_tw_recycle 建议关闭

在这里记录下,内核相关的参数在不熟悉的情况下慎重修改。