TCP全连接和半连接

最近听组内老司机分享了关于TCP半连接和全连接的分享,颇有收获。

现网问题:
server、client负载都不是很高的时候,居然可能会出现如下两个问题
1、Client端在多次重发SYN包得不到响应而返回(connection time out)错误
2、client端报错read timeout 或者 connection reset by peer

负载不是很高的情况下,一般不会出现这种情况,所以估计是linux内核参数哪里不对,需要对整个TCP连接进行回顾。

TCP连接的基本概念:

三次握手:
1、第一次握手:客户端发送syn包(syn=j)到服务器,并进入SYN_SEND状态,等待服务器确认;
2、第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态;
3、第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手。

四次分手:
1、客户端向服务器发送一个FIN为1 的TCP报文
2、服务器返回给客户端一个确认ACK报文
3、服务器同时发送一个FIN报文
4、客户机回复ACK报文后(四次握手),连接结束。


Linux内核协议栈为一个tcp连接管理使用两个队列,一个是半链接队列(用来保存处于SYN_SENT和SYN_RECV状态的请求),一个是全连接队列(accpetd队列)(用来保存处于established状态,但是应用层没有调用accept取走的请求)。


全连接队列的大小取决于:min(tcp_max_syn_backlog, net.core.somaxconn)
半连接队列的大小取决于:max(64, tcp_max_syn_backlog)


全连接队列、半连接队列溢出很容易忽视,对于一些短连接应用(比如Nginx、PHP)更容易爆发。一旦溢出,Server端从cpu、线程状态看负载正常,但压力上不去。而Client端看来,请求耗时较高,但server端记录的服务响应又很短,同时客户端会不定期出现连接超时、socket 读写超时 的现象。

客户端调整思路
对TCP连接失败,增加重试机制和超时时间
启用长连接机制 (可减少连接环节开销,从而降低延时)

服务端调整思路
修改内核参数,适当调整 net.core.somaxconn (调整全队列长度)
修改内核参数,适当调整 tcp_max_syn_backlog (调整半队列长度)




你可能感兴趣的:(linux,tcp)