网络原理-TCP_IP(2)

TCP协议

TCP全称为"传输控制协议(Transmission Control Protocol)".协议如其名,要对数据的传输进行一个详细的控制.

TCP协议段格式

网络原理-TCP_IP(2)_第1张图片

源/目的端口号:表示数据从哪个进程来,到哪个进程去.

32位序号/32位确认序号:后面详细讲.

4位TCP报头长度:表示该TCP头部有多少个32位bit(有多少个四字节);这个字段是一个16比特的字段,取值范围为0-15(即最大长度为60字节).TCP头部最小长度为20字节.

保留(6位):设定报头时,提前准备的保留位(虽不用,但先占位置),后面再使用,就可以避免tcp扩展引起的不兼容问题.

6位标志位(TCP的核心部分,后面也会讲到) :

URG:紧急指针是否有效;

ACK:确认号是否有效;

PSH:提示接收端应用程序立刻从TCP缓冲区把数据读走;

RST:对方要求重新建立连接;我们把携带RST标识的称为复位报文段;

SYN:请求建立连接;我们把携带SYN标识的称为同步报文段;

FIN:通知对方,本端要关闭了,我们称携带FIN标识的为结束报文段;

16位窗口大小:后面再说

16位校验和:类似于UDP校验和,但是把报头和数据载荷放在一起计算校验和.

16位紧急指针:标识哪部分数据是紧急数据.

选项:TCP报头中的前20个字节是固定长度的.后面包含"选项这部分"(可有可无,有一个也可有多个)

确认应答

注意:这个是确保可靠性的最核心的机制了.

网络原理-TCP_IP(2)_第2张图片

TCP将每个字节的数据都进行了编号,即为序列号(防止出现先发后至的问题). 

网络原理-TCP_IP(2)_第3张图片

每一个ACK都带有确认序列号,意思是告诉发送者,我们已经收到了哪些数据;下一次从哪里开始发.

应答报文的确认序号是按照发送过去的最后一个字节的序号+1设定.

超时重传

是确认应答的补充.

整个网络中,可能存在某个路由器/交换机.某个时刻突然负载量很高,短时间可能有大量的数据要经过这个设备转发.要知道,一台设备的处理量是有限的,很可能瞬间的高负载超出了设备量的极限,此时多出来的部分就无了(丢包了).

网络原理-TCP_IP(2)_第4张图片

主机A在发送数据给B时,可能因为网络拥堵等原因,数据无法到达主机B;

如果主机A在一个特定的时间间隔内没有收到B的确认应答,就会进行重发; 

 这种情况是接收方本来就未收到数据,此时重传理所应当,没有任何问题.

但是,主机A未收到B发来的确认应答,也可能是ACK丢失了.

网络原理-TCP_IP(2)_第5张图片

因此主机B会收到很多重复数据.那么TCP协议需要能够识别出哪些包是重复的包,并且把重复的包丢弃掉,这里就引入了缓冲区的概念.

TCPsocket在内核中存在接收缓冲区(一块内存空间).发送方的数据,是要先放在缓冲区中的.然后应用程序调用read/scanner.next才能读到的数据,这里的读操作是读接收缓冲区.

网络原理-TCP_IP(2)_第6张图片

当数据到达缓冲区的时候,接收方会首先判定一下看当前缓冲区中是否有这个数据了(或者这个数据曾经在缓冲区里面存在过).就直接把新来的数据丢弃了,就能确保程序调用read/scanner.next()的时候 不会出现重复数据了.

接收方是如何判定这个数据是否是"重复数据".核心的判断依据就是根据数据的序号.

1.数据还在缓冲区中,没有被read走.此时,就拿着新收到数据的序号,和缓冲区中的所有数据序号对比一下,看看有没有一样的,有一样的就是重复了,就可以把新收到的数据丢弃.

2.数据在缓冲区中,已经被应用给read走了,此时新来的数据序号无法得到.注意:应用程序在读取数据的时候,是按照序号的先后顺序连续读取的.一定是先读小的序号,后读大的序号的数据的.(可以想象为带有优先级的阻塞序列).

此时socket api就可以记录上一次读到最后一个字节的序号是多少.比如上一次读到的序号是3000,新收到的数据序号为1001,1001一定之前读过,可以将其判断为"重复的包"直接丢掉.

这样就可以利用序列号很容易做到去重的效果,

那么,超时的时间如何确定?

最理想的状态下,找到一个最小的时间,保证"确认应答一定能在这个时间内返回".

但是这个时间的长短,随着网络环境的不同,是有差异的.

如果超时的时间设置太长,会影响整体重传的效率.

如果超时的时间设置的太短,有可能会发送重复的包.

TCP为了保证无论在任何环境下都能较高性能的通信,因此会动态计算这个最大的超时时间,

1.Linux中(BSD Unix和Windows也是如此),超时以500ms为一个单位进行控制,每次判定超时重发的超时时间都是500ms的整数倍.

2.如果重发一次之后,仍然得不到应答,等待2 * 500ms进行重传.

3.如果仍然得不到应答,等待4*500ms进行重传,以此类推,以指数形式递增.

4.累计达到一定重传次数,TCP认为网络或者对端主机出现异常,强制关闭连接.

 

 

你可能感兴趣的:(网络,tcp/ip,服务器)