目录
TCP协议格式
感性理解TCP报头
认识报头中的字段
序号和确认序号
4位首部长度
窗口大小
标记位
确认应答机制
超时重传机制
linux内核是用C语言写的,所以报头实际上就是一种结构化的数据对象,用伪代码可表示为如下结构:
序号:表示本报文段所发送数据的第一个字节的编号。
确认序号:表示接收方期望收到发送方下一个报文段的第一个字节数据的编号。
4个比特位能够表示的十进制数据范围是【0,15】,TCP报头的总长度=4位首部长度*4字节,也就是说报头的总长度范围是【0,60】,但是报头中还包含固定大小的20字节。综上所述,报头的最终范围是【20,60】。
在发送数据的过程中,发送数据的速度太快不合适,发送的太慢也不行。窗口大小的作用就是反馈接收缓冲区剩余空间的大小。发送方根据这一反馈就能合适的进行数据发送。
TCP报文是要给对方发送的,对于客户端和服务端都是适用的,在通信的过程中交换对方的接收能力。
TCP报文是有类型的,根据不同的类型完成不同的动作。
SYN:同步标志位(握手请求)。
FIN:断开连接标记位。
ACK:确认号是否有效。
PSH:催促接收方,让上层尽快取走数据更新缓冲区。
URG:需要被尽快读取的数据,标记紧急指针是否有效。
RST:复位标记位,对方要求重新建立连接。
TCP可靠性
在网络传输的过程中,存在不可靠的问题,本质原因是传输距离变长了。举个简单的例子,如果小明问同桌小红下课要不要去操场跑步,即使小红只是点了点头,小明也可以确认小红收到了我说的话。同理,如果我们相隔100米之外喊话,能不能听到,能不能把信息完整的听取到都是不可靠的。 在网络传输中,常见的不可靠场景有丢包、乱序、校验错误、重复等。
TCP的可靠性怎样保证:确认应答+超时重传。
●一个报文如果收到了应答,就能说明它的可靠性
小明:你吃了吗?
小刚:吃了
我们认为,只要收到了应答,历史消息就能确认被收到。也就是说,确认了应答才算可靠。
小明:一会去打球吗
小刚:未应答
在双方通信的过程中,一定会存在最新的消息没有被应答。最新的消息一般无法保证可靠性。
●数据发送的顺序和数据到达的顺序不一定是匹配的。
针对发送的请求进行编号,应答的时候也针对编号进行应答,这样就能保证数据传输没有歧义。
TCP 是面向字节流的,TCP将每个字节的数据都进行了编号,即为序列号。
每一个ACK都带有对应的确认序列号,确认序列号意在告诉发送者,已经收到了哪些数据,下次发送该从哪里开始。
为什么要有两组序号?
答:TCP客户端和服务端双方的地位是对等的,是全双工的。既能接收数据也能发送数据。
针对数据在网络传输中丢包的情况,TCP的处理方式是进行重传。
情况1:请求丢了。重传
主机A发送数据给B之后, 可能因为网络拥堵等原因, 数据无法到达主机B;如果主机A在一个特定时间间隔内没有收到B发来的确认应答, 就会进行重发
情况2:应答丢了。重传
主机A发送数据给B之后, 没有收到B发来的确认应答也可能是应答丢了,在一段时间间隔后就会进行重发。
这里需要注意的是,如果主机B收到很多重复的数据,TCP根据序列号能够识别出重复的包,很容易就能做到去重。
对于超时时间而言,设置为固定长短是不合理的。举个例子来说,如果在一个网络环境很快的情况下,数据已经丢了,过了很久才进行重传,效率就大大降低。反之,在一个网络环境较差的情况下,如果超时重传的时间设置的较短,数据还没到,就再次发送了。上述情况很明显是不合理的。
最理想的情况下, 找到一个最小的时间, 保证 "确认应答一定能在这个时间内返回"。但是这个时间的长短, 随着网络环境的不同, 是有差异的。
a.如果超时时间设的太长, 会影响整体的重传效率;
b.如果超时时间设的太短, 有可能会频繁发送重复的包;
所以超时重传的时间间隔是浮动的。TCP为了保证无论在任何环境下都能有较高性能的通信,会动态计算这个最大超时时间。