博客主页:从零开始的-CodeNinja之路
⏩ 收录专栏:深度学习传输层TCP协议
欢迎大家点赞评论收藏⭐文章
TCP全称为"传输控制协议(Transmission Control Protocol"),要对数据的传输进行⼀个详细的控制;
端口号(Port):标识了⼀个主机上进行通信的不同的应用程序;
0-1023:知名端口号,HTTP,FTP,SSH等这些广为使用的应用层协议,他们的端口号都是固定的.
1024-65535:操作系统动态分配的端口号.客户端程序的端口号,就是由操作系统从这个范围分配 的.
32位序号/32位确认号:意思是告诉发送者,我已经收到了哪些数据;
4位TCP报头长度:表示该TCP头部有多少个32位bit(有多少个4字节);所以TCP头部最大长度是15* 4=60
6位标志位:
URG:紧急指针是否有效
ACK:确认号是否有效
PSH:提⽰接收端应⽤程序⽴刻从TCP缓冲区把数据读⾛
RST:对⽅要求重新建⽴连接;我们把携带RST标识的称为复位报⽂段
SYN:请求建⽴连接;我们把携带SYN标识的称为同步报⽂段
FIN:通知对⽅,本端要关闭了,我们称携带FIN标识的为结束报⽂段
每⼀个ACK都带有对应的确认序列号,意思是告诉发送者,我已经收到了哪些数据;下⼀次你从哪里开始
发.
- 主机A发送数据给B之后,可能因为网络拥堵等原因,数据无法到达主机B;
- 如果主机A在⼀个特定时间间隔内没有收到B发来的确认应答,就会进行重发;
但是,主机A未收到B发来的确认应答,也可能是因为ACK丢失了;
因此主机B会收到很多重复数据.那么TCP协议需要能够识别出那些包是重复的包,并且把重复的丢弃掉.
这时候我们可以利用前⾯提到的序列号,就可以很容易做到去重的效果.
在正常情况下,TCP要经过三次握手建立连接,四次挥手断开连接
建力连接的意义:
接收端处理数据的速度是有限的.如果发送端发的太快,导致接收端的缓冲区被打满,这个时候如果发送
端继续发送,就会造成丢包,继而引起丢包重传等等⼀系列连锁反应.
- 因此TCP支持根据接收端的处理能力,来决定发送端的发送速度.这个机制就叫做流量控制(Flow Control);
- 接收端将自己可以接收的缓冲区大小放⼊TCP首部中的"窗口大小"字段,通过ACK端通知发送端;
- 窗口大小字段越大,说明网络的吞吐量越高;
- 接收端⼀旦发现自己的缓冲区快满了,就会将窗口大小设置成⼀个更小的值通知给发送端;
- 发送端接受到这个窗⼝之后,就会减慢自己的发送速度;
- 如果接收端缓冲区满了,就会将窗口置为0;这时发送方不再发送数据,但是需要定期发送⼀个窗⼝探 测数据段,使接收端把窗口大小告诉发送端.
接收端如何把窗口大小告诉发送端呢?回忆我们的TCP首部中,有⼀个16位窗⼝字段,就是存放了窗⼝大小信息
TCP引入慢启动机制,先发少量的数据,探探路,摸清当前的网络拥堵状态,再决定按照多大的速度传输
数据;
此处引入⼀个概念程为拥塞窗口
- 发送开始的时候,定义拥塞窗口大小为1;
- 每次收到⼀个ACK应答,拥塞窗⼝加1;
- 每次发送数据包的时候,将拥塞窗⼝和接收端主机反馈的窗口大小做比较,取较小的值作为实际发送 的窗口;
像上面这样的拥塞窗⼝增长速度,是指数级别的."慢启动"只是指初使时慢,但是增⻓速度⾮常快.
- 为了不增⻓的那么快,因此不能使拥塞窗口单纯的加倍.
- 此处引⼊⼀个叫做慢启动的阈值
- 当拥塞窗口超过这个阈值的时候,不再按照指数方式增长,而是按照线性方式增长
- 当TCP开始启动的时候,慢启动阈值等于窗⼝最大值
- 在每次超时重发的时候,慢启动阈值会变成原来的⼀半,同时拥塞窗⼝置回1;
少量的丢包,我们仅仅是触发超时重传;大量的丢包,我们就认为网络拥塞;
当TCP通信开始后,网络吞吐量会逐渐上升;随着网络发生拥堵,吞吐量会立刻下降;
拥塞控制,归根结底是TCP协议想尽可能快的把数据传输给对方,但是又要避免给网络造成太大压力的折中方案.
刚才我们讨论了确认应答策略,对每⼀个发送的数据段,都要给⼀个ACK确认应答.收到ACK后再发送下
⼀个数据段.这样做有⼀个比较大的缺点,就是性能较差.尤其是数据往返的时间较长的时候.既然这样⼀发⼀收的⽅式性能较低,那么我们⼀次发送多条数据,就可以大大的提高性能(其实是将多个段的等待时间重叠在⼀起了).
窗口大小指的是无需等待确认应答而可以继续发送数据的最⼤值.上图的窗口大小就是4000个字节(四个段).
那么如果出现了丢包,如何进行重传?这里分两种情况讨论.
情况⼀:数据包已经抵达,ACK被丢了.
这种情况下,部分ACK丢了并不要紧,因为可以通过后续的ACK进行确认;
情况⼆:数据包就直接丢了
当某⼀段报文段丢失之后,发送端会⼀直收到1001这样的ACK,就像是在提醒发送端"我想要的是 1001"⼀样;
如果发送端主机连续三次收到了同样⼀个"1001"这样的应答,就会将对应的数据1001-2000重新发送;
这个时候接收端收到了1001之后,再次返回的ACK就是7001了(因为2001-7000)接收端其实之前就
已经收到了,被放到了接收端操作系统内核的接收缓冲区中;
这种机制被称为"高速重发控制"(也叫"快重传").
如果接收数据的主机立刻返回ACK应答,这时候返回的窗口可能比较小.
⼀定要记得,窗⼝越大,网络吞吐量就越大,传输效率就越高.我们的目标是在保证网 络不拥塞的情况下
尽量提高传输效率;
在延迟应答的基础上,我们发现,很多情况下,客户端服务器在应用层也是"⼀发⼀收"的.意味着客户端给服务器说了"How are you",服务器也会给客⼾端回⼀个"Fine,thank you";那么这个时候ACK就可以搭顺风车,和服务器回应的"Fine,thank you"⼀起回给客户端
为什么TCP这么复杂?因为要保证可靠性,同时又尽可能的提高性能.
可靠性:
确认应答
超时重发
连接管理
流量控制
拥塞控制
提高性能:
其他: