网络编程(12): TCP重传、滑动窗口、流量控制、拥塞控制

1、TCP重传机制

通过序列号和确认号确保可靠传输,当发送端发送数据给接收到,接收端会返回一个确认号,表示收到消息了

  • 超时重传:没有在指定时间内收到ACK报文
    • 超时重传的两种可能:数据包丢失确认包丢失
    • 超时重传时间RTO:
      • RTO较大:重发就变慢了,丢包之后需要半天才能重发,效率低
      • RTO较小:可能没有丢包,还在等待ACK过程中,就重发了,会导致网络拥塞,进而导致更多的超时重发
      • 所以RTO需要略大于报文往返的时间RTT(数据发送到接收到ACK的时间差)
    • 由于网络波动问题,RTT可能不是固定的,所以RTO对应也不是固定的
    • 一般超时重传一次,下一次超时重传的间隔会加倍,避免网络环境差的频繁发送
  • 快速重传
    • 超时重传的问题:重传周期可能很长(时间会加倍),快速重传可以解决这个问题,以数据为驱动作为重传
    • 发送了数据包seq1~seq5,
      • 发送端发送seq1,接收端回复ack=2,表示接收到包1
      • seq2丢失
      • 发送端连续发送seq3~seq5,接收端会重复返回ack=2
      • 连续三次ack=2,触发快速重传,重复seq2
      • 由于接收到了seq3~seq5,发送端会返回ack=6
    • 快速重传只解决了超时问题,但是还有一个问题:重传的时候重传一个还是所有数据包
    • 因为如果只重传一个,当有两个数据包丢失的时候,需要判断两次返回的ack(三次重复),来进行单包重传,效率低
    • 如果重传所有,就会有多余的包被重新发送,无用功
  • SACK:选择性确认,可以知道哪些数据丢失了
    • 需要TCP头部选项字段中,添加一个SACK,可以将已接收到的数据的信息发送给发送方,发送方就知道了哪些数据丢失了,从而只发送丢失的数据
    • 在快速重传的基础上,发送方收到三次相同的ack报文,触发快速重传机制,通过SACK信息可以知道哪段数据丢失了,只对丢失的数据重传
  • D-SACK:通过SACK告诉发送端哪些数据被重复接收了
    • 可以让发送端知道是包丢失,还是ACK包丢失了
    • 可以知道发送的数据包是不是被网络延迟了
    • 可以知道网络中是不是把发送端的数据包给复制了
  • 小结:
    • 如果数据包丢失或者ACK包丢失,超过一定时间会触发超时重传,超时时间RTO略大于RTT时间(发送数据到接收ACK包的时间间隔)
    • 为了解决超时等待的时间,提高效率,就有了快速重传,当有一个包丢失的时候,可以通过判断重复的ack进行快速重传,通过在TCP头部的选项字段里面添加SACK,就可以知道哪些包是丢失的,从而只重传丢失的包
    • 如果在ACK包丢失,导致的超时重传,发送端接收到接收端SACK从而知道收到了重复数据,这个SACK就是D-SACK,如果一个包由于网络问题导致的快速重传,也可以通过D-SACK来进行判断

2、TCP滑动窗口

TCP每次发送数据都要进行确认应答,当上一个包收到应答了再发下一个

  • 如果是一问一答的形式,则数据包往返的时间周期越长,通信效率就越低
  • 为了解决上面的问题,就有窗口概念,
    • 可以指定窗口大小,窗口大小是不需要等待确认应答,可以继续发送数据的最大值
    • 窗口是内核里面开辟的缓存区,需要保留发送的数据,只有收到应答才会从缓冲区中删除
    • TCP头部可以指定窗口大小,发送端会根据ACK返回的窗口大小,来发送数据,从而保证对端可以正常接收数据,所以窗口大小是由接收端决定的
  • 发送端的窗口
    • 有两个绝对指针:一个指向没有收到ack的第一个字节的序列号, 一个指向窗口中可用空间的第一个字节的序列号
    • 会根据ACK报文中的窗口大小进行调整,因为应用层不一定及时收数据
    • 此外,如果发送端窗口满了,没有及时收到ACK,就不能在应用层进行发送数据,如果序列号较前的收到ack,窗口会向右移动,存在可发空间,应用层可以继续拷贝发送数据
  • 接收端的窗口:可以接收发送端发送的数据量,一次能处理的数据量
    • 只有一个绝对指针,指向期望对端发送来的下一个字节的序列号
    • 窗口里面是还没进行确认的数据,也就是还没收到的数据,但是可以接收的数据大小
  • 发送端窗口约等于接收端窗口,因为传输存在延迟,不一定及时调整窗口大小,所以是约等于
  • 小结:
    • 三次握手确定窗口大小,接收端能接收多少数据,发送端根据接收端数据进行调整,去发送数据,在发送端窗口大小内,发送端可以一直发,并等待接收端返回ack确认号来发送窗口移动,每次ack报文都会携带窗口大小,可能会改变;

3、TCP流量控制

利用滑动窗口实现流量控制,发送端不能一股脑的发过去,如果对方处理不过来就会触发重传机制

  • 流量控制:发送方 根据 接收方的实际接收能力发送数据,也就是接收端滑动窗口的大小
  • TCP内核缓冲区和滑动窗口的关系:缓冲区大小会影响窗口大小
    • 应用层不及时收取数据,会导致窗口变小:
      • TCP滑动窗口(指针实现)是处于TCP缓冲区中间的,如果接收端接收到数据并返回ACK,但是应用层没有及时收取,当缓冲区内存不够,可能会导致滑动窗口变小,当窗口大小变成0,就发生了窗口关闭
    • 系统资源减少,会导致缓冲区变小:
      • 如果用户空间没有及时读取缓冲区数据,并且接收缓冲区由于系统资源突然变小,发送端来不及调整,会导致数据丢包现象,这是因为先减少缓冲区再收缩窗口
      • 所以不允许同时减少缓冲又收缩窗口,而先收缩窗口后一段时间再减少缓冲,从而避免丢包
  • 窗口关闭
    • 窗口大小为0的情况,就会阻止发送端发送数据,直到大小变成非0
    • 如果接收端窗口变成非0,会通过发送携带窗口大小的ACK报文,如果ACK报文丢失,发送端会一直等待,造成死锁问题
    • 如何避免死锁问题:当窗口关闭,就会启动一个持续计时器,如果超时就会发送一个窗口探测报文,接收端收到这个报文,就会返回一个携带当前窗口大小的ACK报文,如果窗口依旧为0,就会重启持续计时器
  • 糊涂窗口综合症
    • 接收端太忙,会导致发送端的窗口越来越小,到最后只有接收端腾出字节空间,发送端就会马上发送,但是TCP/IP包头就有40字节,有数据就传输的话,开销太大了
    • 导致的原因是:
      • 接收端告知小窗口大小
      • 发送端发送小数据
    • 如何避免:
      • 接收方不告知小窗口,窗口小于某个值就发送窗口为0的ACK,阻止对端发送数据
      • 发送发避免发送小数据,开启Nagle算法,避免小包发送
  • Nagle算法思想,延时处理,满足下面一个条件即可:
    • 窗口大小>=MSS并且数据大小>=MSS
    • 收到前一个数据的ack报文
  • 一般需要搭配 不通知小窗口给发送方+开启Nagle算法才能避免糊涂窗口综合症

4、TCP拥塞控制

  • 流量控制:是为了避免,发送端 数据填满 接收端的缓存,但是流量控制并不知道网络中发送的情况

  • 网络拥塞:网络发生拥堵的时候,继续发送大量数据包,就可能导致数据包延时、丢失等情况,TCP就会重传数据,一旦重传就会导致网络更加拥堵,从而不断恶性循环

  • 拥塞控制避免发送方的数据填满整个网络,并且为了调节发送数据的量,定义了一个拥塞窗口(cwnd)的概念

  • 拥塞窗口(cwnd):是发送方维护的一个状态变量,会根据网络的拥塞程度进行变化,滑动的发送窗口=min(滑动的接收窗口,拥塞窗口),当网络没有出现拥塞,cwnd窗口就会越大,当网络出现拥塞,cwnd就会越小

  • 如何判断网络拥塞:发送方没有在指定时间接收到ACK应答报文,也就是发送超时重传,就会认为网络出现拥塞了

  • 拥塞控制主要是四算法:

    • 慢启动:(指数增长)
      • TCP建立连接后,一点点点提高数据包发送的数量,发送端没收到一个ACK,拥塞窗口cwnd的大小就会+1;
      • 存在一个慢启动门限ssthresh,如果cwnd<ssthresh使用的就是慢启动算法,如果cwnd>=ssthresh,就使用拥塞避免算法;ssthresh一般大小为65535字节
    • 拥塞避免
      • 没收到一个ACK,cwnd增加1/cwnd,是为了确保cwnd的线性增长
      • 如果一直保持增长,网络就会慢慢进入拥塞状态,从而出现了丢包现象
      • 如果触发了重传机制,就会进入拥塞发生算法
    • 拥塞发送
      • 发生重传(超时、快速)的时候就会进入拥塞发生算法
      • 超时重传的拥塞发生:
        • ssthresh会设置为cwnd/2,并且cwnd会回复为初始值,linux的初始值是10(10个MSS);
        • 设置完ssthreshcwnd之后,会重新开始慢启动;
        • 这种方式下来的拥塞发生太激进了,容易造成网络卡顿
      • 快速重传的拥塞发生:
        • 设置cwndcwnd/2,再设置ssthreshcwnd
        • 设置完之后,会进入快速回复算法
    • 快速回复
      • 当发生快速重传的时候,表示网络不是太糟糕,一般快速回复和快速重传同时使用
      • 进入快速回复前, cwndssthresh都全部设置完了
      • 快速回复
        • cwnd = ssthresh+3,3表示接收到了三个数据包
        • 重传丢失的数据包;
        • 如果再收到重复的ACKcwnd就+1
        • 如果收到的是新的ACK,表示网络没问题了,则将cwnd设置为ssthresh,进入拥塞避免状态;
  • 拥塞控制算法过程:

    • 从TCP三次握手建立连接开始,发送端开始慢启动,没收到一个包的ACK,拥塞窗口就会+1,如果达到阈值,就会进入拥塞避免算法,每收到一个包的ACK,拥塞窗口就会增加窗口的倒数,从而保证拥塞窗口的线性增加
    • 当遇到丢包的情况,就判断为网络拥塞,从而重复重传机制,进入拥塞发送算法,根据重传机制的不同,拥塞发送算法也会不同
    • 超时重传,sthresh=cwnd/2,并且cwnd=初始值,重新重慢启动开始
    • 快速重传,cwnd=cwnd/2,ssthresh=cwnd,开启快速回复
    • 快速回复:先是设置cwnd=ssthresh+3,并重传丢失数据包,如果依旧重复收到相同的ACK,就会重复触发快速重传和快速回复,如果收到的是新的数据包,则进入拥塞避免状态。

参考文章:小林coding

你可能感兴趣的:(网络编程,网络,tcp/ip)