5分钟搞懂ECN

ECN是通过在IP和TCP头中携带拥塞信息,通知发送方网络拥塞状态,从而采取相应拥塞控制措施。原文: What is ECN(Explicit Congestion Notification)?[1]

ECN是Explicit Congestion Notification的缩写,意思是显式拥塞通知算法,和慢启动重启或者AIMD那样的拥塞控制算法不一样,ECN只做一件事情,即将路由器的拥塞状态通知给发送方。因此,ECN是一种拥塞通知或拥塞信令算法,通知发送方有关拥塞的情况,以便采取相应措施避免拥塞。

ECN是RFC 3168中定义的拥塞信令机制,首次发表于1999年,并在2001年左右定稿。ECN利用TCP报头中的两位和IP报头中的两位标记数据包(标记的意思是在头域中翻转一位)。

=>假设X让人给Z转交一封信。

=>X将信传递给中间人Y。

=>Y先看看自己忙不忙。

=>如果Y比较忙,就在信封的一角用钢笔做个十字记号,然后把信传给下一个人。

=>当Z收到信时,看到信封一角有十字标记,就知道其中一个中间人现在比较忙。

=>Z沿原路径给发送方X发送ACK, ACK信封上带有相同的标记。看到这个标记,X就知道发生了拥塞。

ECN可以与AQM算法一起使用。AQM算法在链路拥塞时会主动丢弃数据包,但如果不是丢包,而是可以标记,那就太好了。由于ECN不会丢弃数据包,从而避免了重传,这就是为什么ECN算法今天非常流行。目的只是让发送方知道路由器发生了拥塞,所以如果可以通过ECN告诉发送方,为什么要丢包呢?此外,丢包没法让发送方立马知道发生了拥塞,而这对于时间敏感型数据包非常重要,因为这种类型的流量不高。

为了使用ECN机制,发送方、接收方和中间的路由器必须全部支持ECN功能。目前,ECN可以在所有操作系统中实现,比如手机、服务器、笔记本电脑,包括路由器等中间设备。但默认情况下是禁用的,原因不是ECN有什么问题,而是因为ECN与AQM算法一起部署,而由于参数配置的原因,AQM并不太受欢迎。

TCP报头中的ECN位:

5分钟搞懂ECN_第1张图片 5分钟搞懂ECN_第2张图片

ECN在TCP头中占用2位,分别是CWR和ECE,注意两者的顺序。

  • CWR: Congestion Window Reduced,拥塞窗口减少标志
  • ECE: Echo of Congestion Encountered,拥塞响应

这2位有4种可能组合,每种组合被称为码点(codepoint)。

ECN TCP报头中的码点:

CWR ECE 码点 发送自 目标
1 0 0 Non-ECN set up 任意 任意
2 0 1 ECN Echo 接收方 发送方
3 1 0 Congestion window reduced 发送方 接收方
4 1 1 ECN Setup 发送方 接收方
  • [0 0]为非ECN设置码点,收发双方都可以发送。X发送给Y这个代码点的意思是X告诉Y它不支持ECN。
  • [0 1]为ECN Echo码点,由接收方发送给发送方。如果发送方告诉接收方他支持ECN,接收方会告诉发送方自己是否支持ECN。如果接收方支持ECN,那就用这个码点回复。此外,接收方告诉发送方拥塞时也使用此码点。因此这个码点有两种用法。
  • [1 0]为CWR码点,由发送方发送给接收方。此码点用作从发送方发送到接收方的确认,用于告诉接收方,它知道发生了拥塞,已经减小了拥塞窗口大小。
  • [1 1]为ECN设置码点,由发送方发送给接收方,告知发送方支持ECN。

ECN协商:

5分钟搞懂ECN_第3张图片
  • 第一步: 发送方发送带有ECN设置码点(CWR=1, ECE=1)的SYN包,告诉接收方它支持ECN。在通过三次握手建立TCP连接时,这些信息总是以SYN包的形式传递,而接收方也必须回复ECN的状态。
  • 第二步: 如果接收方支持ECN,就发送ECN Echo码点(CWR=0, ECE=1),表示接收方也启用了ECN。假设接收方不支持ECN,那么回复非ECN设置码点(CWR=0, ECE=0),表示没有启用ECN。
  • 第三步: 现在,发送方和接收方已经交换了ECN信息,可以像正常一样发送数据。

如果发送方和接收方都支持ECN,并且都标记而不是丢弃数据包。但由于路由器不能读取TCP报头,只能读取IP报头,因此在IP报头中也用2位来通知路由器有关ECN的信息。

IP报头中的ECN位:

5分钟搞懂ECN_第4张图片 5分钟搞懂ECN_第5张图片

路由器需要运行AQM并标记数据包,因此必须知道发送方和接收方是否启用了ECN。由于路由器不能访问TCP报头,所以在IP报头中增加了2位作为ECN码点。

第一位被称为ECT(ECN Capable Transport),第二位被称为CE(Congestion Encountered)。同样会有四个码点,但和之前介绍的不太一样。

IP报头中的ECN码点:

ECT CE 码点 发送自 目标
1 0 0 Non-ECT 任意 任意
2 0 1 ECT(1): ECN Capable Transport 发送方 接收方
3 1 0 ECT(0): ECN Capable Transport 发送方 接收方
4 1 1 CE: Congestion Experienced 路由器 接收方
  • [0 0]表示非ECT,意思是数据包不支持ECN,因此没有必要标记该数据包。如果有拥塞,那么这个数据包必须被丢弃。
  • [0 1]是ECT(0)码点,表示数据包支持ECT。
  • [1 0]为ECT(1)码点,也表示数据包支持ECT。如果数据包是ECT(0)或(1),那么这个数据包将不会被路由器丢弃,而只是会被标记。
  • [1 1]为CE码点。当路由器拥塞并且数据包支持ECT时,路由器将该数据包标记为CE。路由器将翻转ECT码点的0位,使其成为CE。路由器不丢包,而只是标记并将其传输给接收者。

你好,我是俞凡,在Motorola做过研发,现在在Mavenir做技术工作,对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI等技术始终保持着浓厚的兴趣,平时喜欢阅读、思考,相信持续学习、终身成长,欢迎一起交流学习。为了方便大家以后能第一时间看到文章,请朋友们关注公众号"DeepNoMind",并设个星标吧,如果能一键三连(转发、点赞、在看),则能给我带来更多的支持和动力,激励我持续写下去,和大家共同成长进步!

参考资料

[1]

What is ECN(Explicit Congestion Notification)?: https://www.geeksforgeeks.org/what-is-ecnexplicit-congestion-notification

- END -

本文由 mdnice 多平台发布

你可能感兴趣的:(程序人生)