全球未来网络发展白皮书--笔记

文章目录

      • 一、全球未来网络发展白皮书
      • 二、未来网络的能力
      • 三、流媒体传输中的问题

一、全球未来网络发展白皮书

需求:5G,消费互联网,工业互联网,物联网为主的通信网络基础设施,人工智能,云计算,区块链为代表的新技术基础设施,以数据中心,智能计算中心为代表的算力基础设施。
探索:网络基础理论
网络体系架构:超低时延(通信时延为0.1ms,是5G的十分之一),超高通量带宽(6G速度将达到100Gbps~1Tbps,而5G为10Gpbs),超高可靠性(中断几率小于百万分之一),超大规模链接(连接设备密度达到每立方米过百个)的网络体系架构,旨在改变现有的TCP/IP网络模式
关键技术:低时延/确定性网络技术,云边端协同计算网络技术,网络人工智能技术

二、未来网络的能力

1)超低时延,超高通量带宽(吞吐量),超大规模连接
2)网络,计算,存储多维资源一体化,具备多为资源统一调度的能力,由基础承载平面向叠加服务平面的转化
3)软件定义方式增强网络弹性
4)基础设施与服务去中心化,促进个人数据与应用解藕,强调隐私保护与信息中立----边缘计算,联邦学习

新基建:5G,消费互联网,工业互联网,物联网为主的通信网络基础设施,人工智能,云计算,区块链为代表的新技术基础设施,以数据中心,智能计算中心为代表的算力基础设施。

例如车联网,需要10ms以下的时延,0.2ms以下的发包抖动,对传输时延,大规模连接,吞吐量,抖动,可靠性,算力,存储带来了巨大的考验

美国的研究重点:软件定义基础设置,未来网络架构与协议开发

三、流媒体传输中的问题

1. 超低时延传输框架,体系,协议
2. 多路径传输,跨层协同机制,网络编码缓解当前传输协议带宽利用不足的问题,边缘计算缓解当前传输时延,资源和存储瓶颈问题,联邦学习缓解多个体资源公平性问题
3. 超高通量,超大数据突发,差异化服务传输问题-----网络吞吐量的即时感知数据的突发,热点问题

4. 网络,计算,存储,多维资源一体化

随着互联网在 2020 年正式迎来下半场,未来面向 2030 的架构与能力提出了巨大的挑战。挑战之一,来源于目前 IT 与 CT 的加速融合,网络与计算/存储的边界正在逐步模糊,各类 IT 与 CT 资源正在广域网范围形成能力一体化并统一按需提供服务,将导致互联网的架构从传统的“以网络资源为中心”转变为未来的“以应用服务为中心”。挑战之二,来源于产业互联网的潜在爆发,相关的自动化要素通过互联网进行流通与协同,对网络传输的时延、抖动、带宽等指标提出了精细量化的需求,将导致互联网的能力从传统的“随机不可控”进化为未来的“确定可预期”

5. 确定性网络--解释:延迟可控的网络

根据全球移动数据流量预测报告显示,到 2020 年全球 IP 网络接入设备将达263 亿,其中工业和机器连接将达 122 亿,相当于总连接设备的一半;高清和超高清互联网视频将占全球互联网流量的 64%。激增的视频流量和工业机器应用,带来了大量的拥塞崩溃和数据包延迟;许多网络应用,例如工业互联网中的数据上传和控制指令下发、远程机器人手术、无人驾驶、VR 游戏等,需要将端到端时延控制在微秒到几毫秒量级,将时延抖动控制在微妙级,但传统的网络只能将端到端的时延减少到几十毫秒。面对时延敏感性业务的迫切需求,如何从“尽力而为”到“准时、准确、快速”,控制并降低端到端的时延对 IP 网络提出了新的挑战。

  • IETF 于 2014 年底成立 Deterministic Networking(DetNet)工作组,专注于在第 2 层桥接和第 3 层路由段上操作的确定性数据路径,目标在于将确定性网络通过 IP/MPLS 等技术扩展到广域网上。目前确定性网络技术主要包括 FlexE、AVB/TSN、DetNet。FlexE 应用于物理层与数据链路层之间,它通过时分复用分发机制,将多个 Client 接口的数据按照时隙方式调度并分发至多个不同的子通道,使网络即具备类似于 TDM(时分复用)的独占时隙、隔离性好的特性,又具备以太网统计复用、网络效率高的特性。AVB/TSN 应用于数据链路层,该技术首先将网络中需求不同的流量分成不同的优先级流,将有确定性需求的流量与其余流量区分开,通过不同的流量整形机制为高优先级流量提供确定的传输“时隙”,以保证时间敏感流量有一条确定的传输路径。DetNet 应用于网络层,该技术的目标是在第 2 层桥接和第 3 层路由段上实现确定传输路径,这些路径可以提供延迟、丢包和抖动的最坏情况界限,以此提供确定的延迟。
  • FlexE 全称为灵活以太网(Flexible Ethernet,FlexE),最早起源于 OIF 接口物理层标准,因其具有带宽灵活可调、数据隔离、完美契合 5G 业务等特点,受到全球主流运营商、供应商的认可。FlexE 技术通过对以太网轻量级增强, 在以太网 L2(MAC)/L1(PHY)之间的中间层增加 FlexE Shim 层,Flex Shim 层基于时分复用分发机制,将多个 Client 接口的数据按照时隙方式调度并分发至多个不同的子通道。以 100GE 管道为例,通过 FlexE Shim 可以划分为 20 个 5G 速率的子通道,每个 Client 侧接口可指定使用某一个或多个子通道,实现业务隔离。FlexE 能够实现大端口的捆绑功能,有效地解决之前网络带宽升级面临的问题。FlexE 分片基于时隙调度将一个物理以太网端口划分为多个以太网弹性硬管道,使得网络既具备类似于 TDM(时分复用)独占时隙、隔离性好的特性,又具备以太网统计复用、网络效率高的双重特点,实现同一分片内业务统计复用,分片之间业务互不影响,相对于通过 VPN 实现的分片隔离性更好,为 5G 网络分片提供了更多选择。
  • TSN 是在传统以太网上提供确定性信息传输的标准化技术。TSN 技术是集中式控制的,并且主要通过时间感知调度机制为基于 TSN 技术的应用程序提供实时数据传输保证。具体地说,TSN 是一种“二层”的网络技术,TSN 的数据转发功能主要依赖于以太网数据帧的包头信息,这表明 TSN 依然是一种以太网标准化技术。TSN 技术的数据帧负载可以是任何信息,并不限于上层网络协议的要求。这意味着 TSN 可以在基于以太网技术的任何环境和应用程序中使用。TSN技术的核心目标是为业界提供一种方法, 以确保信息从源节点传输到目标节点所需的时间范围确定、可预测。时间敏感网络技术的主要功能包括时间同步、可预测低延时、低抖动、高可用性、融合网络、兼容性等。在上述特性支持下, TSN能够确保交换网络中的数据传输时延是可预测的,高优先级负载(对时间敏感的数据)和普通负载(对时间不敏感的数据)可以在同个网络混合传输,非高优先级负载的并行传输不会影响到高优先级负载的传输时延,多个上层(如应用层)协议的实时负载能够在网络中并行传输,网络中出现的错误能够被快速分析和修复。
  • DetNet 技术有助于实现 IP 网络从“尽力而为(best-effort)”到“准时、准确、快速”控制并降低端到端时延的技术。2015 年,IETF 成立 DetNet 工作组,专注于在第 2 层桥接和第 3 层路由段上实现确定传输路径,这些路径可以提供延迟、丢包和抖动的最坏情况界限,以此提供确定的延迟。DetNet 工作组的目标在于将确定性网络通过 IP/MPLS 等技术扩展到广域网上。目前,IETF(DetNet)工作组正在推进解决方案,关注 DetNet 的整体架构、数据平面规范、数据流量信息模型、YANG 模型等。确定性网络工作组侧重于在第 2 层桥接和第 3 层路由段上运行的确定性数据路径,致力于支持需要确定性网络应用的第 3 层。
  • 目前提出的都是基于链路层和网络层(IP层)进行确定性路径处理,这些路径可以提供延迟、丢包和抖动的最坏情况界限,以此提供确定的延迟。AITrans2的比赛,将确定性时延从传输层的角度考虑,通过对发送数据包进行优先级划分,然后通过发送顺序选择和拥塞控制算法,实现传播时延的可控。

6. 低时延网络

网络的时延成为影响集群计算性能的首要指标,深度学习、分布式计算、分布式存储、计算存储分离等技术对数据中心网络低时延特性提出迫切需求。低时延网络主要从降低处理时延、优化数据流入手(数据的分发次序,路由调度,拥塞控制,缓存机制,终端的播放机制)。目前,远程直接数据存取(Remote Direct Memory Access,RDMA)、基于优先级的流量控制(Priority-based Flow Control,PFC)、显式拥塞通知(Explicit Congestion Notification,ECN)等技术的融合方案是低时延网络主要的实现手段。

低时延网络解决方案
A:降低处理时延
B:优化数据流

  • 发送端发送顺序控制(高优先级的优先发送,跳帧发送)
  • 传输控制:拥塞控制,路由调度(纯网络路由调度,网络与存储计算混合调度),动态拓扑(负载均衡,降低热点)
  • 接收端延迟机制控制(高延迟的block直接丢弃,加速延迟的降低)

A. 普通的低时延技术

  • RDMA 为降低网络传输中服务器端数据处理的延迟,通过网络把数据直接传入计算机的存储区域,而不对操作系统产生影响,消除了外部存储器复制和文本交换操作,释放了内存带宽和 CPU 负载,从而降低系统的处理时延。
  • PFC 实现传统流控暂停机制的增强,允许在一条以太网链路上创建 8 个虚拟通道,并为每条虚拟通道指定优先等级,允许单独暂停和重启其中任意一条虚拟通道,同时允许其它虚拟通道的流量无中断通过。
  • ECN 是一种路由器报告和主机响应机制,该机制通过路由器监控转发队列状态,并向发送端报告拥塞状态,让发送端在路由器开始丢包前降低发送速率。

B. 特定场景下的低时延技术

对于特定的低时延场景,如数据中心网络、5G 网络和边缘计算,传统互联网的分层体系架构针对一般网络提出的低时延技术可能不再适用,需要结合场景不同特点进行时延优化

  • 相比于广域网,数据中心网络具备更高带宽和更低时延的特性,而且可以灵活部署,这些特性使数据中心网络可以完成大量数据的快速存储和处理,成为大数据和云计算重要的基础设施。在数据中心网络中实现低时延的技术,主要分为两部分:一部分是传输层优化,优化拥塞控制与流调度(路由调度)以降低传输时延;另一部分是网络层拓扑结构优化(实现负载均衡),从而设计合理的网络拓扑结构来降低数据中心网络的时延。RDMA、PFC、ECN 等技术主要应用于优化拥塞控制与流调度方面。除了传输协议外,合理的网络拓扑架构和路由方案同样有助于通过消除热点、实现负载均衡的方式降低数据中心网络的时延。为了实现对热点流量的动态适配,以 C-through、Helio 和 XFabric 为代表的光电交换混合架构提出引入光路交换(OCS, optical circuit switching)以实现可变拓扑,采用 OCS 交换机和无线设备作为可变拓扑结构的组成部分,同时通过高效的拓扑自适应算法提升性能效果。

  • 华为通过识别大小流动态调整ECN 门限动态负载均衡等方式实现低时延网路配置;

  • 百度提出 ECN 和 PFC 组合配置,针对 PFC 固有的缺陷问题,通过优先触发 ECN 报文,减少网络中 PFC的数量,在 PFC 生效前完成流量的降速,实现低时延优化;

  • 阿里巴巴在其数据中部署超大规模的 RDMA 高速网络,为人工智能、科学计算等高性能计算、存储业务提供支撑。


如有任何问题,欢迎流言。

你可能感兴趣的:(Paper,Analysis)