阿里巴巴基于DPU的下一代云网关的故事

以下内容来自阿里在2023 OCP Global Summit Sonic Workshop的分享。

本文首发:DC盐究员

阿里巴巴基于DPU的下一代云网关的故事_第1张图片

阿里的云网关主要有两类部署场景:一是中心云,二是边缘云。两类场景下云网关的硬件是相同的。此处仅以边缘云场景为例来说明如何构建下一代云网关。

在边缘云中,网关有两个功能,一是连接服务器的ToR Switch功能,二是网关功能(提供VTEP和NAT/LB功能)

阿里巴巴基于DPU的下一代云网关的故事_第2张图片

当前一代网关面临的挑战

阿里巴巴基于DPU的下一代云网关的故事_第3张图片

 云网关主要的性能目标

阿里巴巴基于DPU的下一代云网关的故事_第4张图片

阿里的两代云网关:第一代是P4交换芯片+x86 CPU,叫做Server Switch;第二代是交换芯片+x86 CPU+DPU,叫做Smart-Switch。DPU来自Pensando(去年被AMD收购, Pensando创始人为从Cisco离职的4位大佬级人物:Mario Mazzola、Prem Jain、Luca Cafiero和Soni Jiandani,简称M.P.L.S)

在第二代网关中,由DPU实现有状态的业务,同时可提供较高的性能。

阿里巴巴基于DPU的下一代云网关的故事_第5张图片

Smart-Switch的硬件方案

阿里巴巴基于DPU的下一代云网关的故事_第6张图片

Smart-Switch的软件架构:交换机上运行SONiC,DPU上也运行SONiC。

阿里巴巴基于DPU的下一代云网关的故事_第7张图片

DASH是SONiC下的一个项目组,主要目标是让SONiC能支持有状态的业务功能。

阿里巴巴基于DPU的下一代云网关的故事_第8张图片

举例:NAT业务的DASH开发流

阿里巴巴基于DPU的下一代云网关的故事_第9张图片

举例:NAT业务出方向的处理流程

阿里巴巴基于DPU的下一代云网关的故事_第10张图片

AMD DPU上的ASIC, 支持P4编程

阿里巴巴基于DPU的下一代云网关的故事_第11张图片

第二代网关和第一代相比,TCO降低了50%,同时对有状态的业务处理性能增加了4倍。

阿里巴巴基于DPU的下一代云网关的故事_第12张图片

你可能感兴趣的:(阿里巴巴基于DPU的下一代云网关的故事)