亚马逊云科技re:Invent 2022 Peter DeSantis主题演讲首发

亚马逊云科技re:Invent 2022 Peter DeSantis主题演讲首发_第1张图片北京时间11月29日上午11:30,伴随着亚马逊云科技高级副总裁Peter DeSantis的精彩演讲,万众瞩目的“全球云计算风向标大会”2022亚马逊云科技re:lnvent全球大会正式拉开帷幕。
不负万千期待,Peter DeSantis带着一系列充满惊喜的创新产品登场,其中包含Nitro v5系统、Graviton3E芯片以及高性能计算实例HPC7g、C7gn、网络优化机器学习实例Trn1n。除此之外,在演讲中Peter也发布了包含计算、网络、算法及Serverless等最新功能特性。
性能优先,兼顾成本与安全
亚马逊云科技开启云服务的新可能
在2022亚马逊云科技re:lnvent全球大会开场时,Peter DeSantis首先提到了云计算的基础理念,即:弹性、安全、性能、成本、可用性及可持续性,这也是亚马逊云科技在云计算领域的建设理念。Peter从其中最重要的“性能”谈起,讲述亚马逊云科技是如何在不断强化云服务性能的基础上,来兼顾其他因素的。

 

一直以来,当用户期望在云计算服务中获得更高的性能表现时,可能会需要牺牲一些成本或安全。Peter DeSantis认为:“以往情况下,如果客户不愿在安全性和成本等问题上做出让步,就很难实现性能。”
亚马逊云科技从不在这三方面进行妥协。在这个选择悖论中,亚马逊云科技给出了自己的答案:通过自身技术的不断演进和创新,让云计算可以兼顾高性能、高安全性和低成本。
 
计算实例创新:多系列性能高幅提升
硬件创新
Peter DeSantis回顾了Nitro的起源和发展的历程:从2017年起,为了让用户的应用能够获得更佳的性能表现,亚马逊云科技自研了Nitro系统,将计算、存储、网络等传统负载Offload到专属硬件层面,大幅提升虚拟化及客户实例的性能。
Nitro系统全面提升EC2实例的安全表现,并能更好地提升计算、存储和网络的性能。Nitro系统还支持裸金属EC2实例,能够让所有的服务器资源都充分调用到客户的负载上去。
Nitro已经更新了4个版本,支持的实例从C4发展到C6gn。亚马逊云科技一直通过系统和芯片的创新,来提升计算的性能。
Nitro v5:大会重磅发布Nitro v5!基于ARM架构的Nitro芯片中的晶体管数量比前一代增加了一倍,提供了更多的计算性能,同时带来50%的DRAM内容性能提升,2倍的PCle带宽提升。相比于前一代产品,Nitro将显著改善延迟30%,同时每瓦性能提高40%,PPS提高60%。
Graviton3E芯片:新版本的基于Arm的定制Graviton3E系列芯片,专为支持高性能计算工作负载而设计。新的Graviton3E芯片,相比现有Graviton系列,有着更高的性能提升,对依赖矢量指令的工作负载的性能提高35%。
实例创新
高性能计算实例 HPC7g 和 C7gn
适配更多高性能计算场景需求
基于Graviton3E芯片,亚马逊云科技推出了面向高性能计算的HPC7g,适用于天气预报、生命科学、工程计算等高性能计算场景。这种新的实例类型有多种大小,最多具有64个vCPU和128GiB内存,这些实例将在2023年初正式投入商用。
为了适配更多网络密集型工作负载需求,亚马逊云科技还推出了新的Graviton 3E实例类型C7gn。相比于C7g实例,C7gn实例为要求更为严苛的网络密集型工作负载而设计:包含网络虚拟设备(防火墙、虚拟路由器、负载均衡器等)、数据分析和紧密耦合的集群计算作业场景。C7gn由Amazon Graviton3E处理器提供支持,将支持高达200Gbps的网络带宽,并提高50%的数据包处理性能。
优化网络性能的 Trn1n 实例
应对超大规模分布式模型训练场景
在AI大模型训练中,从传统的几千参数的Backprop,到百万级的Bert,十亿级的GPT-3、PAML,甚至超大规模的Switch-C,都在对计算芯片提出新的需求,同时在数据网络层面,计算芯片也正面临着新的挑战。
面向下一代计算、内存加速、并行训练及低网络延迟的AI训练需求,亚马逊云科技推出了Trn1n实例,针对Trn1实例进行了网络优化,增加了1600Gbps EFA网络功能,使之能够更快地面对超大规模分布式模型训练场景。

你可能感兴趣的:(经验分享)