从数据处理到万物智联,从智能驾驶到航空航天,算力为各行各业的发展注入了新动能。与此同时,伴随企业数字化转型加快,产生大量数据,人们对算力提出了新的诉求:
当下,互联网的媒介形式越发丰富、生产的数据量愈发膨胀,其底层所需要的算力规模持续增长,这远远超过摩尔定律的极限,传统IT体系无法满足爆棚的算力需求。在硬件成本上,每升级新一代CPU,硬件芯片、服务器、数据中心的成本也随之上涨。在性能上,大数据计算、AI推理、视频、压缩等算力密集型业务对性能的要求较大。
云服务器作为云计算基础服务向新一代算力服务演进,为上层应用提供澎湃算力。可能大家下意识以为,云服务器作为云计算非常基础和核心的存在,似乎是每家云厂商的“出厂标配”,当下还有哪些出圈可能?
3月24日,阿里云第八代企业级弹性计算实例规格族ECS g8i开启正式上线。性能着实让人惊艳:
基于最新的“飞天+CIPU”技术架构,第八代ECS搭载最新第四代英特尔至强可扩展处理器(代号 Sapphire Rapids,SPR),全核睿频p0n达到3.2GHz,性能相比上一代实例最大提升 60% 以上。
g8i标配阿里云自研eRDMA大规模加速能力;全面搭载NVMe,支持共享盘;同时支持可信计算与加密计算等特性。由此可见,第八代ECS在计算、网络、存储、安全等全面均有炸裂的表现。
第八代ECS,性能一路“狂飙”
今年1月,英特尔才正式推出第四代英特尔至强可扩展处理器,与前一代相比,在人工智能、网络/5G、存储、科学计算、数据分析、安全等领域,第四代英特尔至强可扩展处理器目标工作负载的平均每瓦性能提升2.9倍。
阿里云快人一步,仅仅隔了两个月就正式上线了搭载第四代英特尔至强可扩展处理器第八代ECS实例。阿里云高级产品专家姬少晨表示,早在英特尔芯片设计阶段,双方已开展深度合作。
“通过阿里云与合作伙伴紧密合作,第八代ECS在企业应用、大数据、人工智能等场景释放算力红利,提升用户体验。”阿里云弹性计算产品总监王志坤说。
除了在技术上和英特尔强强联手外,g8i通过阿里云自研的云数据中心专用处理器CIPU,对计算、存储、网络资源进行快速云化并进行硬件加速。
第八代ECS将阿里云之前多年来技术积累融会贯通,有效释放自研技术架构的能力,并结合合作伙伴算力芯片的升级,第八代ECS从芯片到架构到虚拟化,再到上层的OS、软件、工具、插件等均有技术创新,实现性能再突破。
正如阿里云弹性计算产品线负责人张献涛所说,在阿里云CIPU+飞天的技术架构与第四代英特尔® 至强®可扩展处理器的强强联合下,阿里云第八代企业级实例g8i规格族性能提升了60%,并实现了机密虚拟机TDX在云上的首次实践,相信在双方的持续紧密合作之下,将会给更多各行业的客户带来更具性价比的技术红利。
探索技术演进,如何解锁极致性能
看到这,可能您会问,性能提升是每一代ECS的“必备”,第八代ECS性能大幅度提升到底是用了啥“大招”?在回答这个问题前,我们先简要回顾阿里云虚拟化技术体系演进历史:
虚拟化自云计算诞生以来,就是云的基础技术之一。然而虚拟化不是为云设计,其带来的虚拟化性能损耗,是当时行业内“房间里的大象”,却无法彻底解决掉。
直至2016年,阿里云启动“神龙X-Dragon架构”新一代IaaS计算平台项目,采用了软硬件协同设计理念,从云计算IaaS领域重新去审视芯片、硬件和软件的定义与协同创新。
2017年10月,阿里云发布基于神龙架构的弹性裸金属服务器,将虚拟化损耗降为零,解决服务器长久以来的虚拟化性能损耗的问题。这也标志着神龙架构的诞生。
如今,神龙架构已经升级为CIPU,基础性能全面提升,搭载eRDMA网络架构,是业界首个大规模弹性RDMA加速能力。
相比于传统RDMA,eRDMA具有高性能,更具普惠、弹性,有效降低用户的使用门槛。而本次第八代ECS实例标配阿里云自研eRDMA大规模加速能力,标志eRDMA能力的全面商业化。
王志坤表示,芯片厂商对虚拟化的硬件加速能力其功不可没,使得虚拟化的性能开销降低。但从云上来看,用户使用ECS不完全等同于只使用虚拟化。过去虚拟化代表是单机CPU的虚拟化能力,在IO、网络等方面较单薄。通过阿里云多年对用户需求的理解,对云技术演进的实践,结合软硬件协同理念,在计算、存储、网络领域做了大量的创新设计,从而提升ECS的整体性能。
进阶挑战:eRDMA加速
王志坤解释,以前,企业在云上大多数使用的是软件定义的VPC网络,使用TCP/IP协议。VPC网络的优势在于有高兼容性、弹性灵活。然而,随着互联网数据量指数级膨胀,数据中心分布式计算的规模越来越大,而大规模集群间大量数据传输的开销也越来越大,给CPU带来的负载也随之加重,对网络延时与带宽提出了更高要求。这也是云厂商需要重点发力的方向。
那么在阿里云IaaS层,用户如何具备软件定义网络的灵活性,又获得大带宽、低延时的网络能力?
这便要提到阿里云CIPU所独有的eRDMA大规模加速能力,相较于传统TCP网络,eRDMA具有更高性能,网络延时低至8微秒。
RDMA协议栈在高性能领域里较好,它将CPU很多工作释放出来,使得CPU更加专注于业务处理,但RDMA具备较高的使用门槛,这是为什么RDMA网络主要应用在高性能计算领域。
阿里云通过自研的eRDMA的软硬件技术和协议栈,提供了TCP到eRDMA协议一键转换的用户态接口协议和内核态接口协议,让用户非常便捷地在互联网架构中使用起来。目标不仅仅是提供高性能的基础设施,并且要降低它的使用门槛,简化接口协议,最大化兼容客户已有软件,极大降低改造成本。
基于CIPU,eRDMA与云上VPC共享同一张网络,用户可以随开随用具有eRDMA能力的实例;Redis、Spark、AI、HPC等应用可通过阿里云提供的接口,即可一键适配,最大程度降低企业的使用难度。在Spark大数据场景,eRDMA能够提升10%的计算性能;在Redis KV数据库场景,eRDMA提升混合读写的100%的吞吐量。
从技术上,2021年已经自研出eRDMA,为何等到这次第八代ECS的发布才说“标志eRDMA能力的全面商业化”?
王志坤表示,在这两年时间里,阿里云在内部业务做了eRDMA大量试点,并花费很多工作帮助来打通“最后一公里”,帮助建设eRDMA生态和完善应用适配,从而更有信心让外部用户受益。
传统 RDMA 要有专用硬件设备来单独组网,不仅规模受控,而且弹性能力相对云上较差。阿里内部的云数据库有RDMA的降本诉求,于是率先试用 eRDMA,经真实业务的验证,相对不开启eRDMA,Redis单流混合读写的性能至少提升一倍,极大地提升产品的竞争力。
另外,在某大型企业的语音训练场景,由于分布在不同的地域和终端,传统 RDMA组网很难在多地域同时组建起专用网。在语音训练场景里,eRDMA帮助该企业提升整体性价比,比传统TCP、VPC技术提升了将近30%。
场景化加速器,带来高性价比
除了自研eRDMA能力,阿里云积极携手合作伙伴英特尔来打磨和丰富产品能力。第八代ECS搭乘第四代英特尔®至强®可扩展处理器,单核通用算力提升的基础上,提供多种硬件原生加速能力,其中AI领域,深度学习训练场景性能提升2倍以上,推理性能提升4倍,加解密、压缩/解压缩等场景下性能提升4倍以上,在统一技术架构下获得更好的场景化性能扩展性,为用户提供超高的性价比。
姬少晨介绍道,以内置加速器高级矩阵拓展AMX为例,可以大幅提升深度学习、训练、推理的性能。AMX集成调优功能,支持中小型深度学习训练模型,能进一步提升CPU上的深度学习与训练性能,将PyTorch实时推理和训练性能提升10 倍,将大型语言模型的处理速度提升多达 20 倍。
AMX理论上是芯片的特性,但在第八代ECS最终在云上给用户的是实例,如何将这部分的能力透传到上层的虚拟机,而不单纯是物理机上?对此,阿里云和英特尔做了很多努力,最终成功在第八代ECS融入AMX能力。例如国内某大型的社交平台,在搜推广的场景中,理论上用GPU来训练、推荐就够了,然而其推荐系统使用Wide & Deep模型权重稀疏,如果直接用GPU的话效率很差。通过第八代ECS,同时将CPU和GPU的工作放在一个实例里跑,大幅提升效率。
其次,数据保护与压缩加速技术QAT可通过卸载加密、解密和压缩释放处理器内核,降低系统资源消耗,让系统能支持更多客户端运行。如果用户有加解密、压缩解压缩的诉求,可以单独买一个QAT加速卡放到服务器,之前有用户提出能不能在实例上给“插个卡”,但是在公有云单独“插个卡”的话,难度较大。其次是如果规模不够大的话,很难提供一致性、弹性、吞吐能力。第八代ECS将QAT能力提升到芯片里,不需要额外插卡。据姬少晨介绍,在极限情况下,压缩/解压缩的性能能提升70倍。
另外,存内分析加速器(IAA)、数据流加速器(DSA)加速器,在逻辑推理推广、大数据、数据库、等多种场景里,均能大大提升第八代ECS性能。
首发TDX机密虚拟机,普惠机密计算
除了超高性能之外,立体化、业界领先的计算安全防护体系,是g8i实例的又一特色优势。
作为亚太地区最早部署机密计算的云厂商,阿里云一直在持续推广可信与机密计算技术,以为客户的数据提供更好的保护。
ECS g8i实例全量搭载安全芯片TPM作为硬件可信根,实现服务器的可信启动,确保零篡改;虚拟化层面,支持虚拟可信能力vTPM,提供实例启动过程核心组件的校验能力;在实例可信的基础上,配合英特尔硬件TEE能力和内存加密TME (Intel® Total Memory Encryption)技术,以及阿里云自研的加密计算隔离环境enclave,ECS g8i实例进一步实现数据的可用不可见,为大型互联网、新金融、医疗保健、知识产权等业务场景提供了更高安全等级数据保护能力和云上可信运行环境。
同时,g8i实例还启动了机密虚拟机能力TDX(Intel® Trusted Domain Extension)的邀测,该技术无需用户二次开发即可将现有应用迁移至受TDX保护的实例中,实现数据的可用不可见。阿里云和Intel在TDX的架构设计、功能验证、安全分析和性能优化等方面均进行了紧密的合作,并实现了TDX技术全球范围内首发;阿里云认为,该技术将推动机密计算通用化和平民化,与可信技术一起,成为未来云上服务器的标准能力。
实现技术普惠,共享科技红利
一直以来,人们将云计算比喻为互联网时代的“水电煤”一般重要的基础设施。ECS作为云计算的算力底座,用户对ECS的稳定、安全、高性能,还有性价比的要求强烈。
围绕着用户关心的上述四大关键词,阿里云在技术上打造软硬一体的CIPU以释放技术红利,再加上规模化带来的成本效应,以及灵活付费模式,不断降低用户使用云的成本和门槛,让算力更普惠,让用户更好地聚焦核心业务创新上。
点击阅读原文,查看更多第八代ECS资讯~