关键字: [Amazon Web Services re:Invent 2023, Amazon EC2, Compute Innovation, Machine Learning Models, Generative Ai Models, Amazon Web Services Graviton Processors, Nvidia Gpu Instances]
本文字数: 1900, 阅读完需: 10 分钟
如视频不能正常播放,请前往bilibili观看本视频。>> 适用于任何应用和任何地点的计算创新_哔哩哔哩_bilibili
亚马逊云科技提供最全面的功能,并在基础架构和服务中不断创新,因此可在云端、本地和边缘构建、运行和扩展应用程序。请加入 Amazon EC2 网络和计算服务副总裁 David Brown 的行列,了解引发实例、容器和无服务器技术等创新的时刻,以及当今正在发生的持续创新。了解自云计算诞生以来,客户至尚理念是如何催生出改变计算格局的激进新理念的。
以下是小编为您整理的本次演讲的精华,共1600字,阅读时间大约是8分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。
在2023年re:Invent上的计算创新演讲中,亚马逊弹性计算云(EC2)副总裁David Brown以其热情洋溢的欢迎词开始了演讲。他回顾了自2007年EC2初创以来所取得的显著进展。当时,他是14人小团队的成员,团队位于南非的开普敦。他们正在构建一些全新的东西——通过互联网提供按需计算的容量。David Brown承认,他们当时并不知道EC2将变得多么具有革命性和影响力。
转向计算创新的主题,David Brown强调,演讲中涵盖的所有进步都是建立在早期奠基者的基础上。为了说明这一点,他回顾了计算机历史上的一些最具决定性意义的创新。第一个是1947年贝尔实验室发明的晶体管。这个微小的组件以前所未有的方式处理位流。更早的时候,即1815年,阿达·洛夫莱斯撰写了被认为是为了机器处理而设计的第一个算法。她设想计算机不仅用于算术,还可以用于产生艺术、音乐等。David Brown评论说,如今,200多年后,阿达的愿景正通过能够生成图像、音乐和诗歌的大型语言模型成为现实。这种令人惊叹的生成性人工智能的能力要归功于像阿达·洛夫莱斯这样的先驱者,他们在很久以前就梦想用机器增强人类的创造力。
回到EC2的起源,David Brown解释了亚马逊云科技在早期所面临的挑战。当EC2在2006年推出时,甚至在互联网上一站式租用虚拟计算容量的概念都是革命性的。起初,亚马逊云科技在解释他们正在建造什么方面遇到了困难。然而,很快出现了两个主要障碍。第一个是在一个共享的多租户环境中为客户工作负载提供安全和隔离的能力。第二个是为防止EC2获得动力后客户期望的性能水平下降。
在当时,虚拟化技术的局限性难以应对大规模挑战。因此,自约2008年起,亚马逊云科技开始重新设计基本虚拟化软件——虚拟化管理程序。当时,虚拟化管理程序主要运行在服务器的主中央处理器上。然而,亚马逊发现,仅仅为了支持虚拟化管理程序和服务,就需要消耗大约25%的资源,这同时也限制了网络、计算和存储性能的提升。
为了解决这些问题,亚马逊云科技启动了一个长期项目,将所有的虚拟化功能转移到专用的硬件上。这个努力的成果就是Nitro系统,这个项目在经过大约4年的开发后,于2012年首次推出。Nitro引入了专门处理网络、存储、安全和管理操作的硬件卡,从而使服务器的主要CPU和内存可以完全为客户所用。
在接下来的几代产品中,亚马逊云科技不断升级Nitro的功能。如今,经过10年和5次迭代,Nitro系统已经推动了众多EC2的创新。例如,Nitro使得网络带宽得以大幅提高,这对于基于GPU的机器学习工作负载尤为重要。具体而言,亚马逊云科技已将某些加速计算实例的网络带宽从2012年的10Gbps提高到了2020年的400Gbps。此外,它还提高了附接EBS卷的存储性能,从2013年的最大4Gbps和1,775 IOPS提高到了现在的100Gbps和4,000 IOPS。同时,它还为基础的安全特性如Nitro Enclaves奠定了基础,用于隔离敏感数据。英国公司NCC集团的外部审计证实了Nitro在整个EC2中实现的安全状况。他们的报告称,亚马逊无法访问存储在EC2实例或EBS卷中的客户数据。这种安全级别使亚马逊云科技在众多竞争对手中脱颖而出。
除了硬件虚拟化之外,Nitro还改进了亚马逊云科技管理其庞大的EC2集群的方式。David Brown解释说,亚马逊每周都会进行数百万次的实例迁移,以优化性能和提高后台可靠性。其他重要流程,如实时内核更新,也由Nitro在不中断客户的情况下完成。
David Brown随后关注亚马逊云科技在定制硅研发方面的工作。据他介绍,亚马逊云科技的首次尝试使用ARM处理器实际上是针对他们设计的用于安全卡的Nitro芯片。这一举措旨在推动生态系统,因为亚马逊云科技在数据中心的ARM承诺正在发挥作用。2018年,亚马逊云科技推出了第一代Graviton处理器,专为云计算工作负载而设计。每一代产品都在提高性能的同时降低成本。最新的Graviton 3相比前一代产品性能提升了25%。David Brown表示,亚马逊云科技的前100名客户中有50多家现在利用Graviton实现了最高40%更好的价格性能。
一个典型的例子是SAP,他们最近将旗舰SAP HANA数据库迁移到了Graviton上。在这个过程中,他们的计算性能提高了30%,内存带宽增加了50%。采用Graviton还使得SAP的碳足迹减少了估计的45%,这是因为能源效率得到了提高。
除了定制硅片外,亚马逊云科技还与AMD、英特尔和英伟达等行业领导者紧密合作,将他们的最新技术集成到EC2中。例如,亚马逊云科技与英特尔合作优化他们的新Sapphire Rapids数据中心CPU,使其专门针对云环境。因此,使用Sapphire Rapids的亚马逊云科技的第7代EC2实例比其他提供商提供的同类实例性能高出15%。
David Brown随后让位给亚马逊云科技的无服务器计算副总裁Holly Mesrobian。Holly继续了之前关于建立在前人基础上的主题。他特别提到了格蕾丝·霍普珀对第一个编译器的开创性贡献。她的创新为编程语言奠定了基础,并通过像编译器这样的工具将复杂性抽象出来。 Holly解释了亚马逊云科技通过投资无服务器和容器等技术简化管理的动力。2014年推出的Lambda开创了无服务器计算模式。Firecracker虚拟化技术使Lambda函数能在毫秒内启动,同时保持安全和隔离。亚马逊云科技一直在改进Lambda的性能并降低成本,包括优化Graviton处理器的使用。目前,超过100万亚马逊云科技客户使用Amazon EventBridge每月处理超过2万亿个事件。
在许多客户选择容器编排解决方案时,他们会优先考虑Kubernetes。作为对此的回应,亚马逊云科技通过其托管的EKS服务支持Kubernetes。据Holly表示,EKS融合了亚马逊云科技在安全、性能以及与其他亚马逊云科技服务的原生集成等方面的最佳实践。EKS已经得到了广泛应用,根据CNCF 2021年的报告,亚马逊云科技承载了比任何其他供应商更多的Kubernetes工作负载。特别是在后台开发人员中,有64%的人依赖于Kubernetes。
近期,亚马逊云科技推出了Karpenter,这是一个开源工具,旨在优化集群自动扩展。通过分析工作负载模式,Karpenter能够有效地降低生产成本。展望未来,Holly强调了亚马逊云科技致力于简化操作并支持开发者创新的承诺。
Dave Brown回归主题,探讨了EC2如何推动了机器学习领域的创新。他强调了艾伦·图灵对现代人工智能和机器学习的奠基性贡献。布朗表示,亚马逊云科技在生产环境中运行机器学习工作负载已超过20年,从亚马逊电子商务业务的早期阶段开始。如今,超过100家企业正利用EC2基础设施构建和训练机器学习模型。
为了满足爆炸性的ML需求,亚马逊云科技与Nvidia紧密合作,将后者的最新GPU集成到EC2实例中。自2012年以来,亚马逊云科技提供的每个实例仅包含2个GPU,参数数量为6亿,且它们之间的网络带宽有限。然而,现在一些工作负载已使用每个实例超过10个GPU,参数数量高达5000亿。亚马逊云科技最近宣布的新功能包括即将推出的带有Nvidia L4、L40和H100 GPU的实例。更令人印象深刻的是,亚马逊云科技和Nvidia正在合作在EC2上构建世界上最快的AI超级计算机,预计将在2024年启动,届时它将提供超过65千万亿次的AI性能。
此外,亚马逊云科技还开发了用于训练的Trainium和用于推理的Inferential等定制ML加速器。他们最近宣布了下一代Trainium 2,它为大型语言模型提供了高达4倍的训练性能提升。据Brown介绍,亚马逊云科技Trainium和Inferential芯片在EC2上提供了最具成本效益的ML功能。
接下来,布朗邀请了Adobe首席信息官Cynthia Stoddard探讨Adobe向云端转型的过程以及他们如何借助亚马逊云科技推动创新。Stoddard讲述了Adobe从盒装软件转变为十年前基于云端订阅商业模式的过程。这一转变得益于像亚马逊云科技这样的合作伙伴的支持,从而实现了更快的创新和指数级增长。
在2016年,Adobe在亚马逊云科技上构建了他们的Sensei人工智能平台,将机器学习融入到了他们的产品线中。例如,Sensei为Photoshop中的照片修复等功能提供了支持。今年早些时候,Adobe推出了一款名为Firefly的生成性人工智能系统。据Stoddard介绍,自从几个月前推出以来,Firefly已经生成了超过40亿张图像。她强调,Adobe与亚马逊云科技的快速创新速度使他们能够在创作者中使用新兴技术(如生成性人工智能)方面保持领先地位。
回到会场后,戴夫·布朗宣布了两个新的EC2功能,旨在优化对用于机器学习工作负载的GPU的访问。其中,Amazon EC2容量块允许客户提前预留ML容量。此外,Console to Code利用AI在EC2控制台执行操作时生成基础设施即代码。
最后,布朗分享了一个最后的公告——通过亚马逊云科技技能构建器获取一个新的计算数字徽章。他鼓励与会者通过参加认证考试并获得徽章来证明他们的计算技能。
布朗以回顾那些像Ada Lovelace一样的先驱为例,她预见了今天可能实现的现实,这些可能性是通过持续的创新成为现实的。同样地,亚马逊云科技致力于使用云计算技术赋予各个行业的建设者(如医疗保健和农业)改变世界的力量。随着像生成性人工智能这样的功能的出现,创新的步伐并未减缓。布朗对客户将如何使用EC2提供的高度安全、可扩展和高性能的基础设施来构建下一个应用感到兴奋。
下面是一些演讲现场的精彩瞬间:
领导者热情洋溢地欢迎2023年re:Invent的与会者,并承诺分享亚马逊云科技的最新计算创新。
苹果M1和M2 Mac mini实例已在亚马逊云科技上推出,为客户提供高达4倍的构建性能提升,这些客户包括Pinterest、Goldman Sachs和Riot Games等。
借助亚马逊EventBridge,开发者可以快速构建可扩展的事件驱动应用程序,无需编写代码即可连接服务和流式传输数据。
EventBridge和EKS使得客户能够更快、更安全地构建事件驱动的容器化应用程序,同时实现更深入的亚马逊云科技集成。
Karpenter捐赠给CNCF的自动扩展CIG项目宣布了一个重要的里程碑,这将推动社区的创新。
通过雷达图可视化CPU芯片设计特性和工作负载敏感性,将处理器分为前端和后端以了解哪一部分对性能影响更大。
演讲着重强调了亚马逊云科技在计算创新领域的长期历史和其在帮助客户打造创新型应用方面的作用。演讲回顾了亚马逊云科技自2006年首个EC2实例以来在关键领域的发展历程,包括最新的人工智能芯片。
设计专用硬件如Nitro芯片和Graviton处理器的核心主题是为了提高性能、降低成本并增强安全性。例如,最新的Graviton 4处理器相较于前代产品性能提高了50%。此外,演讲还涉及到了与英特尔、AMD和NVIDIA等公司的战略合作关系,共同为客户提供针对亚马逊云科技基础设施的创新产品。
演讲中花费了大量时间来探讨机器学习以及如何利用专用实例Trainium来降低大型人工智能模型的成本。演讲的最后强调了亚马逊云科技致力于为全球开发者提供最先进且易于使用的云基础设施,帮助他们将创意变为现实。
Compute innovation for any application, anywhere-CSDN博客
2023亚马逊云科技re:Invent全球大会 - 官方网站
点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!
点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!
【免费】亚马逊云科技“100 余种核心云服务产品免费试用”
【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”
亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。