关键字: [亚马逊云科技 re:Invent 2022 , 'Amazon EC2', 'Instances', 'Graviton', 'Cost Optimization', 'Machine Learning']
本文字数: 3000, 阅读完需: 15 分钟
布朗,亚马逊EC2的副总裁,在2022年Amazon Web Services re:Invent大会上发表了题为《助力云端的任何应用实现计算创新》的演讲。在这次演讲中,布朗详细介绍了亚马逊EC2如何帮助客户在云端可靠地运行各种工作负载。他解释称,EC2致力于在降低成本的同时持续提升性能。
布朗概述了EC2的世界一流规模和性能,包括用于提高安全性和效率的Nitro技术。他还讨论了EC2所支持的多样化工作负载,如人工智能、机器学习、高性能计算和苹果硅。他宣布了新的EC2实例,如Graviton3和针对EDA工作负载的R7iz。
演讲强调了成本优化的最佳实践,如储蓄计划(Savings Plans)和EC2舰队(Fleet)。布朗还讨论了通过亚马逊云科技本地区域和Outposts将计算带入客户身边的方案。他的演讲中还提到了纳斯达克,该公司正在将其期权市场迁移到Amazon Outposts。布朗强调,EC2专注于性价比并在云端支持任何应用。
以下是小编为您整理的本次演讲的精华,共2000字,阅读时间大约是10分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。
2022年Amazon Web Services re:Invent大会充满了激情,亚马逊EC2部门的副总裁戴夫·布朗(Dave Brown)走上舞台,开始了计算领导力的演讲。他热情地欢迎了观众,表达了对于回到re:Invent大会以及过去几天有机会与客户见面的兴奋之情。戴夫在EC2团队工作了15多年,从南非的开普敦开始,当时团队只有14个人。回顾那些早期日子时,他开玩笑说,他们当时根本不知道他们在用EC2构建什么。从那之后,这是一个令人难以置信的旅程。
为了展示EC2取得的成就,戴夫回忆了2008年11月的一个里程碑时刻,那时他们启动了第一个百万实例。相比之下,如今客户每天启动的EC2实例超过1亿个,这是一个惊人的增长速度。更令人印象深刻的是,迄今为止,EC2上已经启动了总计300亿个实例。虽然2006年EC2背后的雄心壮志和愿景是大胆的,但保持创新的动力今天仍然同样强烈。
戴夫解释说,多年来,EC2持续创新的两个关键目标一直是:首先,为客户提供比内部部署更好的工具和服务来可靠地运行任何云工作负载。其次,在降低成本的同时持续改善性能。他以Epic Games为例,这家公司的在线游戏《堡垒之夜》非常受欢迎。当新的《堡垒之夜》章节发布或重大游戏活动时,Epic Games需要能够支持数亿玩家同时在线,在某些情况下,基础设施的实际规模可以在一夜之间扩大。
EC2实例类型的多样性和广泛性为Epic提供了所需的能力,同时也使他们能够通过将工作负载转移到Graviton处理器来进一步优化成本。过渡到第一个主要主题,Dave讨论了EC2的世界级规模和性能。他回顾到2007年底和2008年初,当时客户开始将工作负载推向EC2,暴露了性能挑战和抖动问题,特别是在更高的百分位数上。人们越来越意识到,为了使EC2成为更广泛应用程序的可行平台,他们需要找到一种提高虚拟化性能的方法。大约在同一时间,来自亚马逊云科技的James Hamilton与Annapurna Labs的Nafa Beshara取得了联系,后者正在研究定制硅解决方案。这次在西雅图一家小餐馆的会议标志着将成为Nitro项目起点。目标是将一些CPU密集型的虚拟化功能卸载到Nitro卡上的专用硬件中。从最早的迭代开始,仅仅网络卸载,在接下来的几年里,亚马逊云科技继续扩大Nitro的功能。到2017年,第一批完全支持Nitro的实例推出。Dave强调说,直到今天,Nitro仍然是亚马逊云科技的一个关键区别点,没有其他主要的云提供商提供类似的解决方案。Nitro卡运行所有的软件,用于网络、安全、存储I/O等等。这为客户的应用程序释放了100%的CPU核心,提高了性能、安全性和成本效率。Nitro安全芯片也直接集成到亚马逊云科技设计的服务器主板之上,以实现安全的启动和其他保护措施。除此之外,亚马逊云科技还建造了自己的Nitro超控器来替换Xen,进一步优化性能。
Invent大会上,戴夫兴奋地宣布了一种新的Trn1实例,该实例可以在单个实例上提供800Gbps的带宽。他开玩笑地说,他们将需要一种网络优化版本才能充分利用这一容量,幸运的是,彼得·德桑蒂斯昨晚刚好宣布了这一便利——将于2023年初推出的Trn1 Ultra实例将具有令人惊叹的1.6Tbps带宽。
戴夫还高兴地透露了新的第六代EC2实例,今天就可以使用,带有高达200Gbps的带宽,使用了最新的英特尔Ice Lake处理器。这些新实例可以充分饱和到Amazon S3的200Gbps连接,提供了迄今为止最快的从S3下载的EC2速度。此外,由于每秒钟处理包的数量提高了两倍,网络设备和分析工作负载将取得显著收益。EBS volumes也正在从这些更快的实例中受益。
这些Nitro卡现已提供80Gbps的带宽和350,000 IOPS,可释放完整的200Gbps网络容量。在存储方面,戴夫(Dave)展示了一款Nitro的最新产品——Nitro SSD本地实例存储。多年来,亚马逊云科技一直在努力可靠地维护和更新商品固态硬盘,同时不影响正在运行的客户实例。通过赋予亚马逊对硬件的完全控制权,全新的Nitro SSD解决了这个问题,提高了可靠性、安全性和降低了高达60%的I/O延迟。最近宣布的一项令人兴奋的新功能是撕裂写保护,它能提供更强大的数据写入过程中的数据丢失保证。这可以在测试中提高数据库交易性能高达30%。
在安全方面,戴夫强调说,Nitro的设计从一开始就充分考虑了安全性。所有控制平面通信都经过加密和签名。Nitro安全芯片支持硬件强制的安全启动,以防止篡改。实时补丁允许亚马逊透明地更新固件和软件,而无需停机。最值得注意的是,客户实例没有远程访问——亚马逊的员工没有直接访问底层硬件的路径。
这种“无未经授权访问”的理念使得Nitro成为近年来随着亚马逊迅速扩大其保密计算能力时的一个自然选择。戴夫解释说,保密计算有两个方面:一是保护客户数据免受云服务提供商的影响,这是Nitro的方法本身就具备的功能;二是使客户能够保护自己组织内的数据免受内部威胁。
亚马逊Nitro Enclaves(2020年推出)解决了第二个挑战,允许客户为敏感的工作环境创建隔离的计算环境。
在处理工作负载方面,Amazon Web Services EC2实例表现出色。作为亚马逊云科技证书管理器专用CA服务的组成部分,它可以安全地生成和存储私钥。Dave强调,新的安全隔离功能,如EDP和本周宣布的Kubernetes集成,将进一步扩大其应用场景。从Nitro的功能过渡到运营卓越,Dave将注意力转向了亚马逊云科技在后台所做的大量工作,以实现最大化的实例可用性和可靠性。他承认,虽然像可用性区域和冗余这样的概念非常重要,但这并不意味着在涉及单个实例可靠性问题时,亚马逊云科技会忽视这些问题。在过去两年里,严格的工程驱动使得年度故障率(AFR)下降了62%。为了更详细地讨论亚马逊云科技对运营卓越的严格方法,Dave邀请了EC2的主要技术项目经理Jeremy Connolly上台。Jeremy解释说,亚马逊云科技将可用性和可靠性视为优先事项,持续关注诸如启动时间、AFR等指标,以识别改进领域。尽管行业标准将AFR视为需要更换硬件组件的频率衡量标准,但亚马逊云科技采用了更广泛的定义,包括任何可能导致客户影响或混乱的行为。这包括自发重启、内核崩溃、网络故障等问题。亚马逊云科技密切关注实例系列的AFR,每周与领导团队开会审查,并迅速解决任何倒退。通过彻底根除每个故障的根本原因,他们在两年内推动了62%的AFR下降。Jeremy还强调了亚马逊云科技在缩短启动时间方面的进步,其中Windows实例的中位数启动时间下降了65%,Linux下降了29%。
在基于Nitro的实例方面,亚马逊云科技现在每周实时迁移超过100万个客户实例,以实现透明的维护,进一步减少中断。他最后强调,亚马逊云科技将继续不懈努力,超越客户对实例可靠性的期望。
回到舞台,Dave开始讨论EC2丰富的实例类型如何支持各种不同类型的客户工作负载。虽然600多种实例类型可能令人眼花缭乱,但它们针对计算、内存、存储等因素的不同需求提供了几种不同的使用模式。这使得客户能够快速缩小选项范围,找到最适合他们特定需求的选项。
Dave总结了EC2队伍中可用的四种处理器选项:英特尔、AMD、基于ARM的Amazon Web Services Graviton和苹果硅。亚马逊云科技与技术合作伙伴密切合作,优化他们的处理器以适应云工作负载,并为客户提供卓越的性能、价值和选择。
他强调了新实例系列的新增功能,并宣布用于EDA工作的Amazon EC2 R7iz实例现已进入预览阶段。它配备了3.9GHz的英特尔Sapphire Rapids处理器,相较于上一代EC2实例,其计算能力提高了15%。早期的测试显示,对于数据库、视频处理和负载均衡等应用,性能提高了40%,使其成为受益于高每核时钟速度的许可敏感应用的绝佳选择。
在HPC领域,Dave回顾了亚马逊云科技过去几年成为领先的云计算平台的高性能计算历程。起初人们持怀疑态度,但现在HPC社区认识到亚马逊云科技的技术能力和成本竞争力。宣布的新HPC实例类型旨在满足计算密集型和工作负载的数据密集型需求。对于计算需求,新的C6gn实例采用了AMD Rome处理器,具有更高的性能和更低的功耗。而对于数据需求,新的D2xn实例采用了通用型SSD,提供了更高的I/O性能。
AMD-powered C6a提供了巨大的价值。在数据方面,新的基于英特尔的I6id提供了高内存、本地NVMe存储和200Gbps的EFA网络。一款基于Graviton3的新实例G7g也为HPC提供了卓越的价格性能,通过增强的向量处理能力。接下来是机器学习,戴夫强调了亚马逊对降低训练ML模型成本的高度关注。像EC2实例这样新的功能,由Amazon Trainium和Inferentia芯片驱动,比基于GPU的训练和推断节省了大量的成本。Trainium对于许多热门模型的成本比GPU低50%。本周刚刚宣布的Inferentia2为推断工作负载提供了45%更好的价格性能。
在讨论工作负载时,戴夫强调了新的M1 EC2实例如何帮助苹果开发者在亚马逊云科技上为iPhone、iPad等构建和测试应用。按需访问和卓越的价格性能使得开发周期更快、更高效。
戴夫在总结部分强调,亚马逊如何将节俭和成本优化融入其所有的产品和服务中,从产品设计开发的早期阶段开始。他概述了一些工具和最佳实践,亚马逊为客户提供了这些工具和最佳实践,以便在EC2上减少浪费并高效运行,包括:
- 在多个实例系列(如Graviton、AMD等)之间分散投资
- 利用储蓄计划和现货实例等购买选项
- 通过自动扩展调整容量大小
- 让计算优化器分析工作负载并提供优化建议
戴夫指出,尽管云采用的初期有很多低垂的果实可以节省成本,但在亚马逊这样的规模上,保持一种专注于效率的文化对于随着时间的推移推动成本更低至关重要。
Dave讨论了亚马逊云科技如何致力于根据客户的需求在任何地方运行计算资源,无论是亚马逊云科技区域、本地区域还是通过Outposts实现内部部署。如今,亚马逊云科技的基础设施已遍布全球30个区域,还有5个正在建设中,并在主要城市地区设立了超过50个本地区域,以减少延迟。
一个使用Amazon Outposts满足超低延迟需求的客户是纳斯达克公司,他们与Dave一起上台讨论了将交易所工作负载迁移到亚马逊云科技的历程。纳斯达克公司的云计算战略和企业架构高级副总裁Nicolai LaBella解释了过去几年里,他们是如何与亚马逊云科技紧密合作,验证Outposts是否能满足匹配交易订单的极端性能需求。
2021年,纳斯达克宣布计划将其期权市场(MRX)迁移到Outposts,这一计划目前正在进行并取得良好进展。Nicolai报告称,早期结果非常令人鼓舞,相较于他们的传统环境,订单延迟减少了大约10%。纳斯达克的额外市场计划在2023年进行转换。Dave和Nicolai都强调,这一初步成功仅仅是一个开始,他们将携手合作,使纳斯达克在全球范围内的亚马逊云科技足迹得以实现。
在Dave结束会议时,他回顾了一个梦想成为火箭的小男孩的故事。自从EC2诞生以来已经过去了很长时间,但亚马逊云科技对创新的热爱和对客户的交付承诺从未如此强烈。未来仍然充满无限可能,而他们才刚刚开始。未来的前景非常光明。
下面是一些演讲现场的精彩瞬间:
亚马逊EC2副总裁被邀请上台发表演讲。
亚马逊云科技的领导详细介绍了Nitro系统如何利用专用硬件实现功能卸载,从而提高性能和安全性,使客户从他们的实例中获得更大的价值。
交易台采用了Amazon Web Services Nitro Enclaves技术来安全地处理敏感的顾客数据,从而改进了其广告平台中的隐私保护。
在第三方基准测试中,如启动数千个实例,亚马逊云科技一直优于竞争对手,展示了其强大的计算创新能力。
亚马逊EC2控制层面的优化使得启动速度提升了44%,而Windows系统的启动速度则提高了65%。
通过深入了解问题根源、与制造商紧密合作以及实时迁移实例以减少维护期间的客户停机时间,亚马逊云科技在过去两年里实现了62%的年度化故障率改善。
领导强调,尽管取得了显著的成就,团队不能因此而自满,而应继续追求卓越。
亚马逊云科技在计算创新方面取得了巨大进步,使客户能够在云端运行几乎任何应用程序。亚马逊EC2副总裁戴夫·布朗回顾了他从16年前的EC2初创时期到现在每天启动超过1亿个实例的历程。关键关注点一直是通过定制硬件(如用于卸载I/O、安全和网络的Nitro卡)来提高性能并降低成本。这使EC2实例能够比竞争对手提供更高的性能、更低的延迟和更好的安全性。
亚马逊云科技提供了各种类型的实例和处理器,包括英特尔、AMD、Graviton和现在的苹果硅,以支持各种工作负载。Graviton 3相比x86提供了显著的价格性能提升。还宣布了针对电子设计自动化、机器学习训练和推理以及高性能计算的新专用构建实例。合作伙伴如纳斯达克展示了在低延迟下成功运行任务关键工作负载的Outposts。
布朗强调,尽管取得了巨大的进步,但EC2团队仍然专注于不断创新,以帮助客户轻松地在云端以成本效益的方式运行任何应用程序。这段旅程仍在继续。
原文链接 : https://blog.csdn.net/litaibai2023/article/details/134448430
中国区域业务(需企业营业执照认证),请注册“中国区账户”。
海外区域业务或个人使用,请注册“海外区账户”。
如需了解账号注册的详细流程,请参照:
亚马逊云科技中国区账号注册流程 (Amazon Web Services 中国区账号注册步骤操作说明)
亚马逊云科技是谁?
亚马逊云科技是云计算的开创者和引领者,提供超过 200 大类云服务,覆盖计算、存储、网络、安全、数据库、数据分析、人工智能、机器学习、物联网、混合云等,直至前沿的量子计算和卫星数据服务。
服务覆盖 245 个国家和地区,赋能数百万各行各业的客户。
连续 11 年位列“ Gartner 云基础设施和平台服务魔力象限的领导者”。
2022亚马逊云科技 re:Invent 全球大会
精彩Keynote主题演讲
↓↓↓点击下方链接即刻观看↓↓↓
re:Invent 2022| 亚马逊云科技CEO Adam主题演讲完整版_哔哩哔哩_bilibili
re:Invent 2022| 亚马逊云科技高级副总裁Peter DeSantis主题演讲完整版_哔哩哔哩_bilibili