大疫三年,亚马逊云科技re:Invent 2022大会回归如常,人山人海,川流不息。拉斯维加斯威尼斯人拥挤的大会通道总是摩肩接踵,水泄不通;主题演讲场场爆满;分会和论坛长蛇阵一般排队进场;中心展区350家生机勃勃的参展商折射出全球150个国家和地区10万多合作伙伴欣欣向荣的生态现状…。
在大会现场与全球5万多参会者同流合伍,查了一下Apple Watch,从入场到离开,我走了6.5万步,距离相当于1.1个全马。参会也是个体力活呀。
当然,re:Invent 2022没有让人们失望,亚马逊云科技连珠炮发布的一大批新产品,新功能,新应用、新服务和新战略,让产业眼界大开,为之振奋。
亚马逊云科技CEO Adam Selipsky主题演讲
一场大会,最牛逼的往往不是某个发布,最牛逼的是你冲锋陷阵打山头背后的逻辑与布局。今年re:Invent 2022,亚马逊云科技Nitro、Graviton等继续着传奇的硅故事。Werner提倡的异步并行松散耦合的系统,系统进化最佳方式是构建事件驱动的架构,模拟将在数字创新中发挥关键作用等等论述与实践个个掷地有声。
然而,依我看这次大会的灵魂是数据,最牛逼之一是亚马逊云原生端到端数据战略。
在本届re:Invent,亚马逊云科技翻开创新崭新一章。现任亚马逊CEO Andy Jassy 创建和领导了亚马逊云科技以云计算交付IT核心基础设施的创新,掀起并引领全球云计算大潮。
随着云计算的深入,更多数据、更多代码和更大算力的推进,亚马逊云科技成为云计算新时代全球经济领导力量。这些巨大的成功,使得亚马逊云科技圆满重塑IT,赢得基础设施即服务在全球市场的胜出。
如今,数据的持续增长、开源的进步以及硅和计算实例技术的日新月异,云计算仍然创新不断,瞬息万变。然而,云计算本身已经成为产业根深蒂固的底盘,成为运算生之俱来,理所当然的事。
为此,云计算创新正在纵深前行。如果说云计算1.0解决的是面向未来的技术架构,下一步云计算2.0将专注面向未来的业务,通过业务解决方案构建新的商业模式推动创收、客户体验以及更加丰盛的业务成果。
高瞻远瞩,亚马逊云科技CEO Adam Selipsky认为数据是释放业务价值的关键。他指出,数据正在从部门和主题转变为企业运作方式,数据已进入业务线,进入应用程序,从本质上成为公司交付给最终用户的东西,成为业务决策的中心。
Adam Selipsky 是亚马逊云科技的老枪,后转任Tableau CEO,并于2021返回亚马逊云科技从Andy Jassy手中接任CEO职位。Tableau是一个数据为导向、可视化端到端分析平台,使人们可以更轻松地探索和管理数据,更快地发现和分享改变企业和世界的洞察。
亚马逊云原生端到端数据战略
Adam Selipsky在大会主题演讲中指出,如今的客户在创建和存储来自众多来源的 PB 级甚至 EB 级数据时面临着不断增长的数据需求。在未来五年内,我们将创建自数字时代开始以来产生的数据量的两倍以上。管理数据的规模和增长对每个组织来说都是一个巨大的挑战和机遇,需要一套完整的工具来应对数据的规模和多样性。亚马逊云科技专注于构建所有这些功能。
Adam Selipsky认为,围绕数据赋能,给数据端到端的视图,更有利于客户管理数据。
据调研预测,今年全球所创建的数据量就多达97亿TB。然而,有68%的组织认为他们仍无法获取数据带来的价值。
走过15年,亚马逊云科技一直是云计算数据领域创新旗手,围绕数据的广泛创新,已向客户提供卓越的数据技术、工具和解决方案。
亚马逊云科技数据和机器学习副总裁 Swami Sivasubramanian主题演讲
在大会主题演讲中,数据和机器学习副总裁 Swami Sivasubramanian介绍了一批面临大量数据需求,并利用亚马逊云科技解决方案的客户成功案例:Expedia Group 每年处理超过 6000 亿条AI预测,70 PB 的数据由亚马逊云科技平台提供快速扩展支持。
Expedia 的首席技术官兼产品和技术总裁 Rathi Murthy Murthy 说,无论公司在哪里处理它生成的数据,数据都是“推动我们创新和取得长期成功的关键”。该公司使用包括Amazon EKS、DynamoDB 和 SageMaker 在内的工具来充分挖掘分析利用其所有数据。
此外,三星的 11 亿用户每秒发出 80,000 个请求,亚马逊云科技提供吞吐自如的平稳支持。Pinterest 在 Amazon S3 简单存储服务上存储了 1 艾字节(100 万太字节)。可靠的海量数据处理和分析,成为是几乎每个企业数字化成功转型的基石。
现在全球有超过 150 万家公司使用 AWS 来满足他们的数据需求,无论是数据库、分析还是机器学习服务。
亚马逊云科技中国国际客户及电信事业部总经理沈涛在拉斯维加斯re:Invent现场阐述公司中国愿景:“利用我们全球优势,植根本地,服务好本地客户。”
云计算已进入全面云原生时代,用数赋智是必然的趋势。市场呼唤基于云原生高度创新、向客户进一步释放云原生向业务赋智并创造业务价值的新一代数据蓝图。
不负众望,15年磨一剑。在本次大会,亚马逊云科技重磅推出亚马逊云原生数据战略。它首次向业界提出云原生数据的关键要素和基石,云原生数据战略由下述三个要点组成:
构建面向未来的数据基础,它包括支持所有类型负载;任何规模下一致性能;不重复工作和拿掉“脏活累活,从而更少时间管理和准备数据,更多时间从中获取价值;靠性和安全性不做任何妥协。
数据一体化融合,基于整个组织集成解决方案,包括管理会涉及数据的人员。
需要正确的工具和教育来帮助实现数据民主化。
Swami Sivasubramanian提出:“为了更好地利用数据来提升客户体验,推动业务创新,今天的组织需要构建合适的数据战略,以数据推动决策。”
亚马逊持续15年不断云原生数据探索,践行云原生数据战略,在本次大会诸多重要创新发布,它们涵盖面向未来的数据基石、云原生数据分析工具、智能湖仓、数智融合、开箱即用等服务。
Amazon DocumentDB Elastic Clusters,这是一个完全托管的解决方案,可以虚拟地扩展文档工作负载以及大小或规模。它可以在几分钟内弹性扩展工作负载,甚至可以自动管理底层基础设施,为开发人员节省数月的时间。
Zero-ETL未来两大重磅集成:将交易数据与分析功能结合在一起,Amazon Redshift近乎实时地分析Amazon Aurora中的数据,无需在不同服务之间提取、转换和加载(ETL)数据。在 Aurora 中真正实现了两全其美的快速、可扩展的事务,以及 Redshift 中的可扩展分析,由此组成一个天衣无缝系统。对此场下掌声雷动。
Amazon OpenSearch Serverless 帮助客户轻松运行大规模搜索和分析工作负载,而无需配置、扩展或管理底层基础设施,轻松运行大规模搜索和分析工作负载。亚马逊云科技持续一致地开拓无服务器技术去改进数据处理的模式,并降低处理和维护成本。通过这次发布,整个分析产品体系实现Serverless的支持。
Amazon SageMaker ,端到端机器学习服务,业内第一个基于云的机器学习开发平台,更新推出八项新功能。众多开发人员、数据科学家和业务分析师使用 Amazon SageMaker 提供的全托管基础设施、工具和工作流,轻松快速地构建、训练和部署机器学习模型。客户使用机器学习不断创新,他们创建的模型比以往任何时候都多,因此,他们需要高级功能来有效管理模型的开发、使用和性能。现在还支持 Geosptial ML,只需单击几下即可访问各种不同的数据。
Amazon Redshift integration for Apache,它使得在Amazon Redshift 和 Redshift Serverless 上构建和运行 Spark 应用程序变得容易,使客户能够为更广泛的 AWS 分析和机器学习集打开数据仓库(ML) 解决方案。
Amazon DataZone,全新的数据管理服务,它可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。
亚马逊云科技Clean Rooms,这是一项新的分析服务,可帮助公司跨行业轻松安全地分析和协作处理他们的组合数据集,而无需共享或透露基础数据,几分钟搞定。
Amazon Athena for Apache Spark,提供了一种更直观的方式来运行复杂的数据分析,启动时间不到一秒钟,这意味着您可以将更多时间花在洞察上,而不是等待结果。就大规模性能而言,AWS 提供了许多您的企业需要的工具来帮助提供可扩展性和处理能力。
亚马逊云科技 GlueData Quality ,无服务器、可扩展的数据集成服务,可以集成和管理来自多个来源的数据,帮助用户建立对其数据的信心,以便他们每天都能做出更明智的关键决策,将手动工作从几天减少到几小时。
Amazon Security Lake,该服务可以自动将客户在云端和本地的安全数据集中到客户在亚马逊云科技账户下专门构建的数据湖中,方便客户针对安全数据做出快速行动,可以帮助安全团队轻松地自动收集、组合和分析 PB 级的安全数据。
AWS SimSpace Weaver,新颖的托管服务,允许开发人员不必管理底层计算内存或网络基础设施,在云中大规模运行城市规模的模拟,如自然灾害以测试应急响应系统、大型体育比赛对交通流量的影响等。面对此类复杂的情况,云上模拟优势之一是能够让多个外部方实时远程查看模拟结果并与之相应交互
Amazon QuickSight Q,任何人都可以用自然语言提出问题,并通过相关的可视化效果获得准确的答案,从而帮助他们从数据中获得洞察力。Amazon QuickSight Q 中提供的新分析问题:“为什么”和“预测”。
AWS Application Composer,一种用于可视化设计和构建无服务器应用程序的新型低代码工具。该服务降低门槛,为开发人员提供可视画布和简单的拖放界面,以快速创建应用程序架构、连接资源和设计功能。亚马逊CTO Werner Vogels 在主题演讲推荐“你应该使用无服务器组件来拼接你想要的系统。”
AWS Step Functions Distributed Map服务将需要的系统组合在一起,构建业务取得成功所需的工作流。专注事件驱动的主线,帮助各种规模的企业从数据中获得更多价值。
Amazon EventBridge Pipes,提供一种无缝方式来集成受支持的 AWS 和自我管理的服务,而无需编写无差异的粘合代码。允许您简单地将 AWS 系统拼接在一起。
亚马逊CTO Werner Vogels 在主题演讲
Amazon CodeCatalyst,消除了围绕开发的许多繁重工作,拥有从创意到生产所需的所有工具,具有开箱即用的可靠性和可扩展性,快速几分钟内创建一个项目。
AWS推出新的AWS 机器学习大学教育培训计划,提供实践培训课程,帮助培养下一代员工。构建其 AI 和 ML 奖学金计划,向 2,000 名选定的学生提供 1000 万美元的奖励。
归纳起来,让数据成为跨企业并缔结企业组织的粘膜,最大化数据价值,围绕数据和工具缔造持久的创新文化,成为面向未来的企业,这莫过于亚马逊云科技云原生数据战略的本质。
CloudFix 首席执行官 Rahul Subramaniam 说的好, 过去亚马逊云科技花费了时间和精力让产业相信亚马逊云科技是执行数据驱动创新的地方,我相信他们在执行方面非常成功。今天的主题演讲有力说服企业高管,确信亚马逊云科技拥有所有到位的工具和实践,让客户能够安心地让他们的数据驻留在 AWS 中,并释放创新力量。
亚马逊云科技大中华区产品部计算与存储总监周舸在拉斯维加斯re:Invent 2022现场介绍,笛卡尔实验室通过将云平台迁移至亚马逊云科技,加速地理空间海量数据的分析。利用云中可大规模扩展的对象存储服务Amazon Simple Storage Service(Amazon S3)的智能分层功能,自动将数据存储至最具成本效益的存储层,帮助客户通过地理空间数据提供行星尺度的可实施洞察。优化了其20PB数据库的存储成本。周舸指出,这实际上是云端群集全球规模超算,从创建到测试结束仅24分钟,并在商用计算机系统500强排名中一下闯入第40位。关键是成本只花了2万美金。如果要创建这个性能指标的HPC,得花2千-3千万美金投入,数据中心建设1年半以上。这就是超算上云按需计算的巨大力量。
挺进SaaS,增强行业服务
数据只有在业务应用中才能发现洞察,产生价值。之所以许多企业不能获取数据的价值,原因之一是缺乏行业为中心的解决方案。
早在2017 年,亚马逊云科技就进军客服呼叫中心市场,推出了 Amazon Connect。向云计算企业客户提供与传统产品相比低成本、高价值的替代方案。
本次大会,亚马逊为 Amazon Connect添加新的机器学习功能,使 Amazon Connect 的预测、容量规划、调度和 Contact Lens 功能普遍可用。由此企业可以预测联络中心需求、计划人员配置和按需安排座席。
Amazon Connect 使用机器学习模型根据历史数据分析和预测联系量和平均处理时间,预测包括呼入电话、转接电话、回拨电话和聊天时间。特别是还部署了开箱即用的机器学习功能,方便企业培训人员。此外,用户只需为座席与客户互动的时间付费。
目前来看,亚马逊对SaaS的发力在通用大宗应用和服务,而且自己已深耕多年。对类别繁多的商业应用,亚马逊大方向聚焦在技术解决方案和服务,提供简捷高效的工具和平台,以及创新开箱即用的SaaS模式,让企业不要在基础架构搭建和管理上浪费精力,专注于创建解决自身业务疼点的应用和洞察。
亚马逊云科技在2022 re:Invent全球大会上宣布,推出新的应用程序Amazon Supply Chain,帮助企业提高供应链的可见性,做出更快、更明智的决策,并降低风险、优化成本及改善客户体验。
Amazon Supply Chain 可自动合并、分析多个供应链系统的数据,企业因此可以实时观察供应链运营的情况,更快地发现趋势,更准确地预测需求,确保充足的库存满足客户预期。
这项应用,根源于亚马逊自家 Amazon.com近30年的物流网络经验,Amazon Supply Chain通过提供统一的数据湖、机器学习驱动的洞察、行动建议和应用程序内协作功能,提高客户供应链的韧性。
亚马逊供应链向客户开放之际,全球仍在 COVID-19 大流行病、乌克兰战争和失控的通货膨胀之际,导致无数供应链问题。难怪供应链管理是企业应用软件中增长最快的部分之一,Gartner Inc. 估计它今年的销售额将超过 200 亿美元。
亚马逊自家的全美著名天然和有机食品超市Whole Foods Market,就应用该供应链进行可视化地图实时查看产品级库存变动,显著改善配送中心的库存管理。
亚马逊云科技智能制造全球技术主管 Steve Blackwell接受采访
在大会现场采访中,亚马逊云科技智能制造全球技术主管 Steve Blackwell告诉记者,许多的制造商都有很广泛的供应链,他们需要确保整个供应链真实的可见性,做出正确的决策,如果市场有变化,能够快速地去反应。亚马逊云科技不光自己可以提供供应链服务,我们也有很多合作伙伴也有这方面的解决方案。
在谈到亚马逊供应链优势时, Steve Blackwell如是说,我们最大的优势就是在电商领域30年的管理供应链的经验。比如就机器学习来讲,我们积累了各种各样的模式,我们把这些经验集成在我们的产品中,作为一个服务提供给大家。真是自家狗粮自家吃的好例证。
亚马逊云科技行业解决方案的另外一个重大举措是发布Amazon Omics,这是一种专门构建的医疗保健和生命科学服务,应用处理在 PB 数据级别,用于大规模存储、查询、分析基因组数据。
借助 Amazon Omics,用户可以将基因组、生物和人口健康数据整合在一起,进行洞察并通过多模式分析提供更加个性化的护理。例如,可以使用 Amazon SageMaker 训练 ML 模型,以帮助研究人员预测个体是否易患某些疾病。您还可以将个人的基因组数据与其来自 Amazon HealthLake 的病史相结合,以提供更好的诊断和个性化治疗计划。Amazon Omics 现已在 AWS 美国、亚太地区和欧洲启用。
AstraZeneca 正在使用大量 AI 和 ML 服务来研究、创建和构建针对多种疾病的新疗法,并正在使用亚马逊云科技来管理其庞大的数据数据库,以及在全球网络中移动 25 PB 的数据。
AWS 在 re:Invent 2022 上为 HealthLake 引入的第一个新功能称为 Amazon HealthLake Imaging。由于这项功能,客户现在可以使用 Amazon HealthLake 来存储医学图像并以亚秒级延迟访问它们。据 AWS 称,该服务可以帮助医疗机构将存储医学影像数据集的成本降低多达 40%。
好消息是 Amazon Omics 得到了 Lifebit、BioTeam等多家合作伙伴的广泛支持。有ISV 合作伙伴在 AWS 上提供使用 Amazon Omics 的完整软件应用程序,还有咨询合作伙伴可以帮助客户利用 Amazon Omics 的强大功能将自定义组学应用程序迁移到云。
亚马逊云科技医疗和生命科学行业解决方案主管 Pat Combes与笔者自拍照
在大会现场,亚马逊云科技医疗和生命科学行业解决方案主管 Pat Combes告诉记者,我们的客户希望我们可以针对云中的遗传数据或基因组数据有特殊的处理方式。虽然之前医疗行业的客户通常将这些数据存储在Amazon S3上,但我们发现,他们往往需要复杂的工具和流程来搜索这些数据,对这些数据进行编目、解读等等。现在,Amazon Omics可以为他们提供一个统一的界面,客户无需再构建自己的工具,轻松拥有数据的存储、查询和分析等能力。
谈到亚马逊云科技在医疗和生命科学的优势时,Pat Combes指出,我们一直在与我们的客户接触,特别是在医疗和生命科学领域。我们直接参与医疗和生命科学领域的业务已经有大约八年了。所以我们已经与我们的客户一起做了大量的工作,根据客户的需求,我们在云上帮助客户构建满足他们企业业务发展的工作负载,帮助他们深入到非常具体的细分领域,一起实现业务创新转型。
Pat Combes还特别强调,一经发布我们的客户和合作伙伴甚至已经开始在尝试使用Amazon Omics。
2013年,当时IBM CEO罗睿兰语惊四座地说,数据是下一个自然资源。10年之后,Swami进一步认识到“数据是现代文明的起源”。而Adam更加高瞻远瞩概括“It’s all about Data.”
One more thing:亚马逊云科技会期宣布2030 年实现水资源正效益承诺,即将向社区环境返还的水量多于自己直接运营中使用的水量。赞赞赞!