re:Invent|亚马逊云科技已建成一套最完整的机器学习和AI服务

re:Invent|亚马逊云科技已建成一套最完整的机器学习和AI服务_第1张图片AI开发如何走向规模化?事实上,亚马逊云科技已建成一套最完整的机器学习和AI服务。

 

最底层是对CPU、GPU、自研AI加速芯片等不同算力的兼容,以及对各主流深度学习框架的原生支持。

中间Amazon SageMaker,包括机器学习集成开发环境(IDE)、模型调试器、模型监视器、模型分析器(Profiler)、AutoML、特征存储、无代码开发能力以及首个专用的持续集成和持续交付(CI/CD)工具等全面机器学习能力。

最上层还有一系列开箱即用的AI服务,NLP、视觉、语音核心能力,以及面向不同应用场景和行业的专业服务,如自动将语音转换为文本的Amazon Transcribe,以及辅助代码开发的Amazon CodeWhisperer。

靠着这一套完整的AI服务,即使是像Stability AI这样员工仅有100人出头的创业公司,也能做到机器学习开发的规模化、工程化。

实现途径之一是面向云原生开发。

云原生,标准定义是云计算时代一种构建和运行应用程序的方式,充分利用和发挥云计算平台的弹性和自动化优势,结合容器、微服务、无服务器(Serverless)等技术来构建现代化应用。

如果还不好理解,不妨“以史为鉴”一下。传统的软件、APP开发如今已相对成熟,这是因为操作系统承担了很多工作。包括向下与硬件的沟通工作、向上为上层应用制定好了很多标准和规范,软件开发只需面向特定的操作系统,就可以专注于功能实现。到了AI时代,AI产品更多以服务的形式跑在云上,云计算平台就要承担起这个承上启下的角色,实现AI开发的标准化。

云原生给AI开发带来的好处,可以总结为几点:

● 敏捷,靠无服务器(Serverless)技术可以将管理基础设施的工作全部交给云服务商,开发者专注于实现业务逻辑。

● 全面,亚马逊云科技为汽车、金融、制造等多个行业提供解决方案,同时有无代码开发平台Amazon SageMaker Canvas等满足不同水平开发者需求。

● 高性价比,这方面有专为机器学习训练打造的训练芯片Trainium、推理芯片Inferentia提高性能,配合弹性可扩展的按需云计算资源分配机制。

在此基础上,就可摆脱“小作坊”进一步实现AI的工程化,或者叫MLOps,包括:

● 建立可重复的训练工作流程以加速模型开发

● 集中编目机器学习构件,用于模型可再现性和治理

● 将机器学习工作流程与 CI/CD 管道集成,以加速投入生产

● 持续监控生产中的数据和模型,以保持质量

Gartner咨询公司将AI工程化列为2022年十二大战略性技术趋势,IDC则预测到2024年60%的企业将MLOps用于机器学习工作流。除了已有的产品和服务之外,云计算未来的发展更是值得关注。

操作系统为什么备受重视?因为在那个位置上,每一点微小改进都能带来很大的收益。云原生AI格局下,云计算基础架构也是如此,每一点创新都能对AI开发效率带来很大的提升。像这样的产品和服务创新,每年底的亚马逊云科技re:Invent大会上都会带来数十款。

亚马逊云科技也连续12年蝉联Gartner云基础设施和平台服务魔力象限领导者,成为这一魔力象限的最长领跑者。

你可能感兴趣的:(uml,oneapi,arcgis)