什么是 Amazon SageMaker?
为了解决机器学习本身存在的诸多问题,让数据科学家、算法工程师、业务开发者都能轻松驾驭机器学习,AWS 于2017年11月推出了 Amazon SageMaker 机器学习平台服务,并且在过去的两年多里不断丰富功能组件。在 Gartner 发布的 2020 年云上 AI 开发者服务魔力象限中,AWS 被评为领导者, Amazon SageMaker 是其中不可或缺的一部分。
2020 年 4 月30日,Amazon SageMaker 在由光环新网运营的 AWS 中国(北京)区域和由西云数据运营的 AWS 中国(宁夏)区域正式开放。
那么,Amazon SageMaker 的功能到底有多强大?又有哪些企业应用 Amazon SageMaker 造就成功案例了呢?
如何运用 Amazon SageMaker 进行数据管理及部署工作
自从出现互联网以后,数据的体量、增速和类型就不断地增加。很多企业面临的问题在于,如何管理并理解此“大数据”以得到最理想的回报。
数据湖是一种集中的存储库,它可以存储任何规模的各种结构化和非结构化数据。考虑到更好的安全性、更快的部署、更好的可用性、更具弹性、更广的地理覆盖范围以及与实际利用率相关的成本,让数据湖成功为企业创造高额商业价值迫在眉睫。
数据湖通常采用hub-and-spoke模型,其中中心账户包含控制数据源访问权限的共享服务。我们将hub账户称作中央数据湖(Central Data Lake)。在 hub 账户的众多服务中,我们将重点关注与人工智能(AI)及机器学习(ML)最密切相关的几个方面:摄入、清理、存储和数据目录。
阅读具体案例请点击:《数据横流时代,机器学习如何改变大数据管理?》
Cinnamon AI
Cinnamon AI是一间总部设在日本的创业公司。其旗舰产品 Flax Scanner 是一种文档阅读器。该产品运用自然语言处理 (NLP) 算法实现自动化提取无结构的商业文件(如发票、收据、保险理赔和财务报表等)数据。
Cinnamon AI 选择采用 AWS 开发其 ML 服务,因为 AWS 服务范围较广,且提供多种具有成本效益的定价选项,以及精细化安全控制和技术支持。
“Amazon SageMaker 的托管 Spot 训练功能已经对我们的 AWS 成本节省工作产生了深远影响。在使用托管 Spot 训练后,我们的 AWS EC2 成本足足降低了 70%。” Cinnamon AI 基础设施和信息安全办公室总经理 Tetsuya Saito 表示。“此外,托管 Spot 训练不需要复杂方法支持,通过 Amazon SageMaker 开发工具包即可轻松使用。”
下图显示了六个月内 Cinnamon AI 模型训练成本节省变化趋势。在 2019 年 6 月,该团队将其 ML 工作量迁移至 AWS,随后开始启用 EC2 按需实例进行模型训练。他们还针对使用按需实例的模型训练采用了 Amazon SageMaker,降低了约 20% 左右的训练成本。此外,他们在 2019 年 11 月通过托管 Spot 训练将 Spot 实例用于模型训练,大幅降低成本,成本节省率达到 70% 之多。他们在成本节省方面所取得的显著成果也使得他们在保持降低成本开销的同时,将日常模型训练作业量提升了 40%。
阅读具体案例请点击:《自从有了TA,每年可节约90%的成本!》
虎牙直播
作为一家以游戏为核心的直播平台,虎牙直播算是国内早期进入直播行业的先驱者且快速成长为年轻人喜爱的弹幕式互动直播平台。
基于大举进军海外市场的品牌战略考虑,虎牙直播首选Amazon Web Services(AWS)作为其云服务商,助力虎牙直播完美应对全球化运营的挑战。
直播行业市场空间有限,企业聚集过剩,如何进一步提升其产品竞争力成了虎牙直播在全球化战略下需亟待解决的难题。
为此,虎牙直播不断尝试和利用 AWS 新服务,其中便包括利用 Amazon SageMaker 在云上训练机器学习模型,灵活调配资源,节省成本。
阅读具体案例请点击:《直播正当红,如何利用机器学习进一步**加强产品竞争力?》
F1 与 Amazon Web Services (AWS) 的联手,便是速度与智慧强强结合最佳的证明。
作为一项数据驱动的运动,在每场竞赛中,每辆 F1 赛车的 120 个传感器生成 3GB 数据,每秒生成 1500 个数据点。Formula 1 的数据专家正使用 Amazon SageMaker 培训深度学习模型,用 65 年的历史竞赛数据来提取关键竞赛成绩统计数据,进行竞赛预测,并让粉丝深入了解车队和车手采用的瞬间决策和战略。
自 2017年 推出 Amazon SageMaker 以来,使用该服务的客户数量在不断增加。为能帮忙开发人员更高效地工作,AWS 统一了 ML 开发所需的所有工具,打造了 Amazon SageMaker Studio,让开发人员可以在一个集成的可视界面中编写代码、跟踪实验、可视化数据以及进行调试和监控,从而极大地提高了开发人员的工作效率。
阅读具体案例请点击:《快一点!再快一点!看 F1 如何利用机器学习加速酣畅体验!》