【月度文章集锦】2020年9月 AWS 人工智能精华内容一文速览

金秋已至，又到了收获的季节。最近你都有哪些收获呢？手头的项目有什么进展？

2020年9月，我们继续与大家分享了大量有关 Amazon Web Services（AWS）的 AI、机器学习、深度学习等技术文章，是时候简单回顾一下了。

Amazon SageMaker

医疗保险欺诈必然会导致消费者保费和自付费用升高，利益受损或保险覆盖面缩小。将索赔认定为欺诈可能需要复杂而详尽的调查。那么是否可以训练 Amazon SageMaker 模型来标记后付费医疗保险的住院异常索赔，并针对它们的欺诈嫌疑进行进一步调查？这个解决方案不需要标记数据，而是使用非监督机器学习（ML）创建模型来定位可疑的索赔。欢迎阅读：Amazon SageMaker 实战上手：标记可疑的医疗保险索赔。

目前临床基于影像的肿瘤诊断和治疗主要依赖于医生的个人经验和主观评判。然而，目前成像模态多样化，信息量也越来越大，凭借医生的个人判断也越发具有挑战性。如何通过 AI 技术对肿瘤影像数据进行全自动、精准的诊断和治疗规划一直是研究热点和难点。实际上，很多优秀的医疗+AI 用户正通过在 AWS 上快速搭建服务平台，极大缩短了产品从构想、开发，再到部署的时间。同时越来越多的用户发现 AWS 技术上的优势可以让医疗 AI 用户的模型训练变得更为轻松。怎么做到的？欢迎阅读：Amazon SageMaker 助力医学影像AI诊断技术。

表格类数据一直是众多行业（包括金融、医疗保健以及制造业等）所采取的主要数据存储方法。大多数机器学习（ML）用例也主要面向传统的结构化或表格数据。在使用机器学习处理表格数据时，我们往往需要引入人工审核流程，协助管理工作流中需要人工加以判断的敏感环节。在此类用例的工作流中，人工审核人员需要查看ML模型中以静态表格格式（通常被称为「数据框」）作为输入的全部或部分数字化特征，同时对输出结果中的某些行做出动态修改。如何借助 Amazon SageMaker 改进这个过程？欢迎阅读：搞定基于表格数据的ML模型，有 Amazon SageMaker 就够了。

Kubeflow 是一款流行的开源机器学习工具包，适用于希望构建自定义机器学习管道的 Kubernetes 用户。最近，AWS 正式公布了适用于 Kubeflow Pipelines 的 Amazon SageMaker Components。借此，Amazon SageMaker Components 能够帮助我们在 Kubeflow Pipelines 上实现强大的 Amazon SageMaker 功能，以全托管服务的形式支持数据标记、大规模超参数调优以及分布式训练作业、一键式安全可扩展模型部署，并通过 Amazon Elastic Compute Cloud (Amazon EC2)竞价实例进行高成本效益训练等目标。详细了解：好消息：Amazon SageMaker 正式支持 Kubeflow 啦。

机器学习

很多成功的在线销售型企业会为每个用户实现用户画像、为其产生个性化推送内容，进而实现精准营销。例如个性化产品推荐以及促销活动。为此，我们可以使用Apache MXNet构造多标签分类模型，用于在数千类别里预测用户倾向。通过预测结果，可以创造一种个性化的内容，帮助用户去选择最好的商品。亲自试试：使用DJL在Apache Spark上完成基于Amazon Retail System的用户行为预测，实现精准营销。

在企业环境中，面对五花八门的 IT 系统、文档库，以及其他种类各异的数据源，如何快速找到需要的内容？搜索就行。但假设需要的信息分布在几个甚至十几个不同的应用或系统中，除了分别在这些地方进行搜索，还有什么更好的办法吗？如果能有一种服务，就像互联网上的搜索引擎那样，可以给企业内部的各类数据源创建索引，并让我们在一个位置，通过一次搜索操作，全面搜索内网中的各类数据源，并将结果统一呈现在一起，那该多方便！详细阅读：外事不决有某度，内事不决问 Kendra—— 自建企业级搜索引擎，方法很简单。

作为 Amazon 旗下的云语音服务，Alexa 已经以「智能助理」的形式出现在各类设备和应用中，每天帮助全球大量用户获得更高工作效率和更便捷的生活。不过你有没有好奇过，面对全球不同语言和文化的用户，TA 到底是如何在短时间内精通各种语言，并与用户交互的？详细阅读：Alexa，你是怎样那么快速学会各种外语的。

借助 AWS DeepComposer，我们可以使用预先训练好的音乐流派模型（如爵士、摇滚、流行、交响乐等）将我们提供的旋律转换为相应流派的曲子。那么当你玩转这个服务后，有没有想过自己也「开宗立派」，通过一定的参数训练出自己的流派选项？当然可以！只需要将音乐数据文件存储在 NumPy 对象中，随后训练一套自定义 GAN 模型中的训练步骤进行操作即可。亲自试试：自成一派，这个作曲大师确实名副其实。

深度学习

深度学习在大数据领域上的应用日趋广泛，可是在 Java/Scala 上的部署方案却屈指可数。亚马逊开源项目团队另辟蹊径，利用DJL帮助用户部署深度学习应用在 Spark 上。只需10分钟，你就可以轻松部署 TensorFlow、PyTorch 以及 MXNet 的模型在大数据生产环境中。详细阅读：只需轻松几步，十分钟内用 Scala 在 Apache Spark 上部署深度学习模型。

许多 AWS 云服务的用户都在逐步将机器学习和深度学习任务搭载在他们已有产品之上。尽管机器学习应用广泛应用在其他语言中（例如 Python），但是对于广大已有产品的开发者学习和集成成本依然很高。试想一下，如果要用另一种语言集成在已有的 Java 服务中，从写代码，编译，测试到最后部署都要做出大量改变。为解决用户在这方面上的痛点，我们可以试着无需对已有资源和人员重新调配，直接部署机器学习应用在现有的服务中。看看该怎么做：几行代码，轻松实现目标检测和图像分类任务 —— 基于 Spring Boot 和 DJL 搭建企业级机器学习微服务。

【月度文章集锦】2020年9月 AWS 人工智能精华内容一文速览

Amazon SageMaker

机器学习

深度学习

你可能感兴趣的:(机器学习)