您可能会越来越多地听到关于机器学习 (人工智能的一个子集)的信息。 但是,您到底可以使用机器学习做什么呢?
该技术包含许多方法和技术,并且每种方法和技术都有一组潜在的用例。 企业最好在对机器学习工具和基础设施进行投资计划之前对其进行检查。
通过围绕机器学习和人工智能的炒作,我们的小组讨论了该技术的定义和含义。
如果您知道要学习的机器,监督学习是理想的选择。 您可以将其暴露给大量的训练数据,检查输出并调整参数,直到获得期望的结果。 稍后,您可以通过预测机器之前从未见过的一组验证数据的结果来查看机器学到了什么。
最常见的监督学习任务涉及分类和预测或回归 。
监督学习方法可用于应用程序,例如根据有关财务绩效的过去信息确定个人和组织的财务风险。 他们还可以很好地了解客户的行为方式或他们基于先前的行为模式的偏好。
例如,在线贷款市场Lending Tree正在使用DataRobot的自动化机器学习平台来为其客户定制体验,并根据他们过去所做的事情来预测他们的意图,副总裁兼战略负责人Akshay Tandon说分析。
通过预测客户的意愿(主要是通过潜在顾客评分), Lending Tree可以将那些只想买一个利率的人与那些实际正在寻找贷款并准备好申请贷款的人进行分类。 使用监督学习技术,它建立了一个分类模型来定义线索关闭的可能性。
无监督学习使机器可以浏览数据集并识别链接不同变量的隐藏模式。 此方法可用于仅基于数据的统计属性将数据分组。
无监督学习的一个很好的应用是用于执行概率记录链接的聚类算法,该技术可提取数据元素之间的连接,并在这些数据元素上构建以识别个人或组织及其在物理或虚拟世界中的连接。
LexisNexis Risk Solutions公司技术副总裁Flavio Villanustre说,这对于需要整合来自不同来源和/或不同业务部门的数据以建立其客户的一致和全面视图的企业尤其有用。使用分析来帮助客户预测和管理风险的公司。
咨询公司Cambridge Consultants的专业机器学习工程师Sally Epstein说,无监督学习可用于情绪分析 ,该分析可根据他们的社交媒体帖子,电子邮件或其他书面反馈来识别个人的情绪状态。 该公司已经看到越来越多的金融服务公司使用无监督学习来深入了解客户满意度。
半监督学习是监督学习和无监督学习的混合体。 通过标记一小部分数据,培训师可以为机器提供有关如何对其余数据集进行聚类的线索。
半监督学习可用于检测身份欺诈以及其他用途。 Villanustre指出,幸运的是,欺诈并不像非欺诈活动那样频繁,因此,这种欺诈活动可以被视为合法活动领域中的“反常现象”。 仍然存在欺诈,并且可以使用半监督的异常检测机器学习方法来为这些类型的问题的解决方案建模。 部署这种类型的学习来识别在线交易中的欺诈行为。
爱泼斯坦说,当有标签和无标签的数据混合在一起时,也可以使用半监督学习,这在大型企业环境中经常出现。 她说,通过在标签和未标签数据的混合上训练AI算法,亚马逊能够增强对Alexa产品的自然语言理解。 她说,这有助于提高Alexa回复的准确性。
通过强化学习,您可以让机器与环境互动(例如,将损坏的产品从传送带上推到垃圾箱中),并在机器完成您想要的操作时提供奖励。 通过自动计算奖励,您可以让机器自行学习。
强化学习的一个用例是在零售店中对衣物和其他物品进行分类。
咨询公司德勤(Deloitte)的分析师戴维·沙茨基(David Schatsky)表示,一些服装零售商一直在尝试诸如机器人技术之类的新型技术,以帮助对诸如衣服,鞋子和配饰等物品进行分类。他专注于新兴技术和商业趋势。
Schatsky说,这些机器人使用强化学习(以及深度学习)来计算出在抓取物品时应该使用多少压力以及如何最好地抓住库存中的物品。
强化学习的一种变体是深度强化学习 ,它非常适合于仅靠监督学习或无监督学习技术无法完成工作的自主决策。
深度学习执行的学习类型包括无监督学习或强化学习。 从广义上讲,深度学习主要通过使用神经网络来越来越详细地识别数据集的特征,从而模仿人们学习的某些方面。
Schatsky说,以深度神经网络(DNN)形式进行的深度学习已被用来加速药物发现的高内涵筛选。 它涉及到应用DNN加速技术在更少的时间内处理多幅图像,同时从模型最终学习的图像特征中提取更多见解。
这种机器学习方法还使许多公司与欺诈作斗争,通过使用自动化检测错误行为来提高检测率。
深度学习也可以用于汽车行业。 沙特斯基说,一家公司已经开发了一种基于神经网络的系统,该系统可以及早发现汽车问题。 该系统可以识别噪音和振动,并且可以使用与规范的任何偏差来解释故障的性质。 它可以成为预测性维护的一部分,因为它可以确定汽车任何运动部件的振动,并且甚至可以注意到其性能的微小变化。
神经网络旨在模拟人脑中神经元的结构,每个人工神经元都连接到系统内部的其他神经元。 神经网络分层排列,一层中的神经元将数据传递到下一层中的多个神经元,依此类推。 最终,它们到达输出层,网络将在该输出层上提出最佳猜测来解决问题,识别对象等。
神经网络的用例涉及多个行业:
决策树算法旨在通过识别有关项目属性的问题来对项目进行分类,这有助于决定将项目放置在哪个类中。 树中的每个节点都是一个问题,分支导致有关该项目的更多问题,叶子是最终分类。
决策树的用例可以包括建立用于客户服务,价格预测和产品计划的知识管理平台。
商业和技术咨询公司SPR的首席数据科学家Ray Johnson说,当一家保险公司需要根据潜在风险洞悉哪种类型的保险产品和保费调整时,可能会使用决策树。 使用覆盖有与天气相关的损失数据的位置数据,它可以根据提交的索赔和支出金额创建风险类别。 然后,它可以根据模型评估新的承保范围,以提供风险类别和潜在的财务影响,他说。
虽然必须训练单个决策树以提供准确的结果,但是随机森林算法采用了一组随机创建的决策树,这些决策树的决策基于不同的属性集,并让它们对最受欢迎的类别进行投票。
爱泼斯坦说,随机森林是用于查找数据集中关系的通用工具,并且训练Swift。 例如,长期以来,不请自来的批量电子邮件一直是一个问题,不仅对于用户而且对于必须管理服务器日益增加的负载的Internet服务提供商也是如此。 她说,作为对这一问题的回应,已经开发出了从普通电子邮件中过滤垃圾邮件的自动方法,使用随机森林快速准确地识别不需要的电子邮件。
随机森林的其他用途包括通过分析患者的病历来识别疾病,检测银行欺诈,预测呼叫中心的呼叫量以及通过购买特定股票来预测盈亏。
聚类算法使用诸如K均值,均值漂移或期望最大化之类的技术基于共享或相似特征对数据点进行分组。 这是一种无监督的学习技术,可以应用于分类问题。
Schatsky说,当需要分割或分类时,聚类技术特别有用。 示例包括按不同的特征细分客户,以更好地分配营销活动,向某些读者推荐新闻文章,以及有效的警察执法。
聚类对于发现人眼可能并不明显的复杂数据集也很有效。 爱泼斯坦说,例子包括从数据库中相似文件的分类到从犯罪报告中识别犯罪热点。
关联规则学习是推荐引擎中使用的一种无监督技术,该技术可查找变量之间的关系。
这是许多电子商务网站上“购买X的人也购买Y的人”建议背后的技术,并且如何使用此示例很常见。
约翰逊说,一个特定的用例可能是一家特种食品零售商,希望增加销售量。 它将使用这种技术来检查客户的购买行为,从而为庆祝活动,运动队等产品提供特殊的罐头和捆装。 关联规则技术提供了可以在客户何时何地购买首选产品组合的洞察力。
约翰逊说,利用过去购买和时间范围内的信息,公司可以主动创建奖励计划,并提供特殊的定制报价来推动未来的销售。
From: https://www.infoworld.com/article/3300618/machine-learning-when-to-use-each-method-and-technique.html