什么是机器学习?应用场景以及未来趋势

机器学习 (ML) 被定义为人工智能 (AI) 的一门学科,它使机器能够自动从数据和过去的经验中学习,以识别模式并在最少的人工干预下做出预测。本文介绍了机器学习的基础知识、其类型以及最重要的五个应用程序。它还分享了 2022 年机器学习的十大趋势。 

目录

什么是机器学习?

机器学习是如何工作的?

机器学习的类型

1. 监督机器学习

2. 无监督机器学习

3. 半监督学习

4.强化学习

前 5 名机器学习应用程序

1.医疗保健行业

2. 金融业

3. 零售业

4.旅游行业

5.社交媒体

2022 年机器学习十大趋势

1. 区块链遇上机器学习

2. 基于人工智能的自助服务工具

3. 个性化人工智能助手和搜索引擎

4、全包式智能辅助

5. 个人医疗器械

6.增强增强现实(AR)

7. 汽车工业的进步

8. 全栈深度学习

9.生成对抗网络(GAN)

10.TinyML

总结


什么是机器学习?

机器学习 (ML) 是人工智能 (AI) 的一门学科,它使机器能够自动从数据和过去的经验中学习,同时识别模式以在最少的人工干预下进行预测。

机器学习方法使计算机无需显式编程即可自主运行。ML 应用程序接收到新数据,它们可以独立学习、成长、开发和适应。

机器学习通过利用算法识别模式并在迭代过程中学习,从大量数据中获取有见地的信息。ML 算法使用计算方法直接从数据中学习,而不是依赖于任何可以用作模型的预定方程。

随着“学习”过程中可用样本数量的增加,ML 算法的性能会自适应地提高。例如,深度学习是机器学习的一个子领域,它训练计算机模仿自然的人类特征,例如从示例中学习。它提供了比传统 ML 算法更好的性能参数。

虽然机器学习并不是一个新概念——可以追溯到第二次世界大战时使用的 Enigma 机器——但自动将复杂的数学计算应用于不断增长的数量和种类的可用数据的能力是一个相对较新的发展。

如今,随着大数据、物联网和普适计算的兴起,机器学习已成为解决众多领域问题的关键,例如

  • 计算金融学(信用评分、算法交易)
  • 计算机视觉(面部识别、运动跟踪、物体检测)
  • 计算生物学(DNA 测序、脑肿瘤检测、药物发现)
  • 汽车、航空航天和制造(预测性维护)
  • 自然语言处理(语音识别)

机器学习是如何工作的?

机器学习算法在训练数据集上成型以创建模型。当新的输入数据被引入经过训练的 ML 算法时,它会使用开发的模型进行预测。

什么是机器学习?应用场景以及未来趋势_第1张图片

机器学习的工作原理

注意:上图公开了一个高级用例场景。然而,典型的机器学习示例可能涉及许多其他因素、变量和步骤。

此外,检查预测的准确性。根据其准确性,使用增强训练数据集重复部署或训练 ML 算法,直到达到所需的准确性。

机器学习的类型

机器学习算法可以通过多种方式进行训练,每种方法都有其优缺点。基于这些方法和学习方式,机器学习大致分为四种主要类型:

什么是机器学习?应用场景以及未来趋势_第2张图片

机器学习的类型

1. 监督机器学习

这种类型的 ML 涉及监督,其中机器在标记的数据集上进行训练,并能够根据提供的训练预测输出。带标签的数据集指定一些输入和输出参数已经映射。因此,机器是用输入和相应的输出来训练的。在后续阶段使用测试数据集预测结果的设备。

例如,考虑鹦鹉和乌鸦图像的输入数据集。最初,机器被训练来理解图片,包括鹦鹉和乌鸦的颜色、眼睛、形状和大小。训练后,输入一张鹦鹉图片,期望机器识别物体并预测输出。经过训练的机器会检查输入图片中物体的各种特征,例如颜色、眼睛、形状等,从而做出最终预测。这就是监督机器学习中对象识别的过程。

监督学习技术的主要目标是将输入变量 (a) 映射到输出变量 (b)。监督机器学习进一步分为两大类:

  • 分类:这些指的是解决输出变量是分类的分类问题的算法;例如,是或否、真或假、男性或女性等。此类的实际应用在垃圾邮件检测和电子邮件过滤中很明显。

一些已知的分类算法包括随机森林算法、决策树算法、逻辑回归算法和支持向量机算法。

  • 回归:回归算法处理输入和输出变量具有线性关系的回归问题。众所周知,这些可以预测连续输出变量。例子包括天气预报、市场趋势分析等。

流行的回归算法包括简单线性回归算法、多元回归算法、决策树算法和套索回归。

2. 无监督机器学习

无监督学习是指一种没有监督的学习技术。在这里,机器使用未标记的数据集进行训练,并且能够在没有任何监督的情况下预测输出。无监督学习算法旨在根据输入的相似性、差异性和模式对未排序的数据集进行分组。

例如,考虑一个装满水果的容器图像的输入数据集。在这里,机器学习模型不知道这些图像。当我们将数据集输入 ML 模型时,模型的任务是识别对象的模式,例如输入图像中看到的颜色、形状或差异,并对它们进行分类。分类后,机器会在使用测试数据集进行测试时预测输出。

无监督机器学习进一步分为两类:

  • 聚类:聚类技术是指根据对象之间的相似性或差异性等参数将对象分组为簇。例如,按客户产品对客户进行分组。

一些已知的聚类算法包括 K-Means 聚类算法、Mean-Shift 算法、DBSCAN 算法、主成分分析和独立成分分析。

  • 关联:关联学习是指识别大型数据集变量之间的典型关系。它确定各种数据项的依赖关系并映射相关变量。典型应用包括网络使用挖掘和市场数据分析。

遵守关联规则的流行算法包括 Apriori 算法、Eclat 算法和 FP-Growth 算法。

3. 半监督学习

半监督学习包括有监督和无监督机器学习的特点。它使用标记和未标记数据集的组合来训练其算法。使用这两种类型的数据集,半监督学习克服了上述选项的缺点。

考虑一个大学生的例子。在大学里,学生在老师的监督下学习一个概念被称为监督学习。在无监督学习中,学生在没有老师指导的情况下在家自学相同的概念。同时,学生在大学老师的指导下学习后修改概念是一种半监督的学习形式。 

4.强化学习

强化学习是一个基于反馈的过程。在这里,人工智能组件通过命中和试验方法自动评估其周围环境,采取行动,从经验中学习,并提高性能。该组件会因每个良好的动作而获得奖励,并因每个错误的动作而受到惩罚。因此,强化学习组件旨在通过执行良好的动作来最大化奖励。

与监督学习不同,强化学习缺乏标记数据,代理只能通过经验进行学习。考虑电子游戏。在这里,游戏指定了环境,强化代理的每一个动作都定义了它的状态。智能体有权通过惩罚和奖励获得反馈,从而影响整体游戏得分。代理的最终目标是获得高分。

强化学习应用于博弈论、信息论和多智能体系统等不同领域。强化学习进一步分为两类方法或算法:

  • positive reinforcement learning :这是指在agent的特定行为之后加入一个强化刺激,使得该行为在未来更有可能再次发生,例如,在一个行为之后加入奖励。
  • 负强化学习:负强化学习是指加强特定行为以避免负面结果。

前 5 名机器学习应用程序

处理大量数据的垂直行业已经意识到机器学习技术的重要性和价值。随着机器学习从实时数据中获得洞察力,使用它的组织可以高效地工作并获得优于竞争对手的优势。

在这个快节奏的数字世界中,每个垂直行业都从机器学习技术中受益匪浅。在这里,我们看看排名前五的 ML 应用领域。

1.医疗保健行业

机器学习越来越多地被医疗保健行业采用,这要归功于可穿戴设备和传感器,例如可穿戴健身追踪器、智能健康手表等。所有此类设备都会监控用户的健康数据,以实时评估他们的健康状况。

此外,该技术正在帮助医生分析趋势或标记可能有助于改善患者诊断和治疗的事件。ML 算法甚至可以让医学专家更准确地预测患有致命疾病的患者的寿命。

此外,机器学习在两个领域做出了重大贡献:

  • 药物发现:制造或发现一种新药是昂贵的,并且涉及一个漫长的过程。机器学习有助于加快这种多步骤过程中涉及的步骤。例如,辉瑞公司使用 IBM 的 Watson 分析大量不同的数据以进行药物发现。
  • 个性化治疗:药品制造商面临着验证特定药物对大量人群有效性的严峻挑战。这是因为该药物在临床试验中仅对一小部分人起作用,并且可能对某些受试者造成副作用。

为了解决这些问题,Genentech 等公司与 GNS Healthcare 合作,利用机器学习和模拟 AI 平台,创新生物医学疗法来解决这些问题。机器学习技术通过分析个体基因寻找患者的反应标记,为患者提供针对性治疗。

2. Bank

如今,一些finance机构和bank使用机器学习技术来应对欺诈活动,并从海量数据中汲取重要见解。ML 衍生的见解有助于识别机会,让investor决定何时进行trade。

此外,数据挖掘方法帮助网络监视系统将欺诈活动的警告信号归零,随后将其消除。几家finance机构已经与科技公司合作,利用机器学习的优势。

3. 零售业

零售网站广泛使用机器学习来根据用户的历史推荐商品。零售商使用 ML 技术来捕获数据、分析数据并为客户提供个性化的购物体验。他们还为营销活动、客户洞察、客户商品规划和价格优化实施机器学习。

根据 Grand View Research, Inc. 2021 年 9 月的一份报告,到 2028 年,全球推荐引擎市场的估值预计将达到 173 亿美元。推荐系统的常见日常示例包括:

  • 当您在亚马逊上浏览商品时,您在主页上看到的产品推荐来自机器学习算法。Amazon 使用人工神经网络 (ANN)根据客户最近的历史记录、评论、书签和其他在线活动提供与客户相关的智能、个性化推荐。
  • Netflix 和 YouTube 严重依赖推荐系统,根据用户的观看历史向他们推荐节目和视频。

此外,零售网站还配备了虚拟助理或对话式聊天机器人,它们利用 ML、自然语言处理 (NLP) 和自然语言理解 (NLU) 来自动化客户购物体验。

4.旅游行业

机器学习在扩大旅游业范围方面发挥着举足轻重的作用。Uber、Ola 甚至自动驾驶汽车提供的乘车服务都有强大的机器学习后端。

考虑 Uber 的机器学习算法,该算法处理其乘车的动态定价。Uber 使用名为“Geosurge”的机器学习模型来管理动态定价参数。它对交通模式、供应和需求使用实时预测模型。如果你开会迟到了,需要在拥挤的地方叫优步,动态定价模式就会启动,你可以立即叫到优步,但需要支付两倍的普通车费。

此外,旅游业使用机器学习来分析用户评论。通过基于正面或负面分数的情感分析对用户评论进行分类。这被旅游行业的公司用于活动监控、品牌监控、合规监控等。

5.社交媒体

借助机器学习,数十亿用户可以有效地参与社交媒体网络。机器学习在推动社交媒体平台从个性化新闻提要到投放特定于用户的方面发挥着关键作用。例如,Facebook 的自动标记功能采用图像识别来识别您朋友的脸并自动标记他们。该社交网络使用 ANN 识别用户联系人列表中熟悉的面孔,并促进自动标记。

同样,LinkedIn 知道您应该何时申请下一个职位,您需要联系谁,以及您的技能与同行相比排名如何。所有这些功能都是通过机器学习实现的。

2022 年机器学习十大趋势

机器学习对全球所有垂直行业产生了重大影响,从初创公司到财富 500 强公司。根据 Fortune Business Insights 2021 年的一份报告,2021 年全球机器学习市场规模为 155 亿美元,预计到 2028 年将增长到惊人的 1522.4 亿美元,复合年增长率为 38.6%。

从机器学习的日益普及来看,预计 2022 年将出现类似的轨迹。在这里,我们看看 2022 年的十大机器学习趋势。

什么是机器学习?应用场景以及未来趋势_第3张图片

2022 年的机器学习趋势

1. 区块链遇上机器学习

区块链是比特币等加密货币背后的技术,有利于众多企业。该技术使用去中心化分类账记录每笔交易,从而在没有任何中介的情况下提高相关方之间的透明度。此外,区块链trade是不可逆的,这意味着一旦账本更新,它们就永远不会被删除或更改。

区块链有望与机器学习和人工智能融合,因为这两种技术的某些功能相互补充。这包括去中心化的分类账、透明度和不变性。

例如,巴克莱银行和汇丰bank等致力于为客户提供无息loan的区块链驱动项目。此外,bank采用机器学习来根据潜在loan​​​​​​​人的支出模式确定他们的信用评分。

2. 基于人工智能的自助服务工具

一些企业已经采用基于人工智能的解决方案或自助服务工具来简化他们的运营。谷歌、微软和 Facebook 等大型科技公司在 Messenger 和 Skype 等消息平台上使用机器人来高效地执行自助服务任务。

例如,当您在搜索引擎或谷歌地图上搜索位置时,“获取路线”选项会自动弹出。这会告诉您到达所需目的地的确切路线,从而节省宝贵的时间。如果这种趋势继续下去,机器学习最终将能够为正在寻找企业产品和服务的客户提供完全自动化的体验。

3. 个性化人工智能助手和搜索引擎

今天,每个人都对 Siri 和 Alexa 等人工智能助手了如指掌。这些语音助手执行各种任务,例如预订机票、支付账单、播放用户最喜欢的歌曲,甚至向同事发送消息。

随着时间的推移,这些聊天机器人有望提供更加个性化的体验,例如就各种问题提供法律建议、做出关键业务决策、提供个性化医疗等。

另一方面,Google 和 Bing 等搜索引擎会爬取多个数据源以提供正确的内容。随着个性化程度的提高,今天的搜索引擎可以爬取个人数据,为用户提供个性化的结果。

例如,当您在 Google 上搜索“运动鞋”时,下次访问 Google 时,您会看到与上次搜索相关的。因此,搜索引擎变得更加个性化,因为它们可以根据您的数据提供特定的结果。

4、全包式智能辅助

随着个性化成为中心舞台,智能助手随时准备通过代表我们执行任务(例如驾驶、烹饪,甚至杂货)来提供全方位的帮助。这些将包括我们通常通过人工代理获得的高级服务,例如安排旅行或在身体不适时会见医生。

例如,如果你生病了,你需要做的就是打电话给你的助手。根据您的数据,它将与您所在地区的顶级医生进行预约。然后,助理会跟进安排医院并预订优步准时接您。

5. 个人医疗器械

今天,可穿戴医疗设备已经成为我们日常生活的一部分。这些设备测量健康数据,包括心率、血糖水平、盐水平等。然而,随着机器学习和人工智能的广泛实施,未来此类设备将有更多数据提供给用户。

可穿戴设备将能够实时分析健康数据,并根据个人需求提供个性化诊断和治疗。在危急情况下,可穿戴传感器还将能够根据健康数据建议进行一系列健康测试。他们甚至可以与附近的专家预约。

6.增强增强现实(AR)

尽管增强现实已经存在了几年,但我们现在正在见证技术的真正潜力。微软的 HoloLens 就是一个流行的例子。这些 AR 眼镜在物理环境上投射数字覆盖,并允许用户使用语音命令或手势与虚拟世界进行交互。

然而,AR 的高级版本将在未来几个月内成为新闻。到 2022 年,此类设备将继续改进,因为它们可能允许从任何位置与朋友和家人进行面对面的互动和对话。这就是当今增强现实开发人员需求量很大的原因之一。

7. 汽车工业的进步

自动驾驶汽车已经在街上进行了测试。他们能够在复杂的城市环境中驾驶,而无需任何人为干预。尽管对于何时允许它们上路存在很大疑问,但预计 2022 年将推动这场辩论。

到 2022 年,自动驾驶汽车甚至可以让司机在旅途中小睡片刻。这不仅限于自动驾驶汽车,还可能改变运输业。例如,自动驾驶公交车可以大举进军,无需人工干预即可搭载多名乘客到达目的地。

8. 全栈深度学习

如今,深度学习正在图像识别、自动驾驶汽车、语音交互等许多应用中扎根。此外,DeepMind 的 AlphaGo 等游戏探索深度学习,可以轻松达到专家水平。

到 2022 年,深度学习将在医学成像领域得到应用,医生可以使用图像识别来更准确地诊断病情。此外,深度学习将在开发能够理解代码并根据提供的输入数据自行编写程序的编程语言方面取得重大进展。

例如,考虑一个包含多个财务数据条目的 Excel 电子表格。在这里,机器学习系统将使用基于深度学习的编程,根据之前的示例了解哪些数字是好数据,哪些是坏数据。

9.生成对抗网络(GAN)

生成对抗网络是近年来重要的机器学习突破。它可以从零开始或随机噪声中生成有价值的数据,通常是图像或音乐。简而言之,我们可以让两个神经网络相互竞争并找出最佳路径,而不是用数百万个数据点训练单个神经网络。

例如,当你将马的图像输入到 GAN 中时,它可以生成斑马的图像。

10.TinyML

TinyML 彻底改变了机器学习。受物联网的启发,它允许物联网边缘设备运行机器学习驱动的流程。例如,“Hey Siri”或“Hey Google”等智能手机的唤醒命令属于 tinyML。

此外,发送到服务器的 Web 请求需要时间来生成响应。首先,请求将数据发送到服务器,由机器学习算法处理,然后收到响应。相反,一个省时的过程可能是在边缘设备上使用 ML 程序。这种方法有几个优点,例如更低的延迟、更低的功耗、更少的带宽使用,并同时确保用户隐私。

随着连接设备的激增,tinyML 将继续变得复杂,并在 2022 年得到普及。

总结

计算机可以通过机器学习来学习、记忆和生成准确的输出。它使公司能够做出对简化业务运营至关重要的明智决策。这种数据驱动的决策帮助跨行业的公司,从制造、零售、医疗保健、能源和金融服务,优化他们当前的运营,同时寻求新的方法来减轻他们的整体工作量。

随着计算机算法变得越来越智能,我们可以预见到 2022 年及以后机器学习的上升轨迹。

你可能感兴趣的:(人工智能/机器学习,人工智能,数据挖掘)