通过上一篇的讲解,我们多多少少对机器学习
(Machine Learning)有了些许了解,同时也对机器学习
(Machine Learning)一词不再那么抗拒了。
那么,机器学习
到底在现实生活为我们解决哪些难题呢?亦或是传统方案目前无法实现的。
1、可以分析生产线上的产品图像,并对其进行分类。这属于图像分类
范畴,通常是使用卷积神经网络
(CNN),亦或是Transformer
。
2、 可以用于对脑部检测是否存在肿瘤。这便是图像语义分割
,图像中的每个像素都被分类 (因为我们想要确定肿瘤的确切位置和形状),通常是使用卷积神经网络
(CNN),亦或是Transformer
。
3、对新闻文章进行自动分类。这属于自然语言处理
(NLP)范畴,更为具体地应该是文本分类
。虽然可以使用循环神经网络
(RNN)和卷积神经网络
来解决,但显然Transformer
处理的效果更好。
4、自动标记恶意评论。这也是文本分类
范畴,处理的方案也是选用NLP
工具。
5、自动总结长文档。这好比去阅读短篇小说,而后总结出讲了什么故事?或者是故事情节脉络。这是NLP
的一个分支,称为文本摘要
,同样也是使用NLP
工具进行处理。
6、搭建聊天机器人
或个人助理
。这就涉及到诸多NLP
组成部分,包括自然语言理解
(NLU)和问答模块
。
7、根据大量绩效指标来预测公司明年的盈利情况。这属于一个回归任务
(即预测值),可以使用任何回归模型
(regression model,)来解决,诸如线性回归
( linear regression)、多项式回归
(polynomial regression)模型。如果您考虑过去绩效指标的序列,您则会使用RNN
、CNN
和Transformer
。
8、应用程序对语音命令做出反应。这是语音识别
,需要处理音频样本,这些样本都是长而复杂的序列,通常使用RNN
、CNN
和Transformer
来处理。
9、检测信用卡欺诈。这属于异常检测
。可以使用隔离森林
(isolation forests)、高斯混合模型
(Gaussian mixture models)和自动编码器
(autoencoders)。
10、根据购买情况对客户进行细分,进而为每个细分市场做出不同的营销策略。这便是聚类
(clustering),可以使用 k-means
、DBSCAN
等来实现。
11、使用图表来表示复杂的高维度数据集。这是数据可视化
,通常涉及到降维技术
。
12、根据客户过去的购买情况推荐出感兴趣的产品。这属于推荐系统
。一种方法是将过去的购买行为(以及有关客户的其他信息)输入到人工神经网络
(ANN),并让它输出最有可能的下一次购买行为。 该神经网络通常会根据所有客户过去的购买顺序进行训练。
13、为游戏创建智能机器人。这通常可以使用强化学习
(RL)来解决,它是机器学习
的一个分支,训练代理(例如机器人)来选择随着时间的推移最大化其奖励的操作(例如,机器人可能会获得奖励) 每当玩家在给定环境(例如游戏)内失去一些生命值时。 在围棋比赛中击败世界冠军的著名 AlphaGo
程序就是使用 RL
构建的。
当然,这个示例列表可以一直列下去,但希望它能让您感受到机器学习
可以处理的任务令人难以置信的广度和复杂性,并且 您将用于每项任务的技术类型。
机器学习
系统种类繁多,但可以根据以下这些标准大致分出几大类,它远不止限于此。
监督
、无监督
、半监督
以及自我监督
等等。在线学习
和批量学习
。新数据点
和已知数据点
进行比较呢?还是通过检查数据训练中的模式并构建预测模型来工作呢?这样可分为基于实例的学习
和模型的学习
。当然咯,这些标准并不是固化不变的,您总是可以按您自己喜欢的任何方式随意的组合它们。就拿垃圾邮件过滤器
来说明吧!它可以使用深度神经网络
(deep neural network)模型进行动态学习,该模型人类提供的垃圾邮件
和样本数据进行训练,这使其成为一个在线
、基于模型
的监督
学习系统。
机器学习
系统可以根据训练期间受到的监督数量
和类型
进行划分。有很多类别,但目前只讲讲监督
、无监督
、自我监督
、半监督
以及强化
学习。
在监督学习
中,提供给算法的训练集
包括所需的解决方案,则称为标签
。
垃圾邮件过滤器接受了很多电子邮件及其分类(垃圾邮件)的训练,并且它必须学习该如何对新邮件进行分类。
也可以根据一组特征
(里程、车龄以及品牌等)来预测目标值。为了训练,您需要为其提供很多汽车示例,包括它们的功能和价格。这种任务称为回归
。
注意:某些
回归模型
也可用于分类,反之亦然。逻辑回归
( logistic regression)通常用于分类,因为它可以输出与给定类别的概率相对应的值(例如:垃圾邮件概率为20%)
回归问题
:给定一个输入特征,预测一个值(通常有多个输入特征,有时有多个输出值)。
在无监督
学习中,训练数据
是不需要标记
的。该系统试图在没有老师的情况下进行学习。
假设您有大量有关博客访问者的数据,您可能需要运行聚类算法
来尝试检测相似访问这组。而您永远也不会告诉算法
访问这属于哪个组,它无需您的任何协助即可找到这些链接。它可能会注意到,40% 的访问者是喜欢漫画书并通常在放学后阅读您的博客的青少年,而 20% 是喜欢科幻小说并在周末访问的成年人。如果您使用了层次聚类算法
(hierarchical clustering algorithm),它还可能将每个组细分为更小的组, 这可以帮助您针对每个组定位您的帖子。
(用于无监督学习的未标记训练集)
(聚类)
可视化算法
也是一个无监督学习
的好例子。您向它们提供大量复杂且未标记的数据,它们可以轻松输出绘制数据的 2D 或 3D 表示形式。 这些算法尝试保留尽可能多的结构(例如,尝试保持输入空间中的单独簇在可视化中不重叠),以便您可以了解数据的组织方式,并可能识别出意想不到的模式。
一个相关的任务是降维
,其目标是简化数据而不丢失太多信息。 实现这一目标的一种方法是将多个相关特征
合并为一个。 例如,一辆车的行驶里程可能与其车龄密切相关,因此降维算法
会将它们合并为一个代表汽车磨损情况的特征
, 这称为特征提取
。
在将
训练数据
提供给另一个机器学习算法(例如监督学习算法
)之前,尝试使用降维算法
来减少训练数据
的维数
通常是一个好主意。 它将运行得更快,数据将占用更少的磁盘和内存空间,并且在某些情况下它也可能表现得更好。
异常检测
也是一项无监督任务
。例如,检测异常的信用卡交易以防止欺诈、发现制造缺陷,或者在将数据输入另一个学习算法之前自动从数据集中删除异常值。 系统在训练期间显示的大部分是正常实例,因此它学会识别它们; 然后,当它看到一个新实例时,它可以判断它是否看起来像正常实例,或者是否可能存在异常。
一个非常相似的任务是新颖性检测
:它的目的是检测看起来与训练集
中的所有实例不同的新实例。 这需要有一个非常“干净”的训练集
, 您希望算法
检测的任何实例。 例如,如果您有数千张狗的图片,其中 1% 代表吉娃娃,那么新颖性检测算法
不应将吉娃娃的新图片视为新颖性
。另一方面,异常检测算法
可能会认为这些狗非常罕见,并且与其他狗如此不同,因此它们可能会将它们归类为异常
(无意冒犯吉娃娃)。
(异常检测)
关联规则学习
(association rule learning)是一个常见的无监督任务
,其目标是挖掘大量数据并发现属性之间有趣的关系。 例如,假设您拥有一家超市。 在销售日志上运行关联规则
可能会发现购买烧烤酱和薯片的人也倾向于购买牛排。 因此,您可能希望将这些物品彼此靠近放置。
由于标记数据
通常既耗时又昂贵,因此您通常会有大量未标记
的实例,而很少有标记的实例。 一些算法可以处理部分标记的数据。 这称为半监督学习
。
图中,具有两个类(三角形和正方形)的半监督学习
:未标记的示例(圆圈)有助于将新实例(十字)分类为三角形类而不是正方形类,即使它更接近标记的正方形
例如,一些照片托管服务(Google Photos),将照片上传到该服务后,它会自动识别出同一个人 A 出现在照片 1、5 和 11 中,而另一个人 B 出现在照片 2、5 和 7 中。这是算法的无监督
部分(聚类)。 现在系统需要的只是您告诉它这些人是谁。 只需为每个人添加一个标签
,它就能为每张照片中的每个人命名,这对于搜索照片很有用。
大多数半监督学习
算法是无监督
和监督
算法的组合。 例如,可以使用聚类
算法将相似的实例分组在一起,然后可以用其聚类
中最常见的标签
来标记每个未标记
的实例。 一旦整个数据集
被标记
,就可以使用任何监督学习
算法。
机器学习
的另一种方法实际上涉及从完全未标记
的数据集
生成完全标记
的数据集
。 同样,一旦整个数据集
被标记
,就可以使用任何监督学习
算法。 这种方法称为自我监督学习
。 例如,如果您有大量未标记
图像的数据集
,则可以随机屏蔽每个图像的一小部分,然后训练模型
来恢复原始图像。 在训练过程中,蒙版图像
用作模型的输入
,原始图像
用作标签
。
(左图作为 输入,右图是 输出)
生成的模型本身可能非常有用,例如,修复损坏
的图像或从图片中删除不需要的对象。 但通常情况下,使用自我监督学习
训练的模型并不是最终目标。 您通常需要针对稍微不同的任务(您真正关心的任务)调整和微调模型。
假设您真正想要的是有一个宠物分类模型
:给定任何宠物的图片,它会告诉您它属于什么物种。 如果您有大量未标记
的宠物照片数据集
,则可以首先使用自我监督学习
来训练图像修复
模型。 一旦表现良好,它应该能够区分不同的宠物种类:当它修复
一张脸部被遮住的猫的图像时,它必须知道不要添加狗的脸。
假设您的模型架构允许(大多数神经网络
架构都允许),那么就可以调整模型,使其预测
宠物物种而不是修复
图像。 最后一步 包括在标记``````数据集
上微调模型:模型已经知道猫、狗和其他宠物物种的样子,因此只需要这一步,以便模型可以学习它已经知道的物种与我们期望从中获得的标签
之间的映射。
将知识从一项任务迁移到另一项任务称为
迁移学习
,它是当下机器学习
中最重要的技术之一,特别是在使用深度神经网络
(即由多层神经元
组成的神经网络
)时。
有些人认为自监督学习
是无监督学习
的一部分,因为它处理完全未标记
的数据集
。 但自我监督学习
在训练过程中使用(生成的)标签
,因此在这方面它更接近监督学习
。 无监督学习
通常用于处理聚类
、降维
或异常检测
等任务,而自我监督学习
则专注于与监督学习
相同的任务:主要是分类
和回归
。 简而言之,最好将自我监督学习
视为一个单独的类别。
强化学习
是一种非常不同的机器学习
。 学习系统
在本文中称为代理
,可以观察环境、选择和执行操作,并获得回报(或以负奖励形式进行惩罚)。 然后,它必须自行学习
什么是最好的策略
(称为策略
),以便随着时间的推移获得最大的回报。 策略定义了代理在给定情况下应该选择什么操作。
例如,许多机器人
采用强化学习
算法来学习如何行走。 DeepMind
的 AlphaGo
程序也是强化学习
的一个很好的例子:它在 2017 年 5 月的围棋比赛中击败了当时世界排名第一的柯洁,登上了新闻头条。 它通过分析数百万场比赛,然后与自己进行许多比赛来了解其获胜策略。 请注意,在与冠军的比赛中学习被关闭;AlphaGo
只是应用了它学到的策略。