【机器学习】有监督学习,无监督学习,半监督学习和强化学习

有监督学习,无监督学习,半监督学习和强化学习

  • 有监督学习和无监督学习的区别
  • 1. 有监督学习
    • 一些常见的监督学习算法包括:
    • SVM、LR、决策树的对比?
  • 2. 无监督学习
    • 一些常见的无监督学习算法包括:
  • 3. 半监督学习
  • 4. 强化学习
  • 参考

有监督学习和无监督学习的区别

(1)有监督和无监督算法的区别是以训练数据有没有标签区分的。
(2)有监督和无监督算法也可以使用训练集有无输出来区分:训练集有输入有输出是有监督,训练集只有输入没有输出是无监督。

1. 有监督学习

比如识别猫和狗的照片,这就是一个有监督的学习过程,必须告诉机器每一张照片所属的类别(猫或者狗),也就是对具有标签信息的训练样本进行学习,来尽可能对训练样本集意外的数据进行分类。

监督式机器学习适用于你知道输入数据结果的情况。

假设你要创建一个图像分类机器学习算法,该算法可以检测猫,狗和马的图像。
要训练AI模型,你必须收集猫,狗和马照片的大型数据集。但是在将它们输入机器学习算法之前,你必须使用它们各自类的名称对其进行注释。注释可能包括使用文件命名约定将每个类的图像放在单独的文件夹中,或将元数据附加到图像文件中,这是一项费力的手动任务。
标记数据后,机器学习算法(例如卷积神经网络或支持向量机)将处理示例,并开发可将每个图像映射到其正确类别的数学模型。如果对AI模型进行足够的带有标签的示例训练,它将能够准确地检测出包含猫,狗,马的新图像类别。

监督机器学习解决了两种类型的问题:分类和回归
上面说明的示例是一个分类问题,其中机器学习模型必须将输入放入特定的存储桶或类别中。分类问题的另一个示例是语音识别。

回归机器学习模型不限于特定类别。它们可以具有连续的,无限的价值,例如客户将为产品支付多少费用或明天下雨的可能性。

一些常见的监督学习算法包括:

  • 线性回归
  • 逻辑回归
  • 正则化回归
  • 朴素贝叶斯
  • 支持向量机
  • 决策树和随机森林
  • 人工神经网络
  • EDA(Exploratory Data Analysis)
  • K-Nearest Neighbors(KNN)
  • 交叉验证(CV)
  • ROC曲线
  • 超参数调优

SVM、LR、决策树的对比?

SVM和LR都是用于线性分类的算法,但SVM强于LR的地方在于SVM可以引入核函数将非线性可分的学习数据映射到高维变得线性可分,一般小数据中SVM比LR更优一些。但LR可以预测概率,而SVM不可以,它依赖于数据测度,需要先做归一化,LR一般不需要,所以大量的数据,LR使用更广泛。

决策树也是用于分类任务,不过是基于规则划分的算法,根据特征的信息增益或者信息增益比指定划分规则,建立树状结构,通过叶节点给出分类的类别。‍‍‍‍‍

2. 无监督学习

无监督就是没有标签信息的一个学习过程,来发现训练样本集中的结构性知识。
K-means是众所周知的无监督聚类机器学习算法。
主成分分析(PCA)是一种流行的降维机器学习算法。
一些安全分析师还使用无监督的机器学习进行异常检测,以识别组织网络中的恶意活动。

无监督学习大体可分为生成式学习对比式学习
生成式学习以自编码器(例如GAN,VAE等等)这类方法为代表,由数据生成数据,使之在整体或者高级语义上与训练数据相近。
对比式学习着重于学习同类样本之间的共同特征,区分非同类样本之间的不同之处。与生成式学习比较,对比式学习不需要关注样本上繁琐的细节,只需要在抽象语义级别的特征空间上学会对数据的区分即可,因此模型以及其优化变得更加简单,且泛化更强。
对比学习的目标是学习一个编码器,此编码器对同类数据进行相似的编码,并使不同类的数据的编码结果尽可能的不同。

一些常见的无监督学习算法包括:

  • Kmeans聚类
  • 聚类分析
  • 标准化
  • 层次分析法
  • T-分布随机近邻嵌入(T - SNE)
  • 主成分分析(PCA)
  • EM算法

3. 半监督学习

半监督学习则是介于有监督学习和无监督学习两者之间的学习技术,它同时利用有标记样本与无标记样本进行学习。
半监督学习常用在语音识别领域、自然语言处理领域以及生物学领域对蛋白质序列的分类问题(蛋白质结构预测)。

4. 强化学习

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。强化学习最早可以追溯到巴甫洛夫的条件反射实验,它从动物行为研究和优化控制两个领域独立发展,最终经Bellman之手将其抽象为马尔可夫决策过程 (Markov Decision Process,MDP)。
强化学习的应用最有名的是Alpha Go,它还可以用到资源调度、无人驾驶、、服务推荐等领域。

参考

机器学习全面教程 & 有监督学习篇
机器学习全面教程-无监督学习篇
机器学习算法之有监督学习和无监督学习的区别
【大咖来解惑】无监督和有监督算法,区别在哪里?
半监督学习综述
强化学习入门总结
有监督学习,无监督学习,半监督学习和强化学习

你可能感兴趣的:(机器学习,机器学习,人工智能,算法,支持向量机,深度学习)