监督学习、无监督学习、半监督学习和强化学习

Author: LiChong0309
Lable: Reinforcement learning、Artificial intelligence、Deep learning、Machine learning

  • 1.Machine learning
  • 2.Classification of Machine learning
    • 2.1. Supervised learning
    • 2.2. Unsupervised learning
    • 2.3. Semi-Supervised learning
    • 2.4 Reinforcement Learning
  • 3. Reference

1.Machine learning

机器学习—>模拟人的学习方式—>获取新的知识和技能—>重组已有的知识结构—>改善自身的性能。
Machine learning是Artificial intelligence的核心,是让计算机具有智能的根本途径。

比如,中学阶段通过大量的习题训练,学习解题方法,为的是能够在高考的时候取得好的成绩,但是高考的题目是之前没有见过的,但是这并不说明高考的题目是不能做出来的,我们可以通过对之前做过的习题的分析,找到解题的方法。
机器学习的原理和上面的例子差不多,利用一些已知的数据训练机器(做习题),然后机器分析数据,找到内在联系(学习解题方法),从而对未知的数据进行做出判断和决策(做高考题)。

根据训练方法的不同,可以将机器学习分为四类:
①:Supervised learning 监督学习
②:Unsupervised learning 无监督学习
③:Semi-Supervised learning 半监督学习

2.Classification of Machine learning

2.1. Supervised learning

Supervised Learning的数据是有特征(feature)和标签(label)的。机器可以寻找到标签和特征之间的联系,当面对只有特征而没有标签的数据时,可以判断出标签。

用上面的高考题的例子:所谓的Supervised Learning,就是高考前的做的所有的题目都是有标准答案的,在学习和做题的过程中,可以对照答案,分析问题找出方法。在高考没有答案的时候,也能够正确的解决。这和我们大多数人在中学时的学习方法是一样的。

2.2. Unsupervised learning

与Supervised Learning(监督学习)相对的是Unsupervised Learning(无监督学习)。Supervised的数据只有特征(feature),没有标签(label)。
再举高中做练习题的例子,就是所做的练习题没有标准答案,换句话说,你也不知道自己做的是否正确,没有参照。但是就算不知道答案,我们还是可以大致的将语文,数学,英语这些题目分开,因为这些问题内在还是具有一定的联系。 这种问题在机器学习领域中就被称作聚类(Clustering)。在只有特征没有标签的训练数据集中,通过数据之间的内在联系和相似性将他们分成若干类。

2.3. Semi-Supervised learning

处在监督学习和无监督学习之间的是半监督学习。Semi-Supervised Learning中使用的数据,有一部分是标记过的,而大部分是没有标记的。因此和监督学习相比,半监督学习的成本较低,但是又能达到较高的准确度。

2.4 Reinforcement Learning

强化学习也是使用未标记的数据,但是可以通过某种方法知道你是离正确答案越来越近还是越来越远(即奖惩函数)。可以把奖惩函数想象成正确答案的一个延迟的、稀疏的形式。在监督学习中,能直接得到每个输入的对应的输出。强化学习中,训练一段时间后,你才能得到一个延迟的反馈,并且只有一点提示说明你是离答案越来越远还是越来越近。

3. Reference

机器如何学习?5分钟弄懂监督学习、无监督学习、半监督学习与强化学习:
https://www.sohu.com/a/150444351_697750
机器学习入门,监督学习和无监督学习:
https://blog.csdn.net/bahuia/article/details/68926915

你可能感兴趣的:(Machine,Learning,Deep,learning,Reinforcement,Learning,Artificial,Intelligence)