1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)

文章目录

  • 1.5机器学习算法分类
    • 1 监督学习
      • 1.1 回归问题
      • 1.2分类问题
    • 2 无监督学习
    • 3 半监督学习
    • 4 强化学习
    • 拓展阅读
    • 独立同分布lD(independent and identically distributed)
    • 5 小结

1.5机器学习算法分类

学习目标

  • 了解机器学习常用算法的分类

根据数据集组成不同,可以把机器学习算法分为:

  • 监督学习其
  • 无监督学习
  • 半监督学习
  • 强化学习

1 监督学习

  • 定义:
    • 输入数据是由输入特征值和目标值所组成。
      - 函数的输出可以是一个连续的值(称为回归)
      - 或是输出是有限个离散值(称作分类)

1.1 回归问题

例如:预测房价,根据样本集拟合出一条连续曲线。
1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)_第1张图片

1.2分类问题

例如:根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的。
1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)_第2张图片

2 无监督学习

  • 定义:
    • 输入数据是由输入特征值组成,没有目标值
      - 输数据没有被标记,也没有确定的结果。样本数据类别未知;
      - 需要根据样本间的相似性对样本集进行类别划分。

举例:
1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)_第3张图片
有监督,无监督算法对比:
1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)_第4张图片

3 半监督学习

  • 定义:
    • 训练集同时包含有标记样本数据和未标记样本数据。

举例:

  • 监督学习训练方式:
    1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)_第5张图片
    半监督学习训练方式
    1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)_第6张图片

4 强化学习

  • 定义:
    • 实质是make decisions问题,即自动进行决策,并且可以做连续决策。

举例:

小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。

小孩就是agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另一个状态(即他走的每一步),当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。

主要包含五个元素:agent,action,reward,environment,observation;
1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)_第7张图片
强化学习的目标就是获得最多的累计奖励。
监督学习和强化学习的对比:

监督学习 强化学习
反馈映射 输出的是之间的关系,可以告诉算法什么样的输入对应着什么样的输出。 输出的是给机器的反馈 reward function,即用来判断这个行为是好是坏。
反馈时间 做了比较坏的选择会立刻反馈给算法。 结果反馈有延时,有时候可能需要走了很多步以后知通以前的景一步的选择是好还是环。
输入特征 输入是独立同分布的。 面对的输入总是在变化,每当算法做出一个行为,它影响下一次决策的输入。

拓展阅读

独立同分布lD(independent and identically distributed)

1.独立同分布(i.i.d.)
  在概率统计理论中,如果变量序列或者其他随机变量有相同的概率分布,并且互相独立,那么这些随机变量是独立同分布。
  
  在西瓜书中解释是:输入空间中的所有样本服从一个隐含未知的分布,训练数据所有样本都是独立地从这个分布上采样而得。
  
2.简单解释-独立、同分布、独立同分布
  (1)独立:每次抽样之间没有关系,不会相互影响
  
  举例:给一个骰子,每次抛骰子抛到几就是几,这是独立;如果我要抛骰子两次之和大于8,那么第一次和第二次抛就不独立,因为第二次抛的结果和第一次相关。
  
  (2)同分布:每次抽样,样本服从同一个分布
  
  举例:给一个骰子,每次抛骰子得到任意点数的概率都是六分之一,这个就是同分布
  
  (3)独立同分布:i.i.d.,每次抽样之间独立而且同分布
  
3.机器学习领域的重要假设
  IlD独立同分布即假设训练数据和测试数据是满足相同分布的,它是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。
  
4.目前发展
  机器学习并不总要求独立同分布,在不少问题中要求样本数据采样自同一个分布是因为希望用训练数据集得到的模型可以合理的用于测试数据集,使用独立同分布假设能够解释得通。
目前一些机器学习内容已经不再团于独立同分布假设下,一些问题会假设样本没有同分布。


拓展阅读:Alphago进化史漫画告诉你Zero为什么这么牛:
http://sports.sina.com.cn/chess/weiqi/2017-10-21/doc-ifymyyxw4023875.shtml

5 小结

In Out 目的 案例
监督学习(supervised learning) 有标签 有反馈 预测结果 猫狗分类 房价预测
无监督学习(unsupervised learning) 无标签 无反馈 发现潜在结构 “物以类聚,人以群分”
半监督学习(Semi-Supervised Learning) 部分有标签,部分无标签 有反馈 降低数据标记的难度
强化学习(reinforcement learning) 决策流程及激励系统 一系列行动 长期利益最大化 学下棋
对您有所帮助的话,点个赞关注下吧!

你可能感兴趣的:(人工智能,机器学习,人工智能,机器学习)