监督学习和无监督学习的区别(机器学习)

机器学习主要分为两类

  1. 监督学习
  2. 无监督学习

两者的区别主要是是否需要人工参与数据结果的标注


监督学习:教计算机如何去完成预测任务(有反馈),预先给一定数据量的输入和对应的结果即训练集,建模拟合,最后让计算机预测未知数据的结果。
监督学习一般有两种

  1. 回归问题
    就是给出一系列数据然后预测任意想要的数据,比如给出了一系列的房屋面积-价格数据,根据这些数据来预测任意面积的房屋价格。给出照片-年龄数据集,预测给定照片的年龄
    监督学习和无监督学习的区别(机器学习)_第1张图片
  2. 分类问题
    根据数据预测被预测对象属于哪个分类,比如癌症肿瘤这个例子,针对诊断结果,分别分类为良性或恶性。还例如垃圾邮件分类问题,也同样属于监督学习中的分类问题
    监督学习和无监督学习的区别(机器学习)_第2张图片
    支持向量机这个算法,旨在解决当特征量很大的时候(特征即如癌症例子中的肿块大小,颜色,气味等各种特征),计算机内存一定会不够用的情况。支持向量机能让计算机处理无限多个特征

无监督学习:相对于监督学习,训练集不会有人为标注的结果(无反馈),我们不会给出结果或无法得知训练集的结果是什么样,而是单纯由计算机通过无监督学习算法自行分析,从而“得出结果”。计算机可能会把特定的数据集归为几个不同的簇,故叫做聚类算法
无监督学习一般也有两种:

  1. 聚类
    新闻聚合:例如谷歌新闻这样的网站中,每天后台都会收集成千上万的新闻,然后将这些新闻分组成一个个的新闻专题,这样一个又一个聚类,就是应用了无监督学习的结果
  2. 非聚类
    鸡尾酒问题:在鸡尾酒会上,大家说话声音彼此重叠,几乎很难分辨出面前的人说了什么。我们很难对于这个问题进行数据标注,而这里的通过机器学习的无监督学习算法,就可以将说话者的声音同背景音乐分离出来
    监督学习和无监督学习的区别(机器学习)_第3张图片

你可能感兴趣的:(机器学习,吴恩达,机器学习,笔记)