监督学习和无监督学习

机器学习

    • 1. 机器学习是什么
    • 2. 监督学习
      • 举例说明:
      • 回归问题
      • 分类问题
    • 3. 无监督学习
      • 举例说明:
      • 聚类问题
      • 非聚类问题

提示:该文是基于吴恩达老师机器学习视频总结

1. 机器学习是什么

计算机程序从经验E中学习解决某一任务T进行某一度量性能P,通过P测定在T上的表现因经验E而提高。

2. 监督学习

监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。

举例说明:

给你分别介绍苹果和橘子有什么特征,然后拿出一堆苹果和橘子,并告诉你哪些是苹果哪些是橘子,之后再给你一个苹果或橘子时,你就能分辨出来。

监督学习可以划分为回归问题和分类问题。

回归问题

监督学习和无监督学习_第1张图片

上图是机器学习中常见的房价预测问题,横轴表示房子的面积,单位是平方英尺,纵轴表示房价。那基于这组数据,假如你有一个朋友,他有一套 750 平方英尺房子,现在他希望把房子卖掉,他想知道这房子能卖多少钱。我们应用学习算法,可以在这组数据中画一条直线,或者换句话说,拟合一条直线,根据这条线我们可以推测出,这套房子可能卖$150,000,当然这不是唯一的算法。可能还有更好的,比如我们不用直线拟合这些数据,用二次函数去拟合可能效果会更好。根据二次函数的曲线,我们可以从这个点推测出,这套房子能卖接近$200,000,相比于直线拟合,二次函数曲线预测的更为准确些,这就是监督学习的例子。

分类问题

监督学习和无监督学习_第2张图片

上图是机器学习中恶性肿瘤问题,用于想通过查看病历来推测乳腺癌是否为良性。让我们来看一组数据:这个数据集中,横轴表示肿瘤的大小,纵轴上,我标出 1 和 0 表示是或者不是恶性肿瘤。我们之前见过的肿瘤,如果是恶性则记为 1,不是恶性,或者说良性记为 0。现在我们有个朋友很不幸检查出乳腺肿瘤,假设说她的肿瘤大概这么大,那么机器学习的问题就在于,你能否估算出肿瘤是恶性的或是良性的概率

3. 无监督学习

现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。

举例说明:

给你一堆苹果和橘子,不告诉你哪些是苹果哪些是橘子,通过机器自己类,当再拿出一个苹果或橘子时,通过之前所积累的经验,将其归类。在此过程中,机器也许并不知道什么是苹果什么是橘子,只是通过分析其特征,将其划分当其中的一类。

无监督学习也划分为聚类分摊和非聚类问题。

聚类问题

监督学习和无监督学习_第3张图片

在无监督学习中我们已知数据集,却不知如何处理,也未告知每个数据点是什么。别的都不知道,只知道一个数据集。你能从数据中找到某种结构吗?针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。无监督学习算法可能会把这些数据分成两个不同的簇,所以叫做聚类算法。
事实证明,它能被用在很多地方。聚类应用的一个例子就是在谷歌新中。谷歌新闻每天都在,收集非常多,非常多的网络的新闻内容。它再将这些新闻分组,组成有关联的新闻。所以谷歌新闻做的就是搜索非常多的新闻事件,自动地把它们聚类到一起。所以,这些新闻事件全是同一主题的,所以显示到一起。比如对于911事件,可能会有多家报社对其采访直播,根据这一主题,将这些报道归结到一个专栏中。

非聚类问题

监督学习和无监督学习_第4张图片

鸡尾酒宴问题:
你可以想象下,有个宴会房间里满是人,全部坐着,都在聊天,这么多人同时在聊天,声音彼此重叠,因为每个人都在说话,同一时间都在说话,你几乎听不到你面前那人的声音。所以,可能在一个这样的鸡尾酒宴中的两个人,他俩同时都在说话,我们放两个麦克风在房间中,因为这些麦克风在两个地方,离说话人的距离不同,因此每个麦克风记录下不同的声音,虽然是同样的两个说话人。听起来像是两份录音被叠加到一起,或是被归结到一起,产生了我们现在的这些录音。另外,这个算法还会区分出两个音频资源,这两个可以合成或合并成之前的录音。

你可能感兴趣的:(机器学习,机器学习,深度学习)