吴恩达机器学习笔记 | Chapter 1 绪论:初识机器学习

Machine Learning | Chapter 1 绪论:初识机器学习

Lesson 1 什么是机器学习

提供了机器学习的两个定义。亚瑟·塞缪尔将其描述为:“研究领域使计算机无需明确编程即可学习。”这是一个较旧的非正式定义。

Tom Mitchell提供了一个更现代的定义:“说计算机程序从经验E中学习某些任务T和绩效测量P,如果它在T中的任务中的表现,由P测量,随经验E而提高。“

示例:玩跳棋。

E =玩许多跳棋游戏的经验

T =玩跳棋的任务

P =程序赢得下一场比赛的概率

通常,任何机器学习问题都可以分配到两个广泛的分类之一:监督学习和无监督学习。

Lesson 2 监督学习(Supervised Learning)

在有监督的学习中,我们得到一个数据集,并且已经知道我们的正确输出应该是什么样的,并且认为输入和输出之间存在关系。监督学习问题分为“回归”问题(Regression Problems)和“分类”问题(Classification Problems)。

在回归问题中,我们试图在连续输出中预测结果,这意味着我们正在尝试将输入变量映射到某个连续函数。

在分类问题中,我们试图在离散输出中预测结果。换句话说,我们正在尝试将输入变量映射到离散类别。

Example 1 :
鉴于有关房地产市场房屋面积的数据,请尝试预测房价。作为大小函数的价格是连续输出,因此这是一个回归问题。
我们可以将这个例子变成一个分类问题,而不是让我们的输出关于房子“卖得多于还是低于要价”。在这里, 我们将基于价格的房屋分为两个不同的类别。

Example 2 :
回归 - 给定一个人的照片,我们必须根据给定的图片预测他们的年龄
分类 - 鉴于患有肿瘤的患者,我们必须预测肿瘤是恶性的还是良性的。

Lesson 3 非监督学习(Unsupervised Learning)

无监督学习使我们能够在很少或根本不知道我们的结果应该是什么样的情况下处理问题。我们可以从数据中导出结构,我们不一定知道变量的影响。

我们可以通过基于数据中变量之间的关系对数据进行聚类来推导出这种结构。在无监督学习的情况下,没有基于预测结果的反馈。例:

聚类 (Clustering):收集1,000,000个不同基因的集合,并找到一种方法将这些基因自动分组成不同的相似或相关的不同变量组,如寿命,位置,角色等。

非聚类 (Non-clustering):“鸡尾酒会算法”允许您在混乱的环境中查找结构。(即在鸡尾酒会上从声音网格中识别个别声音和音乐)。

你可能感兴趣的:(Machine,Learning,Wu,Enda)