吴恩达机器学习1.3 监督学习----详细笔记及心得

      在给出正式的监督学习的定义之前,吴先讲解了一个例子,房价预测,具体如图所示:其中横轴表示的是不同平方英尺数的房子,纵轴是不同房子的价格
吴恩达机器学习1.3 监督学习----详细笔记及心得_第1张图片
假如朋友有一套750平方英尺的房子,他想卖掉,能卖多少钱。学习算法可以帮我们模拟一条直线,然后估计750时,房价大约是150k,但是如果我们模拟的是二次曲线,那么房价可以卖到200k,那应该选择直线模拟还是二次函数拟合数据,哪种方式都不会让房子卖得好,这就是监督学习的例子。

      监督学习是指我们给这个算法一个数据集,其中包含了正确答案,也就是说我们给它一个房价数据集,在这个中剧中的每一个样本,我们都给出正确的价格,即这个房子实际卖价格。算法的目的就是给出更多正确的答案。
更专业的术语:也被称为回归问题,是指我们想要预测连续的数值输出,(房价),技术上,房价是个离散值,通常认为是个实数,标量,连续值。
      另外一个监督学习的例子:
吴恩达机器学习1.3 监督学习----详细笔记及心得_第2张图片
预测乳腺癌是恶性的还是良性的,横坐标是肿瘤的尺寸,纵坐标是0或者1,yes or no,
吴恩达机器学习1.3 监督学习----详细笔记及心得_第3张图片
      如果有5个良性的,有5个恶性的样本,那么问肿瘤大小为紫色箭头所示大小时,是良性还是恶性,那么这就转换成了分类问题,有时分类可以分为三类四类。
      然后用一条线表示恶性和良性,如下图:
吴恩达机器学习1.3 监督学习----详细笔记及心得_第4张图片

      即将上图的数据集对应画下来,这个例子只是用了一个特征属性进行了分类,其他的机器学习中,会有多个特征,多个属性,有个例子,假如我们不仅仅肿瘤的大小,我们还知道病人的年龄,这种情况下,数据集应该如下:
吴恩达机器学习1.3 监督学习----详细笔记及心得_第5张图片

      假设年龄和肿瘤大小分别处在如图所示的位置,那么我们会在数据上画出一条直线设法将良性和恶性分开。这个例子就是两个特征,肿块大小和年纪,其他的学习算法中会有很多特征,那么怎么处理无穷多的特征呢,会溢出,那么可以用支持向量机,允许计算机处理无穷多的特征。
      最后有一个问题,如下图,假如你开了一家公司,你想要开发学习算法来处理两个问题,
吴恩达机器学习1.3 监督学习----详细笔记及心得_第6张图片
      那么应该选择C选项,第一个问题数值比较大,是实数,可以看出连续性问题,而第二个问题样本比较少,是分类问题。

你可能感兴趣的:(人工智能--深度学习,吴恩达--机器学习)