【机器学习】监督学习与无监督学习

文章目录

  • 什么是机器学习
  • 监督学习
    • 回归问题
    • 分类问题
  • 无监督学习
  • 总结

什么是机器学习

机器学习的定义很多,我认为用吴恩达老师视频中的这段话来概括就很合适

Tom Mitchell (1998) Well-posed LearningProblem:
A computer program is said to learn from experience E
with respect to some task T and some performance measure P,
if its performance on T, as measured by P, improves with experience E.

计算机程序从经验"E" 中学习,解决某一任务"P" ,进行某一性能度量"P" ,并能通过经验"E" 来提高"P" 在任务"T" 上的表现。

简单来说机器学习的目的就是从经验E中不断提高完成任务T的效率P


监督学习

回归问题

假设你有一个房子需要出售,于是你根据市场上的房子售价绘制了一张图,试图看出你的房子应当在什么价位
以Size作为横轴,Price作为纵轴,你得到了下面这张图片
【机器学习】监督学习与无监督学习_第1张图片
你的房子有750feet方,根据你对于图像的估计,你认为你的房子的价格处于这个位置
【机器学习】监督学习与无监督学习_第2张图片
你很高兴,因为你的房子能够卖出15万的价格,但是此时你的机器人管家告诉你实际上你的房子的价格应该更高,它画出了一条最佳的拟合曲线
【机器学习】监督学习与无监督学习_第3张图片
看起来你的房子能够卖出20万,对比两张图片,显然那些离散的数据点更接近蓝色的曲线而非粉色的,因此我们认为蓝色的曲线实际上是更加准确的那个。

我们将这类问题称之为回归问题:
在回归问题中,我们的数据往往是不连续的,离散的,而我们想要的结果是连续值
比如这个问题中,我想知道房价的价格,而给出的只有离散的数据点
回归问题就是根据给出的离散数值来预测我们需要得到的连续值的属性


分类问题

第二个例子中,我们试图判断乳腺癌肿块的恶性概率
以肿块大小为横轴,是否恶性为纵轴,得到了下面的图像
【机器学习】监督学习与无监督学习_第4张图片
对于这个图,我们有一个更好的简化方法
【机器学习】监督学习与无监督学习_第5张图片
其中O为良性,X为恶性,这样我们用一维的数轴得到了一样的信息

我们将这类问题称为:归类问题
因为我们最终得到的结果依旧是一堆离散的数值 (Y/N),而非连续值


还是上面这个问题,我们还是用X和O来表示离散值
现实生活中的病例不仅仅受肿块大小这一个特征值的影响,往往还与年龄等一系列属性有关
我们加入年龄作为纵轴,这样就得到了两个特征的图片,其中粉色点是我们要判断的点
【机器学习】监督学习与无监督学习_第6张图片
如何判断是否为恶性呢?我们画出一条线
【机器学习】监督学习与无监督学习_第7张图片
可以看到这条线将所有数据分为了两大部分,其中位于下方的数据大多是No,而上方的数据大多是Yes,而粉色点位于线的下方,因此我们认为粉色点是No,即为良性。

通过上面的两个问题,我们可以简单分类出他们的特征:
在这两个问题中,我们都通过拟合出曲线来解决问题,
在回归问题中,我们拟合的曲线使得大部分离散点与其相近,最终需要得出的输出值则是这条曲线上的对应位置的连续值;
而在分类问题中,拟合的曲线将不同离散值的结果进行了划分,我们根据所处的划分区域来判断最终得出的离散值结果应为哪一类

当然,我们也可以加入更多的特征,但是每加入一个特征都会增加一个维度。
虽然我们画不出四维,五维的图片,但是更高维度的计算都是可以依靠计算机来处理的。


无监督学习

如果我们不给出任何任务,只是给出某个数据集,如下图所示,让程序自己来找出他们的特征
【机器学习】监督学习与无监督学习_第8张图片
程序发现在下图中有两个数据的簇,我们把这样的算法叫做聚类算法
【机器学习】监督学习与无监督学习_第9张图片
另一个例子是关于基因的表达程度
【机器学习】监督学习与无监督学习_第10张图片
聚类算法将不同颜色的基因归为一类
在无监督学习中,我们只是告诉程序:这里有一堆数据,你能够找出它们的特征吗?
相对于监督学习,我们并没有给出特定的答案:去告诉程序你应该怎么做是对的。


总结

综上所述,我们简单总结一下二者的特点:

监督学习:我们希望通过程序得到某个正确的结果,程序会知道怎样做是对的,怎样做是不对的,以此来进行修正。

无监督学习:我们只是给出一个数据集,并不会告诉程序应当怎样做,程序则需要自行判断数据的特征。


下一章——线性回归与代价函数

你可能感兴趣的:(吴恩达机器学习课程,学习,人工智能)