机器学习概要 - supervised learning

转摘自:Andrew Ng's Machine Learning课程学习笔记1

侵删。

 机器学习的算法:

 要达到”让机器自己学习“这一目标的话,还是要通过算法来实现的。目前机器学习的主要算法有:

  -监督学习

  -非监督学习

  -other:强化学习、推荐系统……

  监督学习:给出”正确答案“。

  ”监督学习“这个名字我刚开始还是纠结了好一会的,想不清楚为什么要称之为”监督学习“。

  现在自己对于监督学习的理解有两种,第一种的理解是:

   因为监督学习算法的实现过程是通过把现有的数据分成若干部分,把其中的一部分作为训练集,另一部分则作为校验集。在监督学习过程中,通过对训练集中输入输出数据的学习,找到一个合适的模型,也就是函数,让这个函数的图像能尽可能的与输入输出数据在坐标内的分布情况吻合。得到这样一个函数后,再将校验集中的输入数据代入到这个函数中去,观察它的输出值是否与现有数据的输出值相近。这样的一个学习过程中因为有了校验,所以感觉像是在监督下完成的。所以如果校验时得到的不是比较准确的输出,这个学习就算是失败的吧。这么算来,监督学习是”不得不“给出”正确答案“了。

   第二种理解则是结合后面对非监督学习的理解来的:监督学习是在对已有的数据都已经贴好标签的情况下进行学习的,数据本身都已经分类明确了,所以对于学习的结果所要达到的也是”获得正确结果“。【注:这段为个人学习过程中的理解,如果有疏漏或错误的地方,还望批评指正】

   在Andrew Ng的课程中,对监督学习也提到了这样的解释:不但研究数据,还要给数据”贴上标签“。这个”贴标签“的行为,就相当于是对数据进行准确的划分了。与此相对的,非监督学习则是研究数据,但不给数据”贴标签“。
  非监督学习:目前我对非监督学习的理解还不是很明白,所以暂且只能根据Andrew Ng关于非监督学习的解释来理解:在只给出数据集,而不告知所有数据的”标签“,即在不知这些数据将作何处理的情况下,对数据进行学习,以获得合适的模型。

   此次笔记暂且整理到这,在书写过程中我产生了很多平时学习过程中没有的思维成果,为此真的很开心,这是我的第一篇学习笔记,希望能借此作为一个良好的开端,将这个习惯保持下去。笔记的内容可能存在较多不足,如有任何修改意见,望批评指正,谢谢。

你可能感兴趣的:(机器学习概要 - supervised learning)