吴恩达机器学习笔记1一一引言

吴恩达机器学习笔记1一一引言

文章目录

  • 吴恩达机器学习笔记1一一引言
  • 1.机器学习是什么?
  • 2.监督学习
  • 3.无监督学习


1.机器学习是什么?

机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

机器学习算法根据输入的数据是否具有标签可以分为两类,即监督学习算法和无监督学习算法。

2.监督学习

监督学习算法要求事先同时给出输入数据和对应的输出,然后网络根据预测值与真实值之间的误差或损失(loss)进行学习训练,使网络能够做出正确的反映。监督学习算法主要可以分为回归算法(Regression algorithms)和分类算法(Classification algorithms)。

回归算法是一种用于构建自变量(特征)和因变量(目标值)之间关系的算法,它的目标是得到一组特征前的系数,使最后得到的模型尽可能的拟合。

分类算法是从训练数据中挖掘特征的各种信息,然后对新的数据进行分类预测,从而构建模型。

回归算法和分类算法的区别主要在于输出变量的类型,回归算法是定量输出,它的输出量是连续量;分类算法是定性输出,它的输出是离散量。

3.无监督学习

无监督学习算法只需要给出一组输入数据,然后算法会通过模式识别、数据挖掘等方式对给定的输入数据进行归纳总结,从而使网络可以逐渐演化成对输入的某种数据做出特定的反映。

无监督学习里典型例子是聚类。聚类的目的在于把相似的东西聚在一起,而我们并不关心这一类是什么。因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。

聚类算法一般有五种方法,最主要的是划分方法和层次方法两种。划分聚类算法通过优化评价函数把数据集分割为K个部分,它需要K作为 输人参数。典型的分割聚类算法有K-means算法, K-medoids算法、CLARANS算法。

你可能感兴趣的:(吴恩达机器学习笔记1一一引言)