无监督学习与监督学习的区别

      1、什么是无监督学习?

无监督学习是机器学习技术中的一类,用于发现数据 中的模式。利用 学习数据的分布或数据与数 据之间的关系被称作无监督学习。

2、无监督学习代表算法:

1、k-means算法(聚类算法)

3、什么是监督学习?

        监督学习描述的任务是:当给定输入x,如何通过在有标注输入和输出的数据上训练模型而能够预测输出y

        1、通过带有标签的训练集:训练模型

        2、通过训练模型,输入新事件自变量x,预测输出y

      4、监督学习代表算法:

        1、knn(k最近邻算法)属于分类方法。

 2、贝叶斯算法、朴素贝叶斯算法,属于分类方法。

 3、逻辑回归,属于回归方法。

 4、线性回归,属于回归方法。

        

      5、无监督学习vs监督学习。

1.监督学习方法必须要有训练集与测试样本。在训练集中找规律,而对 测试样本使用这种规律。而非监督学习没有训练集,只有一组数据,在该 组数据集内寻找规律。

2. 监督学习的方法就是识别事物,识别的结果表现在给待识别数据加上 了标签。因此训练样本集必须由带标签的样本组成。而无监督学习方法只 有要分析的数据集的本身,预先没有什么标签。如果发现数据集呈现某种 聚集性,则可按自然的聚集性分类,但不予以某种预先分类标签对上号为 目的。

6、何时采用哪种方法  

简单的方法就是从定义入手,有训练样本则考虑采用监督学习方法;无 训练样本,则一定不能用监督学习方法。但是,现实问题中,即使没有训 练样本,我们也能够凭借自己的双眼,从待分类的数据中,人工标注一些 样本,并把它们作为训练样本,这样的话,可以把条件改善,用监督学习 方法来做。对于不同的场景,正负样本的分布如果会存在偏移(可能大的 偏移,可能比较小),这样的话,监督学习的效果可能就不如用非监督学 习了。

 

 

 

 

 

你可能感兴趣的:(数据分析,无监督学习与监督学习的区别)