机器学习:聚类,Sklearn

   

一、实验要求

在计算机上验证和测试k-means聚类和高斯混合模型聚类实验,sklearn的相关聚类算法。

  • 实验目的

1、掌握k-means聚类算法的原理

2、掌握高斯混合模型聚类算法的原理;

3、掌握sklearn如何实现聚类;

三、实验内容

实验步骤

  1. 请根据cluster文件代码,根据K均值聚类算法的原理,有两种初始化方法,一种是随机中心点,一种是随机分类,请修改代码实现另一种初始化也就是随机分类代码,然后观察聚类过程比较两种随机初始化方法效果。

随即中心点

1-4                                        5-8

机器学习:聚类,Sklearn_第1张图片机器学习:聚类,Sklearn_第2张图片

机器学习:聚类,Sklearn_第3张图片

随机分类

1-4                                             5-8

机器学习:聚类,Sklearn_第4张图片机器学习:聚类,Sklearn_第5张图片

随即中心点的初始点选择是不确定的,可能会导致最后模型的结果不稳定。随即分类不需要确定分类数,更能突出模型的准确率。

  1. 请对比sklearn的K均值聚类和混合高斯模型,针对make_blobs生成的基本数据集, makemoons生成的太极数据集,makecircles生成的圆环数据集,多类数据集,对比聚类的效果如何。

基本数据集

机器学习:聚类,Sklearn_第6张图片

KMeans

机器学习:聚类,Sklearn_第7张图片

高斯混合

机器学习:聚类,Sklearn_第8张图片

太极数据集

机器学习:聚类,Sklearn_第9张图片

KMeans

机器学习:聚类,Sklearn_第10张图片

高斯混合

机器学习:聚类,Sklearn_第11张图片

圆环数据集

机器学习:聚类,Sklearn_第12张图片

KMeans

机器学习:聚类,Sklearn_第13张图片

高斯混合

机器学习:聚类,Sklearn_第14张图片

多类数据集

机器学习:聚类,Sklearn_第15张图片

KMeans

机器学习:聚类,Sklearn_第16张图片

高斯混合

机器学习:聚类,Sklearn_第17张图片

KMeans的计算量小,方便进行运算。

高斯混合模型的计算量大,可以看作是KMeans的推广,当每个混合模型没有足够的点时,估算协方差变得困难起来,同时算法会发散并且找具有无穷大似然函数值的解, 除非人为地对协方差进行正则化

四、实验总结

本次实验基本完成,难度适中,对k-means聚类算法的原理,高斯混合模型聚类算法的原理,sklearn如何实现聚类有了更深的了解,但相关代码的具体作用还需要理解消化。

你可能感兴趣的:(机器学习,聚类,sklearn)