高斯混合模型丨数析学院

高斯混合模型(Gaussian mixture model,GMM)是常见的一种概率模型类统计学习方法,它通过样本的概率密度分布估计来解决数据样本的聚类问题,在生物学统计与医学统计领域有着广泛的应用。本节将向大家介绍在 Python 中如何利用 Scikit-Learn 库中的相关工具构建高斯混合模型,以及这个模型在 Python 中使用的相关技巧。

首先,我们需要导入相关的可视化以及运算工具库,并构建示例数据:


高斯混合模型丨数析学院_第1张图片
1

对于构建好的示例数据,我们先运用前几章谈到过的 K-Means 算法进行聚类,效果如下:

高斯混合模型丨数析学院_第2张图片
2

高斯混合模型丨数析学院_第3张图片
3

为了清晰描绘聚类结果,我们导入 scipy 中的 cdist 工具,构建函数 plot_kmeans 用于刻画出每个聚类簇的大致边界:

高斯混合模型丨数析学院_第4张图片
4

5

高斯混合模型丨数析学院_第5张图片
6

未完待续:课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。 http://datacademy.io/lesson/147
更多课程和文章尽在微信号:「datartisan数据工匠」

高斯混合模型丨数析学院_第6张图片

你可能感兴趣的:(高斯混合模型丨数析学院)