机器学习中的EM算法详解及R语言实例(2)

我们在上一篇文章中介绍了EM算法的基本原理,如果读者对此不甚了解,建议参阅

机器学习中的EM算法详解及R语言实例(1)


4. 高斯混合模型


高斯混合模型(GMM,Gaussian Mixture Model)可以看成是EM算法的一种现实应用。利用这个模型可以解决聚类分析、机器视觉等领域中的许多实际问题。


4.1 模型推导


在讨论EM算法时,我们并未指定样本来自于何种分布。实际应用中,常常假定样本是来自正态分布之总体的。也就是说,在进行聚类分析时,认为所有样本都来自具有不同参数控制的数个正态总体。例如前面讨论的男性女性身高问题,我们就可以假定样本数据是来自如图13-5所示的一个双正态分布混合模型。这便有了接下来要讨论的高斯混合模型


机器学习中的EM算法详解及R语言实例(2)_第1张图片

机器学习中的EM算法详解及R语言实例(2)_第2张图片


4.2 应用实例

软件包mclust提供了利用高斯混合模型对数据进行聚类分析的方法。其中函数Mclust()是进行EM聚类的核心函数,它的基本调用格式为

机器学习中的EM算法详解及R语言实例(2)_第3张图片


机器学习中的EM算法详解及R语言实例(2)_第4张图片

机器学习中的EM算法详解及R语言实例(2)_第5张图片



机器学习中的EM算法详解及R语言实例(2)_第6张图片


全文完。


本文参考文献:

1、斯坦福的公开课——机器学习 ,由Andrew Ng主讲

2、JerryLead的博客

3、数据挖掘导论,Pang-Ning Tan,Michael Steinbach,Vipin Kumar 著


你可能感兴趣的:(机器学习,R语言,高斯混合模型,GMM)