拓端数据(tecdat):R语言使用混合模型进行聚类

原文链接:http://tecdat.cn/?p=6112

混合模型是k个分量分布的混合,它们共同形成混合分布:F(x)f(x)

F(x)=Σk=1αF(x)f(x)=∑k=1Kαkfk(x)

为什么要使用混合模型?

让我们通过一个例子激发您为何使用混合模型的原因。让我们说有人向您展示了以下密度图:

<- ggplot(faithful, aes(x = waiting)) +\n geom_density()\np","classes":{"has":1}}" data-cke-widget-upcasted="1" data-cke-widget-keep-attr="0" data-widget="codeSnippet"> p <- ggplot(faithful, aes(x = waiting)) + geom_density() p

need-to-insert-img

need-to-insert-img

我们可以立即看到所得到的分布似乎是双峰的(即有两个凸起),表明这些数据可能来自两个不同的来源。

head(faithful) ## eruptions waiting ## 1 3.600 79 ## 2 1.800 54 ## 3 3.333 74 ## 4 2.283 62 ## 5 4.533 85 ## 6 2.883 55

need-to-insert-img

该数据是2列data.frame

火山喷发:喷发时间(分钟)

等待:喷发之间的时间(分钟)

分享:

你可能感兴趣的:(拓端数据(tecdat):R语言使用混合模型进行聚类)