R语言做聚类分析Kmeans时确定类的个数

方法一:

K平均算法(k-means)
在下面的误差平方和图中,拐点(bend or elbow)的位置对应的x轴即k-means聚类给出的合适的类的个数。

> n = 100
> g=6
> set.seed(g)
> d <- data.frame(x = unlist(lapply(1:g, function(i) rnorm(n/g, runif(1)*i^2))), y = unlist(lapply(1:g, function(i) rnorm(n/g, runif(1)*i^2))))
> plot(d)
>

R语言做聚类分析Kmeans时确定类的个数_第1张图片

R语言做聚类分析Kmeans时确定类的个数_第2张图片


由上图可以看出,该方法给出合理的类别个数是4个。

方法二:

K中心聚类算法(K-mediods)
使用fpc包里的pamk函数来估计类的个数:

> library(cluster)
Warning message:
程辑包‘cluster’是用R版本3.2.3 来建造的 
> library(fpc)
> pamk.best <- pamk(d)
> cat("

你可能感兴趣的:(R语言,r语言,kmeans,聚类)