K-means算法的介绍

1、介绍一下聚类

聚类就是类的内部相似,类间不相似

聚类的算法一般包括:划分聚类算法,层次聚类算法,基于密度聚类,基于网格聚类算法。

每一中算法中都包含狠多的具体算法。

基于划分聚类算法包括:k-均值,k-众数,PAM (k中心点),CLARA,CLARANS算法等等

现在主要就是看一下整个算法的流程:


该算法是有缺点的

1、K是很难确定的

2、容易受噪声点的干扰

整个算法的执行具体细节如下:


你可能感兴趣的:(数据挖掘,k-means)