聚类算法(一)

 1.使用SimpleKMeans算法

  ----->K均值算法是一种常用的聚类分析算法。该算法接受输入值K,然后将n个数据对象划分为K个簇,使得获得的簇满足如下条件:同一簇中的对象相似度较高,而不同簇中的对象相似度较小。SimpleKMeans算法使用K均值算法,簇的数量是由一个参数指定,用户可以选择欧氏距离或曼哈顿距离度量。如果使用后者,该算法实际上市使用k-medians替代k-means,并且中心也是基于中位数而不是均值,以尽量使簇的距离函数最小。


------>下面对天气数据集使用SimpleKMeans算法


聚类算法(一)_第1张图片


------可以看出,聚类结果以表格形式显示----行对应属性名,列对应簇中心


 2.使用EM算法

   ----->EM算法也是常用的聚类算法

聚类算法(一)_第2张图片


------>可以看到,不同于SimpleKMeans算法的输出,在表头的每个簇的下方并没有显示实例数量,只是在表头括号内显示其先验概率。

你可能感兴趣的:(聚类算法(一))