K-Menas算法

K-Menas算法


一、算法简介
 k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。


二、伪码

算法:K - means。
输入:
    K:聚类的数目
    D:包含n个对象的数据集
输出:K个聚类的集合
方法:
1 )    从D中任意选择K个对象作为初始聚类中心;
2 )    repeat
         根据聚类中对象的均值,将每个对象(再)指派到最相似的聚类;
          更新聚类均值,即计算每个聚类中对象的均值;
3 )    until聚类不再发生变化

算法复杂度为: O(nkt).其中t为迭代次数

三、准确性评价



四、应用和扩展

你可能感兴趣的:(K-Menas算法)