Sklearn聚类算法之Agglomerative Clustering

Agglomerative Cluster 是一个从下而上的算法。(另一种是divisive,自顶而下)

Sklearn聚类算法之Agglomerative Clustering_第1张图片

从图里面可以看出来就是根据某种规则去聚类。

流程如下:

1.将每一个元素单独定为一类
2.重复:每一轮都合并指定距离(对指定距离的理解很重要)最小的类
3.直到所有的元素都归为同一类

依据对相似度(距离)的不同定义,将Agglomerative Clustering的聚类方法分为三种:Single-linkage,Complete-linkage和Group average.Single-linkage:要比较的距离为元素对之间的最小距离Complete-linkage:要比较的距离为元素对之间的最大距离Group average:要比较的距离为类之间的平均距离(平均距离的定义与计算:假设有A,B两个类,A中有n个元素,B中有m个元素。在A与B中各取一个元素,可得到他们之间的距离。将nm个这样的距离相加,得到距离和。最后距离和除以nm得到A,B两个类的平均距离。)

你可能感兴趣的:(Sklearn)