四、(1)层次聚类

四、(1)层次聚类

在社会学领域,一般通过给定网络的拓扑结构定义网络节点间的相似性或距离,然后采用单连接层次聚类或全连接层次聚类将网络节点组成一个树状图层次结构。其中,树的叶节点表示网络节点,非叶节点一般由相似或距离接近的子节点合并而得到。

中文名 层次聚类方法
外文名 Hierarchical Clustering
性 质 聚类方法
属 性 层次
原理的不同 可以分为凝聚和分裂两种方法

分裂层次聚类采用的就是"自顶而下"的思想,先将所有的样本都看作是同一个簇,然后通过迭代将簇划分为更小的簇,直到每个簇中只有一个样本为止。凝聚层次聚类采用的是"自底向上"的思想,先将每一个样本都看成是一个不同的簇,通过重复将最近的一对簇进行合并,直到最后所有的样本都属于同一个簇为止。

层次聚类方法的基本思想是:通过某种相似性测度计算节点之间的相似性,并按相似度由高到低排序,逐步重新连接个节点。该方法的优点是可随时停止划分,主要步骤如下:
(1)移除网络中的所有边,得到有n个孤立节点的初始状态;
(2 )计算网络中每对节点的相似度;
(3)根据相似度从强到弱连接相应节点对,形成树状图;
( 4)根据实际需求横切树状图,获得社区结构。
四、(1)层次聚类_第1张图片

python实现简单的层次聚类。代码如下:

你可能感兴趣的:(四,(1)层次聚类)