社区网络算法之GN算法

什么是社区(community structure)

同一社区内的节点与节点的连接很紧密,区与社区之间的连接比较稀疏

设图G=G(V,E), 所谓社区发现是指在图G中确定 n(>=1)个社区

C=C1,C2,...Cn, C = C 1 , C 2 , . . . C n ,

使得各社区的顶点集合构成V的一个覆盖.

若任意两个社区的顶点集合的交际均为空,则成C为重叠社区(disjoint communities); 否则成为重叠社区(overlapping communities).
社区网络算法之GN算法_第1张图片

GN算法

GN算法是一个经典的社区发现算法,它属于分裂的层次聚类算法,最初,由Michelle Girvan和Mark Newman提出。其基本思想是不断的删除网络中具有相对于所有源节点的最大的边介数的边,然后,再重新计算网络中剩余的边的相对于所有源节点的边介数,重复这个过程,直到网络中,所有边都被删除。

  • 边界数(Betweenness):网络中经过每条边的最短路径 的数目。

  • GN算法

    • 计算网络中所有边的介数

    • 找到介数最高的边并将它从网络中移除

    • n 重复,直到每个节点就是一个社团为止

  • GN-算法边介数

    btes = []
    for p i zip(g.es(), g.edge_betweenness()):
    e = p[0].tuple
    btes.append({'edge':(names[e[0]],names[e[1]]),'bt':p[1]})
    sorted(btes, key = lambda k: k['bt'], reverse = True)

    社区网络算法之GN算法_第2张图片

  • GN算法-community_edge_betweenness

    communities = g.community_edge_betweenness(directed = False, weights =None)
    print(communities)
    print(g.vs['name'])

    社区网络算法之GN算法_第3张图片
    欢迎关注博主微信公众号 码龙社 将第一时间获取最新学习笔记,以及文章md文文档,一同成长成就梦想

你可能感兴趣的:(数据分析,机器学习)