Networkx入门指南—

Networkx简介

Networkx是一款基于python的开源软件包，主要用于复杂关系网络（Complex Network Analysis）分析和图计算（Graph Processing），其主要功能包括创建、操作和学习复杂关系网络的结构，基于复杂关系网络进行执行图算法等，是一款非常常用的图计算开源软件包之一。复杂网络分析有许多用途，例如分析社交网络中的关系、反洗钱、风险识别和欺诈检测、以及新冠肺炎流行期间用于密接排查等。本文主要简单介绍一下Networkx的使用方法，具体的使用细节可以参考Networkx的官方操作文档，内容十分详尽。

Graph的创建

在Networkx中，Graph是所有操作的属主，是Node和Edge的集合。其中图又分成以下四种，分别是Graph，DiGraph，MultiGraph和MultiDiGraph，四者的区别如下：

Networkx Class	Type	Self-loops allowed	Parallel edges allowed
Graph	undirected	Yes	No
DiGraph	directed	Yes	No
MultiGraph	undirected	Yes	Yes
MultiDiGraph	directed	Yes	Yes

总结一下就是：

Networkx中Graph分有向图和无向图。
Networkx中所有的图都支持自环，即允许有某个顶点指向当前顶点的边存在。
MultiGraph和MultiDigraph是支持平行边的，即两个顶点间具有两条（同向）的边。
Graph的创建十分简单，在进行任何图操作之前，需要先创建一个图：

import networkx as nx
G = nx.Graph()
G = nx.DiGraph()
G = nx.MultiGraph()
G = nx.MultiDiGraph()

除了默认创建空图之外，networkx还支持使用使用现有的图，node或edge列表以及邻接数组等直接进行图的创建，例如：

# create a DiGraph using the connections from G
G.add_edge(1, 2)
H = nx.DiGraph(G)  

# create a graph from an edge list
edgelist = [(0, 1), (1, 2), (2, 3)]
H = nx.Graph(edgelist)  

# create a Graph dict mapping nodes to nbrs
adjacency_dict = {0: (1, 2), 1: (0, 2), 2: (0, 1)}
H = nx.Graph(adjacency_dict)

添加nodes

在Networkx中，任何hashable的对象都可以成为node，比如一个字符串、一副图像和一个xml对象，甚至是另外一个Graph对象或一个自定义的node对象等。为Graph添加node有多种方式，比如一次添加一个node：

G.add_node(1)

或者使用list一次添加多个node：

G.add_nodes_from([2, 3])

以上两种方式添加的node只有唯一的id，没有任何属性，networkx也支持添加具有属性的顶点，如向图中添加了两个id分别为4，5，属性为color，属性值分别为红色和绿色的顶点。：

G.add_nodes_from([
    (4, {"color": "red"}),
    (5, {"color": "green"}),
])

除了上述添加node的方式之外，还支持从另外一个图中添加node，即把另外一个图中的node过来作为新图的node：

H = nx.path_graph(10)
G.add_nodes_from(H)

当然，我们之前说过，图本身也可以作为一个node，因此我们还可以这样:

G.add_node(H)

但是这样添加之后，图G中只有一个顶点为H这个图的顶点。这种灵活性非常重要，也非常有用，比如在计算模块度（Modularity）的时候，需要不断的对原图中的node进行聚合，将聚合的子图重新视是为一个新的顶点，并参与到下一轮的迭代中。
另外还有种添加node的方式，即在添加edge的时候，如果这个node在图中不存在，就会自动添加到这个图中，如果存在就忽略。

添加edges

类似与向图中添加nodes，向图中添加一条edge：

G.add_edge(1, 2)
e = (2, 3)
G.add_edge(*e)  # unpack edge tuple*

如果当前图G中不存在node 1 和 2 ，那么此时也会将1，2作为node添加到图G中。

另外还可以通过list向图中添加多条edge：

G.add_edges_from([(1, 2), (1, 3)])

或者也可以将另外一个图中的edges添加到当前图中：

G.add_edges_from(H.edges)

在Graph和DiGraph中，networkx会自动忽略掉已经存在node、edge。例如：

G.add_edges_from([(1, 2), (1, 3)])
G.add_node(1)
G.add_edge(2, 1)
G.add_node("spam")        # adds node "spam"
G.add_nodes_from("spam")  # adds 4 nodes: 's', 'p', 'a', 'm'
G.add_edge(3, 'm')

这个时候我们去看这个图中有多少node和edge，发现结果是8和3，因为重复的node和edge都被自动忽略掉了。

G.number_of_nodes(), G.number_of_edges()
(8,3)

为graph、node和edge添加属性

上面我们所创建的graph、node和edge除了有唯一可区分的id外，并不具有任何属性，下面介绍如何为graph、node和edge添加属性。我们可以用下列方式创建一个带有属性的图G：

G = nx.Graph(day="Friday")

然后我们可以修改这个Graph的属性：

G.graph['day'] = "Sunday"

可以用下来方法创建并修改node的属性：

#add nodes with attributes
G.add_node(1, time='5pm')
G.add_nodes_from([3, 4], time='2pm')

#modify attribute of node 
G.nodes[1]['room'] = 714

可以用下来方法创建并修改edge的属性：

#add edges with attributes
G.add_edge(1, 2, weight=4.7 )
G.add_edges_from([(3, 4), (4, 5)], color='red')
G.add_edges_from([(1, 2, {'color': 'blue'}), (2, 3, {'weight': 8})])

#modify attribute of edges
G[1][2]['weight'] = 4.7
G.edges[3, 4]['weight'] = 4.2

关于图的创建就简单介绍这么多，至于DiGraph、MultiGraph、和MultiDiGraph的具体创建不同，可以通过对比四种不同图直接的差异进行类推，整体上差不多，只是在一些networkx内部做了一些去重，以及去重方式不一样而已，比如在Graph中，依次添加边(1,2)和边(2,1)的效果是其实等同于就添加了一条边(1,2)，而在MultiGraph中，会添加两条边；另外在DiGraph和MultiDiGraph中(1,2)和（2,1)会视为两条不同的边添加到图中。好了，就这么多，以后慢慢介绍如何利用networkx进行图分析和图展示。

Networkx入门指南——图创建

Networkx简介

Graph的创建

添加nodes

添加edges

为graph、node和edge添加属性

你可能感兴趣的:(Networkx入门指南——图创建)