引言:Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
——摘自百度百科
共现矩阵的构建算法和该图片的.gexf文件可在我的Github上看到,如果你觉得对你有帮助,欢迎star和fork我:)。
【解释】:
有木有很心动的感觉?!!那就赶快和我一起上车吧✿✿ヽ(°▽°)ノ✿
对于大规模节点和复杂的关系,无法通过手动一个一个节点的添加,往往通过程序处理好程序存储在xlsx表格或csv文件中。
注意:表头中的Id
和Label
为必填项,且表头项首字母必须大写,否则Gephi可能识别不了。
其中,Source
、Target
和Type
为必填项。Source
表示源节点,Target
表示目标节点。Type
的两个选项Undirected
和Directed
分别表示无向图和有向图。
获得以上数据,需对原数据构造共现矩阵,并以三元组形式存储。如何《构建共现矩阵》请见此。
分别导入节点和边的电子表格,如下图所示(因为是作者间的合作关系,所以这里用无向图):
点击概览可看到如下初始网络关系图(图的右上角可看到节点和边的个数):
根据节点的权值来设置每个节点的尺寸,本例中结点的权值为作者发表论文的频数。并设置最小和最大尺寸,点击应用即可看到如下图变化。
根据节点的权值来设置每个节点的颜色。
或者可以像我这样自定义设置,将所有节点按照点的权值大致分成三类,点击调色板可选择自己需要的类型,选好后可以更改每个项的颜色值。(注:占比越大的颜色项目表示权值越小的点,因为本例中权值小的点占大多数)
常用布局有力引导布局(Force Atlas)和环形布局(Fruchterman Reingold)。
这里采用力引导布局(ForceAtlas 2),,需要勾选防止重叠项以保证每个节点不重叠:
点击运行后等待算法迭代到合适时间(20s左右)就点击停止,我的结果如下:
接下来就该设置我们图片节点的标签啦,点击左下角T
按钮设置节点Label显示,然后设置Label按节点大小显示(即Label字体大小和节点权值成正比),最后调整全局Label大小到美观即可。若是有向图,则可以通过点击旁边灰色的T
按钮以显示边的Label。
注意右边统计栏中的模块化和平均聚类系数需保证为运行状态(Gephi默认运行)。
最后设置结果图如下:是不是比初始打开时黑漆漆的一坨黑点要美观很多?
对于上图我们也可以把边的颜色设置为自己喜欢的,比如此处我按照边的权值将边设置为橘色。且边权值越大,边线条越粗。
点击预览选项,可以设置标签样式,这里我以自己的爱好设置为文本轮廓样式(标签外边缘有白色轮廓)。同时勾选显示标签选项,点击下方刷新按钮就可以看到右边的预览图形。
字体不合适的可以再次设置一下标签字体,此处我设置字体大小为3。
同时配置边的颜色项为原始的(original),这样我们就可以在右图看到我们之前在概览设置的图形啦。
如果点击刷新按钮不出现图,则可能你的预览选项卡没打开,在窗口菜单中重新打开即可。
点击左下角可保存为png等其他支持格式。
若网络过于庞大,保存为图片模糊失真,则可以在文件→输出→图文件
中保存为.gexf
格式。
.gexf
格式文件实质是以XML存储图的结点和边信息,包括但不限于结点的Id、Label、权值以及在图形中的坐标,可用Gephi以及其他支持该文件的软件打开,不会失真。具体关于该格式的详细信息请见底部参考文献[5]。
最后成形的关系图谱如开篇所示,完结撒花✿✿ヽ(°▽°)ノ✿。
【参考文献】:
[1] 五分钟Gephi入门视频:数据可视化.
[2] Eastmount.[关系图谱] 一.Gephi通过共线矩阵构建知网作者关系图谱.
[3] Gephi学习笔记-画出图形基本流程.
[4] Gephi快速入门指南.pdf
[5] GEXF Working Group.GEXF文件扩展名概述.