手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱

引言:Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
——摘自百度百科

提前预览下我们要做出来关系图谱

共现矩阵的构建算法该图片的.gexf文件可在我的Github上看到,如果你觉得对你有帮助,欢迎star和fork我:)。
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第1张图片
【解释】:

  1. 图中结点越表示该作者发表的论文越多,对该领域的贡献越大
  2. 图中边越则两两作者的合作关系越多,合作关系越密切
  3. 本例使用的是力引导布局(基于库伦斥力胡克弹力算法),由于节点数3000+,不适合使用环形布局。

有木有很心动的感觉?!!那就赶快和我一起上车吧✿✿ヽ(°▽°)ノ✿

一、数据准备

①节点数据:

对于大规模节点和复杂的关系,无法通过手动一个一个节点的添加,往往通过程序处理好程序存储xlsx表格或csv文件中。
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第2张图片
注意:表头中的IdLabel必填项,且表头项首字母必须大写,否则Gephi可能识别不了。

②边数据:

其中,SourceTargetType为必填项。Source表示源节点,Target表示目标节点。Type的两个选项UndirectedDirected分别表示无向图有向图
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第3张图片
获得以上数据,需对原数据构造共现矩阵,并以三元组形式存储。如何《构建共现矩阵》请见此。

二、在Gephi中导入数据

分别导入节点的电子表格,如下图所示(因为是作者间的合作关系,所以这里用无向图):
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第4张图片
点击概览可看到如下初始网络关系图(图的右上角可看到节点和边的个数):

  • 3017个节点.
  • 6041个边.

手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第5张图片

三、设置节点的大小和颜色

根据节点的权值来设置每个节点的尺寸,本例中结点的权值作者发表论文的频数。并设置最小和最大尺寸,点击应用即可看到如下图变化。
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第6张图片
根据节点的权值来设置每个节点的颜色
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第7张图片
或者可以像我这样自定义设置,将所有节点按照点的权值大致分成三类,点击调色板可选择自己需要的类型,选好后可以更改每个项的颜色值。(注:占比越大的颜色项目表示权值越小的点,因为本例中权值小的点占大多数)
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第8张图片

四、设置布局

常用布局有力引导布局(Force Atlas)和环形布局(Fruchterman Reingold)。

手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第9张图片
这里采用力引导布局(ForceAtlas 2),,需要勾选防止重叠项以保证每个节点不重叠:
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第10张图片
点击运行后等待算法迭代到合适时间(20s左右)就点击停止,我的结果如下:
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第11张图片

五、节点标签设置

接下来就该设置我们图片节点的标签啦,点击左下角T按钮设置节点Label显示,然后设置Label按节点大小显示(即Label字体大小和节点权值成正比),最后调整全局Label大小到美观即可。若是有向图,则可以通过点击旁边灰色的T按钮以显示边的Label。

注意右边统计栏中的模块化平均聚类系数需保证为运行状态(Gephi默认运行)。
最后设置结果图如下:是不是比初始打开时黑漆漆的一坨黑点要美观很多?
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第12张图片

六、边的颜色设置

对于上图我们也可以把边的颜色设置为自己喜欢的,比如此处我按照边的权值将边设置为橘色。且边权值越大,边线条越粗
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第13张图片

七、预览设置

点击预览选项,可以设置标签样式,这里我以自己的爱好设置为文本轮廓样式(标签外边缘有白色轮廓)。同时勾选显示标签选项,点击下方刷新按钮就可以看到右边的预览图形。
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第14张图片
字体不合适的可以再次设置一下标签字体,此处我设置字体大小为3
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第15张图片
同时配置边的颜色项原始的(original),这样我们就可以在右图看到我们之前在概览设置的图形啦。
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第16张图片
如果点击刷新按钮不出现图,则可能你的预览选项卡没打开,在窗口菜单中重新打开即可。
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第17张图片

八、保存格式

点击左下角可保存为png等其他支持格式。
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第18张图片
若网络过于庞大,保存为图片模糊失真,则可以在文件→输出→图文件中保存为.gexf格式。

手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第19张图片
.gexf格式文件实质是以XML存储图的结点信息,包括但不限于结点的Id、Label、权值以及在图形中的坐标,可用Gephi以及其他支持该文件的软件打开,不会失真。具体关于该格式的详细信息请见底部参考文献[5]。
手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱_第20张图片
最后成形的关系图谱如开篇所示,完结撒花✿✿ヽ(°▽°)ノ✿。

【参考文献】:
[1] 五分钟Gephi入门视频:数据可视化.
[2] Eastmount.[关系图谱] 一.Gephi通过共线矩阵构建知网作者关系图谱.
[3] Gephi学习笔记-画出图形基本流程.
[4] Gephi快速入门指南.pdf
[5] GEXF Working Group.GEXF文件扩展名概述.

你可能感兴趣的:(知识图谱,数据挖掘)