解读citespace绘制的关键词主题路径图

CiteSpace有一个亮点就是将时间因素加入了知识图谱的绘制之中。先划分时间段,然后将合并起来一起分析,如时区图,又叫主题路径图。如下:

解读citespace绘制的关键词主题路径图_第1张图片

本文主要讲解一下第一张图,即关键词的时区图是怎么生成的。

如有不对,敬请指出。

上图的数据集时间区间是1998-2018

圆圈

图中的每一个圆圈代表一个关键词,该关键词是在分析的数据集中首次出现的年份【注意:是此数据集中首次出现,并不是关于此主题的所有数据中】。

关键词一旦出现,将固定在首次出现的年份,尽管之后论文里仍会出现该关键词,图中将不再显示,只会在刚出现的年份显示。

如果后来的年份又出现了该关键词,那么该关键词会在首次出现的位置频次加1,出现几次,频次就增加几次。所以就可以解释为什么1998年,文献量很少,而关键词“数据管理”和“高校图书馆”圆圈这么大的原因了。

因为,之后论文关键词中出现的“数据管理”和“高校图书馆”均在1998年进行了累加。

此种方法合不合理呢?

如果一个关键词在1998年出现一次,之后几年没出现,而在2012年出现了80次,那么软件会把该关键词归到1998年,显然结果是不合理的。

当然,这是特例,现实情况出现几率不是很大。

线条

圆圈代表着关键词,线条代表着关键词之间的联系。也正是这种联系,使得主题路径图能够加入时间的因素。

如1998年的“数据管理”和2008年的“科学数据管理”同时出现在了2008年的某一篇论文中,那么“数据管理”和“科学数据管理”之间便存在一条联系,这条线从1998年连到了2008年。

连线表示两关键出现在同一篇或多篇文章中,那么这种方法有没有缺陷呢?

是有的。

如果,某两个关键词在同一年均是第一次出现,如上图中的“数据管理”和“高校图书馆”,巧合的是他俩共同出现在一篇文章中,那么他俩之间并没有连线表示,而这种情况百分百会出现。

任何方法都会存在缺陷,而能做的就是尽量优化而已。

总结:

时区图中的每个时间段均是该时间段的所有新出现的关键词,如果与前期关键词共同出现在同一篇文章中将会用线联系起来,前期关键词频次加1,圆圈变大,从而生成此图。

如有错误请指正!

你可能感兴趣的:(解读citespace绘制的关键词主题路径图)