CiteSpace实践—中文CNKI数据分析

根据文章中的citespae初步了解中介绍的关于CiteSpace进行数据分析的四个步骤,进行实例探究中文CNKI数据分析。

1、数据准备

1.1 确认主题

本次依然希望看看关于计算机类的论文,近些年最火的内容有哪些?

1.2 选择数据源

CNKI中有专门的期刊导航,里面的分类较为详细。这次选择的期刊是《计算机学报》
CiteSpace实践—中文CNKI数据分析_第1张图片
CiteSpace实践—中文CNKI数据分析_第2张图片

1.3 实施检索

依然选择近三年的文章进行检索
CiteSpace实践—中文CNKI数据分析_第3张图片
找到所需数据:
CiteSpace实践—中文CNKI数据分析_第4张图片

2、数据收集

2.1 数据采集

按部就班:
可以对每页显示的记录进行设置,这里推荐选择每页显示50条,以便于手工删除不符合的文献条目。
CiteSpace实践—中文CNKI数据分析_第5张图片

2.2 数据导出

在这里插入图片描述
这里需要注意的是:使用CiteSpace进行分析的文献类型输入为“Refworks” 。建议输入“Refworks” 和“Endnote”两种格式。前者可以进行文献可视化分析,而后者可以用于进行论文写作时使用。
CiteSpace实践—中文CNKI数据分析_第6张图片

2.3 数据保存

接下来开始建立文件夹data、input、output、project(这是一种约定俗成的步骤,也可以不这么来,可以自定义)他们分别是用来保存用于数据分析的处理过得数据、原始未格式处理过的数据,格式处理过输出的数据、对数据进行分析后数据的结果。
在这里插入图片描述
数据保存这一步操作实际上就是将下载好的原始数据放到input包里面,这里需要注意

  • ① 命名规则必须是download_XX
  • ② 必须将字符编码格式转换为UTF-8的格式:打开.txt文件–>文件–>另存为–>保存即可
    在这里插入图片描述
2.4 格式转换

Data–>CNKI–>Browse–>Format Conversion,直到出现finished算是成功。
CiteSpace实践—中文CNKI数据分析_第7张图片
输出结果会以.txt文件输出
CiteSpace实践—中文CNKI数据分析_第8张图片

3、系统运行

3.1 数据导入

将output文件夹下的数据全部复制到data包里面
然后点击new一个project,起一个名字,再把数据导进来(注意project和data的数据分别在哪),最后一定要注意的一点是:Data Sourse要选择WOS数据源(这个是万能的数据源,选择CNKI也可能是会出错的,但是选WOS不会错),最后save就可以了。这也是避免乱码的其中一步:
 

 
CiteSpace实践—中文CNKI数据分析_第9张图片

另外一步就是preferences不选Chinese
 

 
CiteSpace实践—中文CNKI数据分析_第10张图片

3.2 设置选择项
  • 首先选择时间切片(因为咱们下载的是进三年的数据,所以2017-2019),
  • 其次设置Node Type类型:注意,如果是CSSCI导出的数据是可以进行Reference等操作,但是如果是CNKI导出的数据是不能进行Reference这项操作的。这里,我们可以依次选择Author、Keyword、Institution等进行数据分析
  • 最后勾选pruning sliced networks
     
     
    在这里插入图片描述
3.3 go运行

点击got运行后,会在Space Status中出现处理后的数据结果、在Process Reports中出现进程报告。
在这里插入图片描述

3.4 开启开始化窗口

点击Visualize按钮

3.5 图谱呈现于优化

优化可以通过control Panel控制面板调整样式

4、图谱分析

这里只展示做出来的结果,至于出现频次和中心性等分析就不在做了。以下的图谱都是通过调整control panel里面的属性值,以及选择不同的样式进行展示的。
关键字分析

CiteSpace实践—中文CNKI数据分析_第11张图片
CiteSpace实践—中文CNKI数据分析_第12张图片

作者:

CiteSpace实践—中文CNKI数据分析_第13张图片
CiteSpace实践—中文CNKI数据分析_第14张图片

机构名称:

CiteSpace实践—中文CNKI数据分析_第15张图片
CiteSpace实践—中文CNKI数据分析_第16张图片
CiteSpace实践—中文CNKI数据分析_第17张图片
CiteSpace实践—中文CNKI数据分析_第18张图片
CiteSpace实践—中文CNKI数据分析_第19张图片

5、Citespace处理中文数据常见问题解答

问题1:CNKI数据只能做keyword分析,做不了term分析吗?也不能做共被引分析吗?

解答:对,目前citespace是按这样设计的,同时由于CNKI数据不带参考文献,所以也无法做被引文献分析。

问题2:CNKI数据转换,为什么我用“import/export”将cnki下载的数据转换之后,出来的结果中文字全是“?”呢?是哪里需要设置一下吗?

解答:启动时用StartCiteSpaceChinese. Project: Edit Properties > Data Source>CNKI.

问题3:CNKI显示no valid itemstodisplay问题,但是分析时就会跳出这种情况怎么回事。

解答:(1)保证路径正确(2)下载数据必须以download开头(3)软件版本问题(4)时间设置问题(5)文件夹问题

问题4:CNKI作可视化分析时出现乱码,怎么回事?

如下图所示。
 

 
CiteSpace实践—中文CNKI数据分析_第20张图片
解答:(1)可试试preferences不选Chinese,项目数据来源不选择CNKI,选WOS,然后解决了。(2)使用新版本。

问题5:用CNKI导出的数据做了关键词聚类图,但是一直找不到如何使图中显示所有关键词标签或者显示关键词大于100次引用的按钮。

解答:屏幕靠右侧的Article Labels下的几个sliders组合调节,Article Labels: threshold往左,font size往右。

问题6:在版本5.0中,对CNKI数据进行自动聚类时,选“T”来选取标签词时,总是出错,请问这是什么原因?

解答:选“K”来选取标签词。

问题7:如何用基于CSSCI的数据绘制“研究前沿突变术语”的图谱?(burst来源为名词短语)

解答:(1)抽取名词短语,选需要的年份,选Noun Phrases等左边窗口出现回应后,GO. 等到提示visualize, save, cancel,选cancel.以上这步只需做一次;(2) 选burst, 用名词短语;(3) Node Type 选Cited References 和 Terms.(4)GO.

问题8:CSSCI格式转换问题,把原始数据放在input文件夹,新建了output文件夹,输出结果显示是:0 of 0 references havebeen converted successfully (0.0%)

解答:(1)转换前的格式应使用utf-8编码。文件名要以’download’开始。。。(2)版本问题。

问题9:用CSSCI下载的引文信息做共被引分析时,如何才能知道这些被引文章到底是期刊文章还是学位论文还是书籍之类的呢?

解答:期刊卷和页后面一般有具体数字:V8, P103等;书籍后面为0:V0,P0等。

结语:

这篇文章就到这里了,欢迎大家积极评论多多交流。
 

 
在这里插入图片描述

你可能感兴趣的:(citespace学习笔记)