CiteSpace实践—中文CSSCI数据分析

根据上一篇文章中的citespae初步了解中介绍的关于CiteSpace进行数据分析的四个步骤,进行实例探究中文CSSCI数据分析。

1、数据准备

1.1 确认主题

本次希望看看关于计算机类的论文,近些年最火的内容有哪些?

1.2 选择数据源

CiteSpace常见用于分析中国社会科学引文索引数据库(CSSCI)和中国知网(CNKI)的数据。
① CSSCI,http://cssci.nju.edu.cn/ 需要有权限才能进行数据下载,数据1998年-至今
② CNKI,http://www.cnki.net/ 即使没有数据权限也可以收集所分析数据
本次我们选择的是CSSCI数据库,并且选择《数据分析与知识发现》期刊,进行数据源的下载。

关于为什么选择《数据分析与知识发现》期刊?
一般的期刊,在南大官网上通过期刊导航就可以找到:(http://cssrac.nju.edu.cn/a/cpzx/zwshkxwsy/ )
CiteSpace实践—中文CSSCI数据分析_第1张图片
实际上,CSSCI里面并没有明显的像CNKI里面专门针对计算机类的期刊,比如《软件学报》、《计算机学报》
CiteSpace实践—中文CSSCI数据分析_第2张图片
CiteSpace实践—中文CSSCI数据分析_第3张图片
那怎么去找到,那些关于计算机类的期刊呢?
我才用的方式是,先搜索你想了解的内容,比如《知识图谱》,然后看这个内容出现在哪个期刊中的比例比较高,这样就可以定位关于计算机的期刊了,只需要接下来对这个期刊进行数据下载就可以了。

1.3 实施检索

我们选择高级检索–>键入《数据分析与知识发现》–>选择期刊名,勾选精确–>时间跨度是近两年–>最后开始检索
CiteSpace实践—中文CSSCI数据分析_第4张图片
找到所需数据:
CiteSpace实践—中文CSSCI数据分析_第5张图片

2、数据收集

2.1 数据采集

直接全选内容
CiteSpace实践—中文CSSCI数据分析_第6张图片

2.2 数据导出

直接选择下载。
CiteSpace实践—中文CSSCI数据分析_第7张图片
原始数据就是扩展名为.txt的文件:
在这里插入图片描述

2.3 数据保存

接下来开始建立文件夹data、input、output、project(这是一种约定俗成的步骤,也可以不这么来,可以自定义)他们分别是用来保存用于数据分析的处理过得数据、原始未格式处理过的数据,格式处理过输出的数据、对数据进行分析后数据的结果。
CiteSpace实践—中文CSSCI数据分析_第8张图片
数据保存这一步操作实际上就是将下载好的原始数据放到input包里面,这里需要注意

  • ① 命名规则必须是download_XX
  • ② 必须将字符编码格式转换为UTF-8的格式:打开.txt文件–>文件–>另存为–>保存即可
    CiteSpace实践—中文CSSCI数据分析_第9张图片
2.4 格式转换

Data–>CSSCI2.0–>Browse–>Format Conversion,直到出现finished算是成功。
CiteSpace实践—中文CSSCI数据分析_第10张图片
输出结果会自动在文件名中添加_wos,并以.txt文件输出
在这里插入图片描述

3、系统运行

3.1 数据导入

将output文件夹下的数据全部复制到data包里面
然后点击new一个project,起一个名字,再把数据导进来(注意project和data的数据分别在哪),最后一定要注意的一点是:Data Sourse要选择WOS数据源(这个是万能的数据源,选择CSSCI也可能是会出错的,但是选WOS不会错),最后save就可以了。
CiteSpace实践—中文CSSCI数据分析_第11张图片

3.2 设置选择项
  • 首先选择时间切片(因为咱们下载的是进三年的数据,所以2017-2019),
  • 其次设置Node Type类型:注意,如果是CSSCI导出的数据是可以进行Reference等操作,但是如果是CNKI导出的数据是不能进行Reference这项操作的。这里,我们可以依次选择Reference、Author、Keyword等进行数据分析
  • 最后勾选pruning sliced networks
    CiteSpace实践—中文CSSCI数据分析_第12张图片
3.3 go运行

点击got运行后,会在Space Status中出现处理后的数据结果、在Process Reports中出现进程报告。
CiteSpace实践—中文CSSCI数据分析_第13张图片

3.4 开启开始化窗口

点击Visualize按钮
CiteSpace实践—中文CSSCI数据分析_第14张图片

3.5 图谱呈现于优化

优化可以通过control Panel控制面板调整样式
CiteSpace实践—中文CSSCI数据分析_第15张图片
也可以进行知识图谱背景的转换(红色框框)或者是聚类分析(黄色框框),
在这里插入图片描述

4、图谱分析

我们接下来做一下关键词、作者、和被引关系的图谱分析,都将图谱生成图片.png格式

Keyword:

这个背景我选用的是浅绿色,从图中可以简单的看到大概的数据情况:
CiteSpace实践—中文CSSCI数据分析_第16张图片
当然也可以通过出现频次和中心性和图谱进行对照,可以看到深度学习的出现频次为8,中心性也是最高的0.3,从上图中也可以看出深度学习的紫色阴影是最大的:
CiteSpace实践—中文CSSCI数据分析_第17张图片

Reference:

这个背景我选用的是浅红色,从图中可以简单的看到大概的数据情况:CiteSpace实践—中文CSSCI数据分析_第18张图片
通过出现频次和中心性和图谱进行对照,可以看到天鹏的被引是最高的,现频次为4,中心性也是最高的0.08,从上图中也可以看出他的显示的字也是最大的:
CiteSpace实践—中文CSSCI数据分析_第19张图片

Author

这个背景我选用的是默认色,从图中可以简单的看到大概的数据情况:CiteSpace实践—中文CSSCI数据分析_第20张图片
这里实际上,我对这些作者进行了一个聚类,效果不明显,原因是因为数据量较少。通过分析出现频次和中心性和图谱进行对照,钱力的发文量是最高的,中心性也是最大的。同时也是在图谱中字最大的。
CiteSpace实践—中文CSSCI数据分析_第21张图片

这样,就将整个分析过程走了一遍,但是这只是其中一个比较常用的内容,其他的分析过程基本上也是按照这个步骤走的.这篇文章就到这里了,欢迎大家积极评论多多交流。
 

 
在这里插入图片描述

你可能感兴趣的:(citespace学习笔记)