在这炎炎夏日和绵绵雨季中,大多数研究生不仅受到湿热夹击,可能还有面对开题或准备开题的压力。
研究开题是开展研究的必经之路,所谓万事开头难,那么,有什么小神器能助力我们开个好头,旗开得胜呢?
按张林老师所说,一个研究开题要回答三个问题:
1、 研究问题,研究什么问题;
2、 研究意义,研究有什么价值和创新性;
3、 研究设计的可行性,研究设计是否能解决研究问题。
无论是研究问题、意义还是研究设计都绕不开研究现状,基于研究现状论证研究问题是否成立;
基于研究现状凸显研究的理论价值和意义等等,因此对以往研究的梳理和综述就显得尤为重要。
然而,许多人可能都有这样的感受:
面对海量的文献数据,无从下手;面对文献综述,一筹莫展……
对此症,下此药,药名为“科学计量分析”,其功效为梳理相关主题的发展脉络和研究方向、挖掘研究热点和发展趋势……
本文将根据大致流程划分7个步骤,并结合我们之前做的文献计量分析结果分别谈谈每个步骤的目的、主要方法及注意事项。
以下主要对基于Web of Science检索文献数据库(下文简称为WOS)的英文文献的计量分析进行介绍。
鉴于CNKI文献数据库与WOS的计量分析思路及方法大致相同,本文不展开介绍(CNKI数据库的文献采集需要手动翻页选取)。
由于我们关注面孔吸引力的研究,例如面孔吸引力判断的认知神经机制。因此以下以面孔吸引力研究的文献计量分析为例。
1、确定检索关键词
主要方法:
1)确定该领域常用的专业术语,如面孔吸引力研究通常会用的关键词如下:“facial attractiveness”、“facial preference”、“facial beauty”。
2)打开WOS,选择web of science核心合集,并选择高级检索,输入表达式:TS=(“facial attractiveness” OR “facial preference” OR “facial beauty”)。
检索中还需确定文献类型、时间跨度以及数据库。
图1 web of science高级检索页面
小tips:
1)确定研究常用关键词需慎重,直接关系计量分析结果,因此建议结合对该领域文献的积累和经典综述的表达来确定。
2)关键词检索可多试几次,也需检查是否检索出较多的无关文献。
3)除了核心术语及其平行概念,该领域的经典理论或领域内公认的著名学者的姓名也可作为关键词之一。
4)通常选择SSCI和SCI数据库,值得注意的是,每个学校购买的SSCI和SCI的年限不同,需要注意图1中SSCI和SCI后面的时间范围,原则上范围越大检索数据越全。
2、下载文献
主要方法:
1)确定检索结果无误后,点击“导出”-“其他文件格式”-选择“记录来源”-记录内容为“全记录与引用的参考文献” -文件格式为“纯文本”。
2)需保存的文件名为“download-xxx.txt”,xxx可任意修改。一次只能下载500条文献记录。
3)下载的txt会记录文献的基本信息以及引用的参考文献,例如AU为作者,AF作者全称,DE为作者关键词,ID为扩展关键词等。了解信息的缩写有助于随后的描述统计分析。
3、合并以及整理数据
下载好数据后,建议先合并数据,如图2,按照一定顺序合并及整理每一篇文献的基本信息。这是随后两步的基础,具体作用可接着往下看。
主要方法:合并数据可通过Python或者市面的小工具进行操作。
小tips:整理的基本信息尽可能的丰富,便于后续多维数据挖掘。
图2 合并数据示例
4、筛选文献
检索的文献相当于文献计量分析的数据或样本,然而可能存在以下情况:重复出现的文献、缺失关键词或者任意信息的文献。
这会影响随后数据分析的结果,因此为了保证文献信息的匹配,建议筛选,尤其需要剔除重复出现的文献以及缺失关键词的文献。
主要方法:剔除数据、去重,同样可通过Python或者市面的小工具进行操作。
小tips:如果在Citespace中进行后续分析,Citespace可实现去除重复文献,但无法剔除缺失信息的文献;而在VOSviewer中两者均不可实现。
大多时候会用多种可视化分析软件,因此为保证数据统一性和准确性,建议在进行描述统计或可视化分析前,手动筛选数据。
5、描述性统计
需要注意,计量分析并非一来就进行多彩酷炫的可视化分析,或者说别忽略了接下来谈到的描述性统计,以下信息的恰当挖掘也将提供大量有价值的信息。
主要的描述性统计信息包括:年度发文量、年度引文量、发文趋势、高频关键词、高频作者、高频期刊、高频机构等。
主要方法:
1)描述性统计可基于上述合并后的基本信息进行。
2)图3包括了年度发文量、年度引文量和发文趋势。年度发文量不用细说,即统计每一年度所发表的文献数量。
发文趋势可通过Origin软件进行数据拟合,图3是进行了指数拟合,可看出发文趋势呈指数型增长。
年度引文量需要在WOS获得数据后的“创建引文报告”中导出引文数据,如图4,这也要注意先对数据进行去重和筛选。
图3 面孔吸引力研究英文文献年度被引量、发文量和发文量趋势
图4 引文报告界面
3)图5是基于年份和关键词两组数据,考察高频关键词随时间变化的趋势。
这不仅可以看出高频关键词信息,还可增加时间维度看出关键词的变化趋势。例如图5可看出近十几年“ERP”和“fMRI”开始作为高频关键词出现。
图5 面孔吸引力研究英文文献高频关键词表(“*”表示为合并关键词)
4)高频关键词、高频作者、高频期刊、高频机构等可用同样的方法挖掘信息。
6、共被引文献分析
共被引分析中最为关键的是共被引文献分析,即挖掘共同被引频次前十的文献信息,相当于该领域的经典文献,如表1。
把握经典文献如同抓住领域的研究命脉,需要高度重视这些文献的价值。
主要方法:将数据导入Citespace,Node Type选择Reference进行共被引文献分析。导入数据等基本操作,网上有许多教程,请自行查阅。
7、关键词共现分析
作为研究内容的核心概括,关键词分析是挖掘研究热点和发展脉络的重要方法,关键词分析也多种多样,以下介绍主要介绍关键词共现分析,仅供参考。
关键词共现分析是通过关键词共同出现的频次和情况,以揭示各研究主题之间的关系。
图6是通过VOSviewer对关键词进行共现分析,其自带聚类分析功能,不同颜色代表不同聚类;
聚类往往是一些关键词具有较高的共现频次,反映它们往往抱团出现,能够反映出一个较明显的研究方向。
图6 关键词的共现网络
小tips:图7为点击浅蓝色聚类 “faceperception”,左下角会有该关键词在共现网络中的信息,左边也会显示与其密切相关的关键词。
图7 VOSviewer关键词共现分析界面
同样是关键词共现分析,Citespace可加入时间维度,生成关键词共现网络的时区视图。
图8是按五年为间隔,每个圆圈代表一个关键词,其中时间为该关键词首次出现的年份,圆圈大小反映该关键词在这三十年间的出现频次。
最近时间所出现的关键词一定程度是近期的焦点。
图8 面孔吸引力研究英文文献关键词共现的时区图
小tips:
1)可根据阈限大小,调整页面呈现的关键词数量;
2)系统自动生成的时区图中关键词呈现较为杂乱,为求清晰美观,需手动调整和排列。
以上就是文献计量分析的主要框架和方法。由于数据分析较为繁琐,建议大家细心做好数据记录。