兑紫璇
摘要:该文基于CiteSpace并利用文献计量法,采用关键词共现网络及突现词分析,分析了计算机视觉领域国内外近十年的研究热点与研究前沿。研究结果显示,该领域的热点研究方向为图像处理、图像分割、特征提取、图像识别、三维重建等,而计算机视觉对深度学习、卷积神经网络的应用成为该领域的研究前沿趋势。
关键词:CiteSpace;计算机视觉;知识图谱;文献计量法;机器视觉
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2020)08-0216-03
1 背景
随着计算机视觉领域的发展,越来越多的知识信息进入了研究者的视野。海量的文献数据在给人们提供了丰富研究资源的同时,也为研究增添了难度。由于数据繁多复杂,人们往往不能对信息进行全面分析,在大量文献中难以抉择关键信息。利用文献具有的可计量性,文献计量法采用数理统计学方法,可以对计算机视觉这一领域的学术现状和发展趋势进行定量描述、评价和预测[1-2]。并且随着CiteSpace、SCI2、VOSviewer等工具陆续出现,为信息可视化提供了可能,我们可以利用文献图谱并基于文献计量学的方法,对计算机视觉领域进行共引分析、共词分析和聚类分析等,对信息进行全面分析,发现大量数据之间的联系,理清该领域演进脉络,找到研究热点并挖掘研究前沿[3]。
2 研究设计
2.1 收集处理数据
本文分析近十年来国内外计算机视觉领域的研究状况,原始数据来源于CNKI,以SCI\EI与CSSCI中2010-2019年的699篇论文为研究对象。其中选择计算机视觉为主题进行检索,将筛选结果有选择的导出,并利用CiteSpace中格式转换工具将CNKI中导出的数据转换为软件能够处理的格式,放入CiteSpace_data文件夹中。
2.2 利用CiteSpace得到知识图谱
我们利用CiteSpace对收集并经过清洗的文献数据进行可视化分析,可得到文献图谱。其中本文以共现分析和突现词分析为主,发现文献之间潜在关系并从中获得信息[4]。引用科学计量学界专家刘则渊教授对CiteSpace的评价“一图展春秋,一览无余;一图胜万言,一目了然”,可知其可视化方法是文献计量学与计算机图像处理的完美结合,其分析结果可为领域的研究提供清晰的指南。
3 计算机视觉领域研究热点
作为对一篇文章的核心概括,从关键词中往往可了解文章的主题,而一篇论文中的几个关键词又围绕文章核心有着紧密的关联。共词分析通过对关键词共同出现频次以及相互连接的紧密程度进行分析,可以找到该领域各主题之间的关系。在CiteSpace中创建新项目,对导人数据进行分析,可得到图l所示关键词共现图谱。
可知该关键词共现图谱中十字标记最大的关键词为机器视觉,表示机器视觉在所有文献关键词中出现频次最高。而机器视觉实际是计算机视觉的别名,作为本文的研究对象,可将两者除去。然后依次为图像处理、深度学习、图像分割、特征提取、图像识别、算法、神经网络、卷积神经网络、模型、分级、目标跟踪、识别、人工智能、无损检测等,这些主题构成了在计算机视觉领域近十年间的研究热门。且可得图像处理为最中介中心性节点,说明此关键词与多个关键词相连,是较为关键的热门。线条的粗细代表了关键词之间的联系,线条越粗,表示这些主体之间的联系越紧密。而对比图像上方的时间线的颜色与连线的颜色,我们可知这些关键词主要出现在哪一具体的年份。从图中可知图像分割、图像识别、特征提取之间的连线都为紫色,说明这些主题在2010-2013年之间都密切相关。之后我们利用CiteSpace的聚类功能,可以得到如图2所示关键词聚类图谱。
该关键词聚类图谱表示多个紧密关联的关键词进行聚类,一共聚成了13类。每一类上都有一个标签,是聚类中值最大的关键词,分别为人工智能、图像处理、图像分割、三维重建、特征提取、深度学习、图像识别等。标签从小到大排序,表示聚类中包含的关键词越来越少。有图分析可知(#0)聚类包含的关键词最多,说明与很多关键词都与人工智能相关。
另外通过Modularity(Q值)=0.6196,可知该聚类结构显著。而Silhouette(S值)=0.3254.说明该聚类有待于改进,但由于网络不是过于复杂,反而剪枝后的图谱严重不符合实际,所以可认为该图谱合理并可用于分析。
将2010-2019年关键词的高频词罗列出来如表1所示。
由表1可知在2010-2019年间,除去机器视觉和计算机视觉,图像处理在计算机视觉领域最为热门。图像处理即计算机对图像进行分析的技术,主要包括进行压缩、复原、描述等。其主要利用数学函数和图像变化,使图像完成如平滑、锐化之类的转换,以之满足所需。因为计算机视觉处理的核心是图像,所以两者密不可分,可认为图像处理为计算机视觉的一个子集[5-6]。
而图像分割作为第三热门的研究主题,其关注的是目标,完成将目标从背景中分离出来的任务,其作为图像理解的初步操作,是计算机视觉的基础。从表中还可以看出,图像识别、三维重建为计算机视觉较为热门的研究方向,而无损检测、缺陷检测、目标跟踪则为计算机视觉领域较为热门的应用。深度学习、卷积神经网络也成为计算机视觉应用的热门算法与模型。
4 计算机視觉领域研究前沿分析
一个研究领域当前的发展状况可被定义为研究前沿,具体表现为施引文群组。而研究前沿的共被引聚类则形成了该领域的知识基础。CiteSpace可通过共引分析发现研究前沿与知识基础。而在本文中,利用CiteSpace的突变检测功能,通过对词频的时间分布进行考查,可发现计算机视觉领域近十年来文献中的突变术语,并得}H变动趋势。如图3为从CiteSpace中得到的突变词表:
由上图可知2010-2019年有8个突变词,分别为摄像机标定、农产品、目标跟踪、神经网络、棉花、深度学习、卷积神经网络、模型。Begin列为这些关键词首次出现的年份,End列为这些关键词最后出现的年份。通过对此表的分析可得2010-2019年计算机视觉领域的前沿演进情况。其中在2010-2012年期间,计算机视觉主要集中于摄像机标定、农产品检测、无损检测等应用方面,可以发现这一时间段计算机视觉技术的进步推动了检测技术的发展,人们可以利用计算机完成更多基于视觉的分析任务。
而在2017-2019年间,出现了深度学习、卷积神经网络、模型等关键词。这意味着计算机视觉的发展不仅仅满足于当前完成的任务,而是向算法设计、更新网络结构、完善模型等理论与设计层面进行结合与探究来完善基于学习的视觉。其中将卷积神经网络应用于计算机视觉领域是该领域的研究前沿。因为传统的计算机视觉主要利用特征提取算法如尺度不变特征变换匹配算法、加速鲁棒特征算法等从图像中提取特征,完成边缘检测、角点检测、图像分割等任务。但由于算法执行的效果有时会因输入图像的性质而不如意,所以人们通过特征工程来预先对图像进行处理。不同的任务所需要提取的图像特征不同,使特征工程成为一个复杂困难的问题。而应用深度学习算法的卷积神经网络可对原始输入图像完成特征提取的工作,其提取输入图像中局部特征,进行训练学习可得到最正确有效的特征。另外卷积神经网络权值共享降低了网络复杂性,其特殊的布局在原始图像输入网络时避免数据重建的繁杂工作,这些优势可极大的推动计算机视觉的发展进步[7-9]。目前深度学习领域飞速发展,各种网络模、算法逐渐更新,未来计算机视觉与深度学习的联系也将更加紧密。
5 结束语
本文通过对2010年-2019年近十年计算机视觉领域国内外权威期刊的文献进行收集、处理,利用CiteSpace得到知识图谱,同时采用文献计量学的方法进行分析可得计算机视觉领域的研究热点方向为图像处理、图像识别、图像分割、三维重建、特征提取等,而目标跟踪、无损检测、缺陷检测等则为计算机视觉领域较为热门的应用。深度学习、卷积神经网络是计算机视觉应用的热门算法与模型,成为计算机视觉领域的研究前沿。
由于对文献的不同选择将直接影响分析的结论,本文以CNKI库为基础,得到的数据维度比WoS得到的要少。在选取文献时还可以WoS得到的信息为数据基础,以保证对研究领域的知识基础、研究现状与研究概述有更全面、更准确的判断与分析。
参考文献:
[1]郑文晖.文献计量法与内容分析法的比较研究[J].情报杂志,2006,25(5):31-33.
[2]赵蓉英,许丽敏.文献计量学发展演进与研究前沿的知识图谱探析[J].中国图书馆学报,2010,36(5):60-68.
[3]陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253.
[4]张福俊,赵文斌,叶权慧,等.机器学习领域研究热点与前沿演进——基于CiteSpace的可视化分析[J].软件导刊,2019,18(9):5-8,225.
[5]张五一,赵强松,王东云.机器视觉的现状及发展趋势[J].中原工学院学报,2008,19(1):9-12,15.
[6]王爱民,沈兰荪.图像分割研究综述[J].测控技术,2000,19(5):1-6,16.
[7]张顺,龚怡宏,王进军.深度卷积神经网络的发展及其在计算机视觉领域的应用[J].计算机学报,2019,42(3):453-482.
[8]李彥冬.基于卷积神经网络的计算机视觉关键技术研究[D].成都:电子科技大学,2017.
[9]卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17.
【通联编辑:谢媛媛】