【科学文献计量】中英文文献标题及摘要用词情感分析与可视化

中英文文献标题及摘要用词情感分析与可视化

  • 1 文本词典准备
  • 2 文本数据用词情感分析步骤
  • 3 针对英文文献数据进行用词情感分析
  • 4 针对中文文献数据进行用词情感分析
  • 5 中英文献文摘要句数统计分析
  • 6 英文文献数据情感效价

1 文本词典准备

新建一个ipynb文件,参照7.2.3部分,导入需要使用的python库,并将程序连接到Mysql数据库(也可以进行本地文献数据的读取,仍旧使用CNKI和Scopus数据库)。对于Scopus数据库中的数据摘要字段为空的文献记录进行剔除,读取数据输出结果如下。
【科学文献计量】中英文文献标题及摘要用词情感分析与可视化_第1张图片
文本数据中用词的情感分析需要将文本数据进行分词,然后对分词后的结果进行词性标注,最后根据词性的类别统计各类别的分词结果。随着文本挖掘技术的发展,已经出现了一些比较成熟词典,其中已经标注好了分词对应的词性,我们在使用时加载即可使用。本文进行用词的情感分析使用的cntext库下面的sentiment模块完成。该模块中可根据需要切换数据分析的对象(中文或者英文),也可加载内置的中英文词典(中文或者英文),具体的模块使用手册如下。该模块的功能是计算每个情感类别词在文本中的出现次数

你可能感兴趣的:(python科学计量数据可视化,数据挖掘,python,情感分析,词典,效价)