社会化网络分析

     共词分析是对关键词共现现象进行研究的一种重要方法。它是对一组词在同一篇文档中出现的次数做统计,以此为基础对词进行聚类分析,从而显示这些词的亲疏关系,进一步分析分析这些词所代表的学科和主题的结构变化。利用共词方法可以概述研究领域的研究热点,横向和纵向分析领域知识的发展过程、特点以及领域之间的关系。同时也可以扩展检索,帮助用户检索信息等等。

     首先构建词的共现矩阵,做成词共现网络,参考《地球物理学部分术语共现图》。接下来分析该网络  

     节点中心性是指网络中每个词在网络中处于什么地位。中心势反映整个词网中各个节点的差异性程度。由于计算方法的不同,节点中心度分为点度中心度,中间中心度和接近中心度。网络的中心势也分为点度中心势、中间中心势和接近中心势。

      社会化网络分析_第1张图片

1.点度中心度

点度中心度反映某个关键词与其他关键词是否共现在某篇文档中。点度中心度越高,反映其在网络中的地位越高,越有可能成为主题研究中的热点。

2. 中间中心度

中间中心度指网络中某个关键词影响其他关键词出现在一片文档中的能力的大小。中间中心度强的词影响其他词共现的能力较强。如果一个词处于其他词联通的路径上,可以认为此词居于重要的地位。

3.  接近中心度

接近中性度反映网络中某个节点不受其他节点“控制”的能力。在词网中表示某个关键词语其他关键词共现的几率大小。接近中心度越小,表示某个关键词越容易与网络中的关键词出现在同一篇文档中。

4.  点度中心势

点度中心势反映网络的集中程度。

5.  中间中心势

中间中心势反映网络中中间中心度最高的节点的中间中心度与其它节点节点的中间中心度的差距。差距越大,则网络的中间中心势越高,表示该网络中的节点可能分为多个小团体而且过于依赖于某个节点的传递关系。中间中心势越低,反映当前的主题还没有形成一个核心。









你可能感兴趣的:(自然语言处理,hadoop)