Gephi国家政策文本关键词共现矩阵的共现网络图分析

文章目录

        • 分词
          • jieba分词
          • 关键词提取
        • python处理形成共现矩阵
        • gephi导入共现矩阵
          • 过滤边的权重进行优化
        • 最终效果

分词

本文研究不同文章中的关键词出现次数,因此将出现在同一篇文章中的关键词都定义为”共现”。

jieba分词

对不同后缀文件(txt、docx、pdf)进行不同处理,提取文章内容为字符串,之后使用jieba库的lcut函数进行分词。

if path+'.txt' in lis:
        path += 

你可能感兴趣的:(python可视化教程,矩阵,线性代数)