《学术小白学习之路15》英文文本的LDA主题建模与预测

《学术小白学习之路15》英文文本的LDA主题建模与预测

  • 一、数据
  • 二、英文分词
  • 三、向量化
  • 四、一致性和困惑度得分
  • 五、LDA建模分析
  • 六、模型预测
  • 七、完整代码

一、数据

gensim版本是gensim-3.8.3,根据自己系统要求以及pyhton版本选择合适的版本,强调一下最好使用3.8.3版本,不然会报错。
Python版本是3.6

在运行之前需要先下载相应的包

import nltk
# 下载所需的nltk数据(第一次运行时需要)
nltk.download('stopwords')
nltk.download('wordnet'<

你可能感兴趣的:(学术小白学习之路,学习,LDA,英文文本建模)