pythonjieba情感分析步骤_python 舆情分析 nlp主题分析 (2)-结合snownlp与jieba库,提高分词与情感判断 待续...
前文摘要:微博热门话题:#中印双方达成五点共识#阅读量2.4亿,讨论7430条。1、数据采集,使用python+selenium,采集该话题下的博文及作者信息,以及每个博文下的评论及作者信息;2、数据预处理,采用Jieba库,构建用户词典,以达到更好的分词;情感分析,采用snownlp库,寻找政治类积极和负面词向量做一个训练,再进行评论分类;3、对博文及评论作者信息进行分析,查看调查主体的用户类别