gensim实现LDA(Latent Dirichlet Allocation)算法提取主题词(topic)
LatentDirichletAllocation(LDA)隐含分布作为目前最受欢迎的主题模型算法被广泛使用。LDA能够将文本集合转化为不同概率的主题集合。需要注意的是LDA是利用统计手段对主题词汇进行到的处理,是一种词袋(bag-of-words)方法。如: 输入:第一段:“Nowweareengagedinagreatcivilwar,testingwhetherthatnation,ora