pyLDA系列︱考量时间因素的动态主题模型(Dynamic Topic Models)

笔者很早就对LDA模型着迷,最近在学习gensim库发现了LDA比较有意义且项目较为完整的Tutorials,于是乎就有本系列,本系列包含三款:Latent Dirichlet Allocation、Author-Topic Model、Dynamic Topic Models

pyLDA系列模型 | 解析 | 功能
---- | —
ATM模型(Author-Topic Model) | 加入监督的’作者’,每个作者对不同主题的偏好;弊端:chained topics, intruded words, random topics, and unbalanced topics (see Mimno and co-authors 2011) | 作者主题偏好、
词语主题偏好、
相似作者推荐、
可视化

LDA模型(Latent Dirichlet Allocation) | 主题模型 | 文章主题偏好、
单词的主题偏好、
主题内容展示、
主题内容矩阵
DTM模型(Dynamic Topic Models) | 加入时间因素,不同主题随着时间变动 | 时间-主题词条矩阵、
主题-时间词条矩阵、文档主题偏好、新文档预测、跨时间+主题属性的文档相似性

案例与数据主要来源,jupyter notebook可见

你可能感兴趣的:(NLP︱R+python,付费-智能写作专栏)