LDA(文档主题模型)

原文链接: http://www.cnblogs.com/ChenAlong/p/5228329.html
  • LSA latent semantic analysis

    映射词-文档到一个低维隐语义空间

    比较词和文档在低纬空间的相似性

  •  topic 是 Vocab 上的概率分布(符合多项式分布)
  •  文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型
  • plsa 模型
  • LDA模型
  • 大规模LDA系统
    •   spark LDA
    •       Google PLDA
    •       微软LightLDA
    •       腾讯LDA,PEACOCK

转载于:https://www.cnblogs.com/ChenAlong/p/5228329.html

你可能感兴趣的:(LDA(文档主题模型))