LDA和PLSA的区别

上半年总结的,从另外一个博客粘贴过来。

 

LDA克服了PLSA的缺点,LDA为每一个文档的topics的分布给了一个dirichlet distribution的prior。而PLSA没有。有人算过了,PLSA其实和LDA中取uniform dirichlet distribution的MAP/ML估计是一样的。从图上来说的话,产生式过程中,LDA在文档这一级别的外层多了一个参数a,用来生成不同文档中topics的分布。而PLSA,要么分开为每个文档单独分配topics的分布,要么就给一个分布假设吧。所以这样来说,LDA比PLSA更有鲁棒性?

你可能感兴趣的:(文档)