共轭分布(Conjugate distributions)

还是先给出贝叶斯公式:

先验概率P(theta),似然概率P(X|theta),后验概率P(theta|X),如果说通过先验概率和似然概率求出后验概率,后验概率与先验概率形式相同,即属于同一个分布,只是参数不同,这时候我们称先验分布和似然分布共轭。

结合上一篇我们讲的,可以得知,beta分布和二项分布是共轭分布。

之所以使用共轭先验的原因是,可以使得先验分布和后验分布的形式相同,这样符合人的直观感受,另一方面,是可以形成一个先验链,即现在的后验分布可以作为下一次计算的先验分布,也就是带来了计算的简单性。

还是针对之前的抛硬币的N次伯努利实验的例子,依然假设参数p服从beta分布:

这个公式我们可以用来预测未来的N次伯努利实验的分布。比如说求正面是20次,反面是25次的概率是多少,直接带入上式即可。不过,我们可以做的更多,之前也讲过,我们可以求出参数p的后验分布,p的后验分布仍然是一个beta分布,形成一个先验链,通过实验,不断更新参数p的分布的参数。

下一篇,将会讲一下将二项分布扩展到多项式分布,beta分布推广到dirichlet分布的情形,dirichlet分布和多项式分布的共轭是topic model中的重要概念。

你可能感兴趣的:(主题模型,参数估计,共轭)