多项式分布的理解概率公式的理解

多项式分布是二项分布的推广。二项分布(也叫伯努利分布)的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。而多项分布就像扔骰子,有6个面对应6个不同的点数。二项分布时事件X只有2种取值,而多项分布的X有多种取值,多项分布的概率公式为  

多项式分布的理解概率公式的理解_第1张图片

 这个公式看上去像是莫名其妙地冒出来的,想要了解它首先必须要知道组合数学中的多项式定理。

多项式定理:当n是一个正整数时,我们有  


 其中 

这个多项式定理的推导如下,将式子左边展开


上面的式子是由n个因子相乘得到,而它的展开式可以看做在每个式子里选取某一个xi,总共选取n个xi相乘,所以所有的展开式项都会有


这样的公有项,而且

这样的话,我们可以把问题看成在n个式子里,先选取r1个x1,然后选取r2个x2,最后选取rk个xk,然后求有多少种方法。类似把n 个球放到k个不同的盒子里的方法有多少种,我们得到 


所以的系数为,这样,我们就能得到展开式的通式。举个例子,当k=2时,我们就得到了常见的二项式公式:


再来看之前的多项分布的概率公式,假设发生的概率为,由于事件之间是相互独立的,可得

我们将式子的左边看做一次抽样各种事件发生的概率和,那么则是进行了n次抽样所有事件相互组合的对应概率和。把这个多项式展开,它的每一项都对应着一个特殊事件的出现概率。我们把展开式的通项作为X1出现x1次,X2出现x2次,…,Xk出现xk次的这种事件的出现概率,这样就得到了多项分布的概率公式。

转自:http://www.crescentmoon.info/?p=9#more-9


你可能感兴趣的:(机器学习,数理统计)