本文给可供有兴趣的高中生以及大一新生了解统计学的几种特殊分布及它们之间的关系。由于篇幅所限,文章重点在于解释其内在联系,对于较为繁琐的推导进行了略去。有兴趣的同学可以自行查找更多资料。
此外,大学课程中推导数学期望和方差,更多地用到矩量母函数(Moment Generating Function,简称mgf);但考虑本文的内容本就比较基础,笔者尽量采用了更朴素的方法求解。
常见的取球模型,是高中内容,详见:
Forward Star:超几何分布的数学期望与方差推导zhuanlan.zhihu.com当球趋近于无穷时,超几何分布可看做二项分布。
超几何分布与二项分布不同的地方在于:超几何分布是取出不放回,因此每次抽取的概率是不同的;二项分布则是取出放回,因此每次抽取概率相同。换言之,超几何分布的概率受“抽取”这一过程的干预,而二项分布则更多为自然现象等,不受抽取过程的干预。
二项分布也可看做超几何分布中
注意无论是二项分布和超几何分布,其每次试验都只有两种结果。
二项分布的各种推导略。不过从二项分布中,我们也可以发现一些有趣的性质,详见:
Forward Star:从递推与多项式的角度理解二项分布zhuanlan.zhihu.com这个是二项分布的退化版,相当于二项分布的单次试验,二项分布也可称为
负二项分布则是在二项分布的基础上,已经确定最后一次抽取的结果。这最常见的就是比赛问题。在高中时,我们遇到比赛问题往往是分类讨论;对于五局三胜问题,我们讨论三回合结束、四回合结束、五回合结束的情况,从而汇总为某方胜利的概率。实际上,这种“
由于限定了最后一次抽取的结果,那么这时我们只能考虑前
期望
其实也就是刚刚负二项分布的
期望和方差代入上述负二项分布,令
上述分布基本都是高中内容,从这里开始就真正进入大学内容了。
我们说当超几何分布的
然而这个式子在数学上非常不好计算,我们看看能不能把
回归到
怎么办?连续问题离散化!把线段分成无穷多份。那么此时,就出现了
那此时
即:
泊松分布的期望和方差都是
上述分布都是离散分布,到这里开始就是连续分布了。
指数分布和几何分布有些类似,是“等待时间”。但是几何分布中
既然是等待时间,那么在这段时间自然是不允许出现期望的事件,所以对应着泊松分布的
这里就又要追溯回
这一步转化有一定的理解难度,就好比原先二项分布中只有
上述为指数分布和泊松分布的联系,我们又提到过指数分布和几何分布有些类似,那么能不能从几何分布的角度来理解呢?
我们用类似于泊松分布的方法,把几何分布的
我们令
而
由于符合指数形式,这种分布称为指数分布,和几何分布的形式有几分相似。实际表示中我们常把
在泊松分布中,我们把连续问题离散化。因此在求期望时,我们看到的仍是求和符号。连续分布则不然,是积分号了。因此它的期望不再像几何分布一般用错位相减,而是:
因此其期望为
另外,指数分布的方差为