伯努利分布、二项分布、几何分布、超几何分布、泊松分布

导语

       对于任何一个学习概率论的童鞋来说,各种分布都是很头痛的一件事情,本篇主要讨论的是离散型随机变量.

伯努利分布

       伯努利分布就是我们常见的0-1分布,即它的随机变量只取0或者1,各自的频率分别取 1p p ,当 x=0 或者 x=1 时,我们数学定义为:

p(x)=px(1p)1x

       其它情况下 p(x)=0 ,伯努利分布是一个非常好理解的分布,也是很多其它分布的基础。

离散型随机变量期望: E(x)=xp(x)
方差: D(x)=E(x2)E2(x)

       对于伯努利分布来说, E(x)=1p+0(1p)=p,D(x)=12pp2=p(1p)

二项分布

       二项分布是这样一种分布,假设进行n次独立实验,每次实验“成功”的概率为 p ,失败的概率为 1p ,所有成功的次数 X 就是一个参数为 n p 的二项随机变量.数学公式定义为:

p(k)=(nk)pk(1p)nk

       二项分布公式基于伯努利分布得到,因为二项分布中每项实验都是独立的,因此每一次实验都是一次伯努利实验,在 n 次实验中,成功 k 次,排列方式有 (nk) 种,根据乘法原理,即可得到二项分布的公式。

话外:对于均值和方差的计算, Xi 是标准的伯努利分布,总发生次数 X=n1Xi ,所以 E(X)=E(n1Xi)=n1E(Xi)=np ,同理方差 D(x)=n1D(Xi)=np(1p)

几何分布和负二项分布

       这是一个比较简单的分布,其中负二项分布是几何分布的一般形式,几何分布与二项分布类似,也是由 n 次伯努利分布构成,随机变量 X 表示第一次成功所进行试验的次数,则

p(k)=P(X=k)=p(1p)k1,k=1,2,3,...

       负二项分布是几何分布的一般形式,表示直到成功r次停止,显而易见,当r=1时,它就是几何分布,则
P(X=k)=(k1r1)pr(1p)kr

关于几何分布的期望与方差, E(X)=1/p D(x)=(1p)/p2 ,关于期望的证明, E(X)=n=1npqn1=pn=1(qn)=p(n=1qn)=1/p ,方差证明与期望证明类似,不再赘述…

超几何分布

       非常常见的一种分布,常用来表示在 N 个物品中有指定商品 M 个,不放回抽取 n 个,抽中指定商品的个数,即 X ~ H(N,n,M) ,则抽中k件的概率为:

p(k)=P(X=k)=(Mk)(NMnk)(Nn)

       实际应用中超几何分布例子很多,比如彩票开奖你所符合的数字个数等。

泊松分布

       泊松分布是离散型随机变量分布中相对较难的一种,泊松频率函数定义为:

P(X=k)=λkeλk!k=0,1,2,3,...

       泊松分布是二项分布的极限形式,可有二项分布概率公式推导得出,其中 λ=np ,当 n>>p 时,
p(k)=(nk)pk(1p)nk=n!pk(1p)nkk!(nk)!=n!(λn)k(1λn)nkk!(nk)!=λkk!n!(nk)!k!(1λn)n(1λn)k

n -> 时, λn ->0, n!(nk)!k! ->1, (1λn)n -> eλ (1λn)k ->1,所以
p(k)>λkeλk!

泊松分布的期望和方差均为 λ ,证明过程严格按照定义即可,注意在证明过程中使用到了 eλ

       泊松分布主要用来研究单位时间或单位空间内某时间的发生次数,同时事件的发生必须是相互独立的,比如单位时间内通过某一交通灯的车辆数等。 λ 大概等于20时,泊松分布基本可以近似为正态分布进行处理。
       泊松分布用来衡量事件的稳定性是一个不错的方法,再配合一些统计学上的检验方法,能够做很多东西,在之后的连续型随机变量中,有一种分布叫指数分布,它与泊松分布密不可分,可由泊松分布推导出…..敬请期待.

你可能感兴趣的:(数据分析,数据分析)