对于任何一个学习概率论的童鞋来说,各种分布都是很头痛的一件事情,本篇主要讨论的是离散型随机变量.
伯努利分布就是我们常见的0-1分布,即它的随机变量只取0或者1,各自的频率分别取 1−p 和 p ,当 x=0 或者 x=1 时,我们数学定义为:
离散型随机变量期望: E(x)=∑x∗p(x)
方差: D(x)=E(x2)−E2(x)
对于伯努利分布来说, E(x)=1∗p+0∗(1−p)=p,D(x)=12∗p−p2=p(1−p)
二项分布是这样一种分布,假设进行n次独立实验,每次实验“成功”的概率为 p ,失败的概率为 1−p ,所有成功的次数 X 就是一个参数为 n 和 p 的二项随机变量.数学公式定义为:
话外:对于均值和方差的计算, Xi 是标准的伯努利分布,总发生次数 X=∑n1Xi ,所以 E(X)=E(∑n1Xi)=∑n1E(Xi)=n∗p ,同理方差 D(x)=∑n1D(Xi)=n∗p∗(1−p)
这是一个比较简单的分布,其中负二项分布是几何分布的一般形式,几何分布与二项分布类似,也是由 n 次伯努利分布构成,随机变量 X 表示第一次成功所进行试验的次数,则
关于几何分布的期望与方差, E(X)=1/p , D(x)=(1−p)/p2 ,关于期望的证明, E(X)=∑∞n=1n∗p∗qn−1=p∗∑∞n=1(qn)′=p∗(∑∞n=1qn)′=1/p ,方差证明与期望证明类似,不再赘述…
非常常见的一种分布,常用来表示在 N 个物品中有指定商品 M 个,不放回抽取 n 个,抽中指定商品的个数,即 X ~ H(N,n,M) ,则抽中k件的概率为:
泊松分布是离散型随机变量分布中相对较难的一种,泊松频率函数定义为:
泊松分布的期望和方差均为 λ ,证明过程严格按照定义即可,注意在证明过程中使用到了 eλ的泰勒展开
泊松分布主要用来研究单位时间或单位空间内某时间的发生次数,同时事件的发生必须是相互独立的,比如单位时间内通过某一交通灯的车辆数等。 λ 大概等于20时,泊松分布基本可以近似为正态分布进行处理。
泊松分布用来衡量事件的稳定性是一个不错的方法,再配合一些统计学上的检验方法,能够做很多东西,在之后的连续型随机变量中,有一种分布叫指数分布,它与泊松分布密不可分,可由泊松分布推导出…..敬请期待.