十分钟学习泊松分布

原文:https://blog.csdn.net/u011893609/article/details/79168100 

这里是我的个人网站: 
https://endlesslethe.com/easy-to-learn-poisson-distribution.html 
有更多总结分享,最新更新也只会发布在我的个人网站上。排版也可能会更好看一点=v=

前言
本文简述了离散型分布,阐明了泊松分布的来源,推导出泊松分布的公式,列举了泊松分布常用的情况,总结了泊松分布相关数值。
1
离散型分布概述
离散型分布包括几何分布、超几何分布、二项分布和泊松分布。其中二项分布和泊松分布最重要。

伯努利试验
对于一个试验(事件),如果重复发生的概率是独立地(上一次的结果不影响这次),那么它是独立试验。特别地,如果这个试验只存在两种结果,则称其为伯努利试验。

随机变量
对于有现实世界意义的数,我们根据意义的不同,将其划分为不同的类,而对于同一类的数,都使用同一个随机变量来称呼。比如,x年x月x日下雨量,我们就可以使用“随机变量X”来称呼;x年x月x日下雨可能性,我们就用“随机变量Y”来称呼。

需要明确的是:

随机变量是一类有相同意义的数,而不是某个数
当使用随机变量作为一个数时,我们需要指定这个随机变量。比如“2017年1月25日下雨量”在数学上才是一个具体的值。
随机变量不一定能用除一一映射以外的方式拟合
几何分布
对于重复n次的伯努利试验,我们可以计算“首次为1是出现在第K次试验”:Pk=pq(k−1)Pk=pq(k−1) 
如果一个随机变量X取值1, 2, …, k时对应的值满足上式,则称X服从参数为P的几何分布,记作X∼G(p)X∼G(p)
超几何分布
袋中有N个球,其中m个为红球,余下的是白球。从袋中一次取n个球,“恰有k个红球”的概率: 
Pk=CkmCn−kN−mCnN
Pk=CmkCN−mn−kCNn

对于满足上式的随机变量X,称X服从超几何分布,记作X∼H(n,m,N)X∼H(n,m,N)
二项分布
对于重复n次的伯努利试验,我们可以计算“成功k次”的概率:Pk=Cknpk(1−p)n−kPk=Cnkpk(1−p)n−k 
对于满足上式的随机变量X,称X满足二项分布,即为X∼B(n,p)X∼B(n,p)
01分布
特别地,当n=1,即只重复一次伯努利试验时,我们将其称为01分布。(随机变量X只有两个结果)

泊松分布的直观理解
泊松分布是用来描述某段时间内事件的发生概率。 


我们先假设是从某一时刻起(X=x)的t个单位时间内。我们已知的是单位时间内事件发生的概率p。 
那么在t个单位时间时事件发生k次的可能性(比如前来看病的人数为k),是满足二项分布的: 
Pk=P(X=k)=Cknpk(1−p)n−k
Pk=P(X=k)=Cnkpk(1−p)n−k
通过二项分布,我们可以计算单位时间的整数倍时刻,事件发生k次的可能性。 
而为了得到第1.2t个单位时间内事件发生的次数,我们需要缩小单位时间,并同等缩小事件发生概率p,比如
tnew=t10,pnew=p10,nnew=n10
tnew=t10,pnew=p10,nnew=n10
故当t取无限小时,可以计算出泊松分布公式:P(X=k)=λke−λk!P(X=k)=λke−λk! 
λ=npλ=np,为在时间段内事件发生次数的期望。

λλ越大,时间段内事件的平均发生次数会增加。

泊松分布的公式推导
泊松分布公式:P(X=k)=λke−λk!P(X=k)=λke−λk! 


泊松分布的用途
泊松分布可以作为二项分布的近似
许多随机变量服从泊松分布,如某医院一天内的就诊人数,一段时间内一个网站的登陆人数,某路口一段时间内通过的车辆数
泊松分布的相关数值
期望:E(X)=λE(X)=λ 
方差:D(X)=λD(X)=λ 
具体推导见参考文献“泊松分布的期望和方差推导”

变异系数:Cv=1√λCv=1√λ 
极大似然估计值:λ^=x¯λ^=x¯ 
具体推导见参考文献“最大似然估计法”

泊松分布和正态分布的关系
泊松分布和正态分布(高斯分布)都是由二项分布推导出,但基本没什么关系…

参考文献
I. 《概率论与数理统计(第二版)》 陈鸿建著 
II. 泊松分布和指数分布:10分钟教程 
III. 泊松分布的来源—公式推导—应用 
IV. 泊松分布(Poisson distribution)的简单认识 
V. 泊松分布的期望和方差推导 
VI. 最大似然估计法 
VII. 二项分布, 泊松分布和正态分布之间的关系
 

你可能感兴趣的:(数学)