泊松分布详解

泊松分布

泊松分布(Poisson distribution):

泊松分布是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。常用的泊松分布例子包括:

1. 在某企业中每月发生的事故的次数。

2. 单位时间内到达某一服务柜台(服务站、诊所、超市的收银台、电话总机等)需要服务的顾客人数。

3. 人寿保险公司每天收到的死亡声明的个数。

4. 某种仪器每月出现故障的次数。

泊松分布的条件:

1. 试验是在给定的时间、面积、体积等单位内发生的事件次数。

2. 事件发生在给定的时间、面积、体积等单位内的概率对每一单位都是相同的。

3. 发生在一个时间、面积、体积等单位的事件与发生在其他单位的事件是相互独立的。

(任意相等时间间隔内,事件的平均出现次数是固定的)(任给的两次等待时间是否发生事件是相互独立的)

泊松分布公式:

泊松分布详解_第1张图片

式中,λ为给定的时间间隔内事件的平均数。

泊松分布的期望值与方差分别为:

E(X) = λ

D(X) = λ

实际案例:

假定某企业职工在周一请事假的人数X近似服从泊松分布,且设周一请事假的平均人数为2.5人。要求计算:

1. X的均值与标准差。

2. 在给定的某周一正好请事假是5人的概率。

:(1)由于周一请事假服从泊松分布,根据上面的公式可知,期望以及方差等于λ(平均数)=2.5,因此E(X)=D(X)=2.5,标准差:

(2)X的概率分布:

泊松分布详解_第2张图片

λ=2.5,x=5,

泊松分布详解_第3张图片

*在n重贝努里实验中,当成功的概率很小(即P→0),试验次数很大时,二项分布可近似等于泊松分布,即:

泊松分布详解_第4张图片

在实际应用中,当P≤0.25,n>20,np≤5时,用泊松分布近似二项分布效果良好。

测试代码:

from scipy.stats import poisson
#生成泊松分布,均值为2.5,大小为10 
data = poisson.rvs(mu=2.5, size=10)
print(data) # array([2, 2, 2, 0, 7, 2, 1, 2, 5, 5])
#计算泊松分布概率:周一请事假的平均人数为2.5人,在给定的某周一正好请事假是5人的概率 
print(poisson.pmf(k=5, mu=2.5))

你可能感兴趣的:(机器学习,概率论,python)