(0-1)分布
设随机变量X只可能取0和1的两个值,他的分布律是,
则称 X 服从以p为参数的(0-1)分布或者两点分布。
分布律:
X | 0 | 1 |
Pk | 1-p | p |
伯努利(Bernoulli)实验、二项分布
设实验 E 只有两个可能结果:A和,则称 E 为伯努利实验。
设P(A) = p (0
) = 1 - p,将 E 独立重复地进行 n 次,则称这一串重复的独立实验为 n 重伯努利实验。
这里“重复”是指在每次实验中 P(A) = p 保持不变:“独立”是指各次实验的结果互不影响,即若以 记第 i 次实验的结果,
为 A 或
,i = 1,2,·····,n。“独立”是指
分布律:假设在前 k 次实验中 A 发生,而后 n-k 次实验中 A 不发生的概率为 ,这种指定的方式共用
种。故在 n 次实验中 A 发生 k 次的概率为
,记 q = 1-p,即有
,看= 0, 1, 2,····,n;
显然
由于 刚好是二项式
的展开式中出现
的那一项。我们也称随机变量 X 服从参数为 n, p 的二项分布。
特别的:当 n=1 时,二项分布式化为 , k = 0, 1。
泊松分布(描述某段时间内,事件具体的发生概率)
在实际应用过程中,很多时间具有固定的频率。
某医院平均每小时出生3个婴儿
某一地区一个时间间隔内发生交通事故的次数
某公司平均每10分钟接到1个电话
某超市平均每天销售4包xx牌奶粉
某网站平均每分钟有2次访问
上面这些事件的特点是,我们可以预估事件发生的总数,但是没法知道具体的发生时间。已知每年发生的交通事故,那么下一年会发生多少起呢?这个没法知道。
均匀分布
指数分布
指数分布是事件的时间间隔的概率。下面这些都属于指数分布。
婴儿出生的时间间隔
来电的时间间隔
奶粉销售的时间间隔
网站访问的时间间隔
指数分布的公式可以从泊松分布推断出来。如果下一个婴儿间隔时间 t ,就等同于 t 之内没有任何婴儿出生。
反过来,事件在时间 t 之内发生的概率(至少出生一个的概率),就是1减去上面的值。
接下来15分钟,会有婴儿出生的概率是52.76%。
接下来的15分钟到30分钟,会有婴儿出生的概率是24.92%。
指数分布的图形大概是下面的样子。
可以看到,随着间隔时间变长,事件的发生概率急剧下降,呈指数式衰减。想一想,如果每小时平均出生3个婴儿,上面已经算过了,下一个婴儿间隔2小时才出生的概率是0.25%,那么间隔3小时、间隔4小时的概率,是不是更接近于0?
指数分布的概率密度为:
式中:x是给定的时间;λ为单位时间事件发生的次数;e=2.71828。
指数分布概率密度曲线如下图:
指数分布具有以下特征:
(1)随机变量X的取值范围是从0到无穷;
(2)极大值在x=0处,即f(x)=λ;
(3)函数为右偏,且随着x的增大,曲线稳步递减;
(4)随机变量的期望值和方差为µ=1/λ,σ2=1/λ2。
通过对概率密度函数的积分,就可以得到相应的概率,其表达式有两种
P(X≥x)=e-λx
P(X≤x)=1-e-λx
例:某电视机生产厂生产的电视机平均10年出现大的故障,且故障发生的次数服从泊松分布。
问(1)该电视机使用15年后还没有出现大故障的比例;(2)如果厂家想提供大故障免费维修的质量担保,但不能超过全部产量的20%,试确定提供担保的年数。
解:
(1)设X为电视机出现大故障的时间。已知µ=10年,则λ=1/µ=0.1,于是,P(X≥x)=e-λx=e-0.1*15≈0.223。则15年后,没有出现大故障的电视机约占22.3%。
(2)问题要求比例不超过20%,这是求X的右侧概率面积,现在根据公式确定适当的X值。
电视机各年累计出现的故障比例 |
|
担保年数X |
累计概率P(X≤x)=1-e-λx |
1 |
0.095 |
2 |
0.181 |
3 |
0.259 |
从表中可以看到:担保2年时,出现大故障的比例是18.1%,不超过20%。担保3年时,出现大故障的比例为25.9%,已经超过20%。所以,厂家应以2年为担保期。
高斯分布,正态分布
透彻理解高斯分布
- 泊松分布 & 指数分布