泊松分布、二项分布与正态分布

从这里学习总结如下,以下内容均来源:http://hongyitong.github.io/2016/11/13/%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83%E3%80%81%E6%B3%8A%E6%9D%BE%E5%88%86%E5%B8%83%E3%80%81%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83/

二项分布:离散概率分布

总共n次,事件发生概率p,其中发生x次概率的概率计算可得:

f\left( x\right) =\dfrac {n!} {x!\left( n-x\right) !}p^{x}\left( 1-p\right) ^{n-x}

二项分布可用于采集在临床研究中死于心脏病的人数、拥挤电梯中在第二层走出电梯的人数,或是某动物种群中携带特定遗传性状的动物数量。

所有试验都是相互独立的,并且每个试验只有成功和失败这两种结果。

 期望值: μ=np
 方差: σ²=np(1-p)

泊松分布:离散概率分布

泊松分布适合在给定一个已知平均值的情况下对固定时间步长内事件的发生次数概率进行建模。这些事件与它们最后一次发生的状态无关。

X 轴上是 0、1、2、3、4(以此类推)等事件的离散值(通常表示事件的发生次数),Y 轴上是现象的发生概率(通常是给定一个已知平均值)。

这些事件可以是十字路口的事故发生次数、出生缺陷数量或一平方公里内驼鹿的数量。

公式:f\left( x;\lambda \right) =\begin{cases} \lambda e^{-\lambda x},x\geq 0\\ 0,x < 0\end{cases}

泊松分布、二项分布与正态分布_第1张图片

e 是自然对数的底。
x 是事件的可能发生次数(正整数)。
λ(即,平均值)是一个正数,代表指定区间内事件的预期发生次数。如果事件在 1 小时内(60 分钟)每 10 分钟发生一次,则 λ 为 6。

泊松分布与二项分布类似,但泊松分布是在不知道事件的可能发生总次数的情况下对小概率事件建模

泊松分布的建模对象是十字路口的事故发生次数,而二项分布的建模对象是事故发生次数与经由十字路口的汽车数量之间的相对关系。

期望值:λ(即,平均值)
 方差:方差σ²与均数λ相等,即σ²=λ

性质:

1)Poisson分布是一种单参数的离散型分布,其参数为λ,它表示单位时间或空间内某事件平均发生的次数,又称强度参数。
2)Poisson分布的方差σ²与均数λ相等,即σ²=λ
3)Poisson分布是非对称性的,在λ不大时呈偏态分布,随着λ的增大,迅速接近正态分布。一般来说,当λ=20时,可以认为近似正态分布,Poisson分布资料可按正态分布处理。
4)Poisson分布的累计概率常用的有左侧累计和右侧累计两种。单位时间或空间内事件发生的次数。

正态分布:连续概率分布

如果存在大量观测值,则随机变量的总和将呈正态分布。

例如,如果多次抛掷硬币,则在一连串抛币动作中硬币正面朝上的次数将接近正态分布。

正态分布的例子包括:某国家的人的身高、某个省的各个高程值以及 12 岁学生的数学考试分数。

注意:正态分布的横轴是不一样的,是连续量,与二项分布和泊松分布对比!!!

 

 

 

你可能感兴趣的:(Deep,Learning,数据分析,人工智能,机器学习,概率论)