二项分布、伯努利分布、泊松分布等

这个知识点的整理起源于vivo图像算法岗的视频面试,项目问了没几句,也没提到核心部分,后面问数学知识问死了==

 

一、伯努利分布

伯努利分布亦称“零一分布”、“两点分布”。

如果随机变量X只取0和1两个值,并且相应的概率为:

                                          

则称随机变量X服从参数为p的伯努利分布,若令q=1一p,则X的概率函数可写为:

                                                     

伯努利实验:

如果无穷随机变量序列  是独立同分布(i.i.d.)的,而且每个随机变量  都服从参数为p的伯努利分布,那么随机变量

  就形成参数为p的一系列伯努利实验。同样,如果n个随机变量  独立同分布,并且都服从参数为p的伯努利分布,则随机变量  形成参数为p的n重伯努利试验

 

二、二项分布

二项分布就是重复n次独立的伯努利试验。

       举个实例,最简单的抛硬币试验就是伯努利试验,在一次试验中硬币要么正面朝上,要么反面朝上,每次正面朝上的概率都一样p=0.5,且每次抛硬币的事件相互独立,即每次正面朝上的概率不受其他试验的影响。如果独立重复抛n=10次硬币,正面朝上的次数k可能为0,1,2,3,4,5,6,7,8,9,10中的任何一个,那么k显然是一个随机变量,这里就称随机变量k服从二项分布

       n次抛硬币中恰好出现k次的概率为

                                                            P(X=k) = C(n,k) * pk*(1-p)n-k

记作X~B(n,p)。

总结:伯努利分布、两点分布、0-1分布这三种分布是同一个分布的不同名称,又都是二项分布在n=1时的特例。

三、泊松分布

即Poisson分布。

二项分布中,当n趋于无穷大时,p趋于0,此时事件发生的概率是服从泊松分布的。(注意下图是n+1-k)

è¿éåå¾çæè¿°

泊松分布的期望是λ, 方差也是λ

k表示事件的总数,λ表示某事件出现的次数,上述公式表示k次中出现λ次某现象的概率;

泊松分布的理解:

日常生活中,大量事件是有固定频率的:超市平均每天销售*包奶粉;网站平均每分钟有*次访问;

特点就是我们可以预估这些事件的总数,但没法知道具体的发生时间。已知平均每分钟有2次访问,下分钟有几次访问是无法知道的。

泊松分布就是描述某段时间内,事件具体的发生概率。

一个事件在一段时间内随机发生,其服从泊松分布的条件为: 
(1)将该时间段无限分隔成很多个小的时间段,在这个小的时间段内,事件发生的概率非常小,不发生的概率非常大。 
(2)在每个小的时间段内,事件发生的概率是稳定的,且与小的时间段的长度成正比。 
(3)该事件在不同的小时间段里,发生与否相互独立。

 

四、高斯分布

也称正态分布(Normal distribution)或常态分布。

若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:

XN(μ,σ2),

则其概率密度函数为

f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{- {{(x-\mu )^2 \over 2\sigma^2}}}

正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布

σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

你可能感兴趣的:(数学)