概率论与数理统计:六大基本分布及其期望和方差

绪论:

概率论中有六大常用的基本分布,大致可分成两类:离散型(0-1分布、二项分布、泊松分布),连续型(均匀分布、指数分布、正态分布)。

补充:

在进入正文之前先讲一下期望和均值的一些区别:

       期望和均值都具有平均的概念,但期望是指的随机变量总体的平均值,而均值则是指的从总体中抽样的样本的平均值,即前者是理想的均值,而后者则是实际观测出来的数据的均值。例如:对于一个六面的骰子,其期望E = (1+2+3+4+5+6)/ 6 = 3.5。然后掷5次骰子,每次掷的点数分别为 1,3,5,5,1,则平均值为(1+3+5+5+1)/ 5 = 3。可以发现两者并不相等。

       方差(variance):方差是各个数据与平均数之差的平方的平均数,方差度量了随机变量与期望(也可说均值)之间的偏离程度。标准差为方差的开根号。

       协方差(Covariance):用于衡量两个变量之间的误差,而方差是协方差的特殊情况,即当两个变量相同的情况。其公式如下:,表示含义为:E(∑(“X与其均值之差” * “Y与其均值之差” ))

当协方差为正时:表示两变量正相关(即同时变大变下)。

当协方差为负时:表示两变量负相关(即你变大,我变小,反之亦然)。

当协方差为0时:两变量相互独立。

       相关系数:其公式如下,表示的含义为用X和Y的协方差除以X和Y的标准差。所以相关系数也可以看成协方差,一种剔除两个变量量纲影响,标准化后的特殊协方差。

正文:

1、0-1分布

      已知随机变量X,其中P{X=1} = p,P{X=0} = 1-p,其中 0 < p < 1,则成X服从参数为p的0-1分布。

      其中期望为E(X) = p    方差D(X) = p(1-p);

2、二项分布

       n次独立的伯努利实验(伯努利实验是指每次实验有两种结果,每种结果概率恒定,比如抛硬币)。

       其中期望E(X) = np     方差D(X) = np(1-p);

3、泊松分布

        表示单位时间内某稀有事件发生k次的概率,其公式为

         其中方差和期望均为, 详细了解请☞戳

4、均匀分布

          若连续型随机变量X具有概率密度,则称X在(a,b)上服从均匀分布

           其中期望E(X) = (a+b)/ 2 ,方差D(X) = (b-a)^2 / 12。

5、指数分布

6、正态分布

      

你可能感兴趣的:(机器学习)