方差、标准差、均方根误差

一、方差

在概率论中用方差来衡量随机变量和其数学期望(均值)之间的偏离程度,统计中的方差(样本方差)是各个数据分别与其平均数之差的平方和的均值。

许多实际问题中,方差用来衡量数据的偏离程度。

对于一组随机变量后统计数据,期望E(X)是随机变量的均值,对数据和均值求差再求和,之后再取平均,就得到了方差公式。

D(X)=E[Σ(XE(X))2]=1Ni=1N(Xiμ)2 D ( X ) = E [ Σ ( X − E ( X ) ) 2 ] = 1 N ∑ i = 1 N ( X i − μ ) 2

概率论中方差的表示方法:

样本方差:无偏估计、无偏方差,对于一组随机变量,从中随机抽取N个样本,这组样本的方差如下所示,如果分母为n的话,对样本的方差估计就不是无偏估计了,比总体方差要小,一般实际中应用样本方差。

s2=1n1i=1n(XiX¯¯¯¯) s 2 = 1 n − 1 ∑ i = 1 n ( X i − X ¯ )

总体方差:也叫有偏估计:

s2=1ni=1n(XiX¯¯¯¯) s 2 = 1 n ∑ i = 1 n ( X i − X ¯ )

统计学中的方差:

σ2=(Xμ)2N σ 2 = ∑ ( X − μ ) 2 N

二、标准差

对方差开根号

σ=1Ni=1N(Xiμ)2 σ = 1 N ∑ i = 1 N ( X i − μ ) 2

既然有了方差来描述变量与均值的偏离程度,那又搞出来个标准差干什么呢?

原因是:方差与我们要处理的数据的量纲是不一致的,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。

举个例子:一个班级里有60个学生,平均成绩是70分,标准差是9,方差是81,成绩服从正态分布,那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分,通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826,即约等于下图中的34.2%*2

方差、标准差、均方根误差_第1张图片

三、均方误差、均方根误差

均方根误差RMSE:各个数据偏离真实值的距离的平方和,再开方

均方误差MSE:各个数据偏离真实值的距离的平方和

标准差:各个数据偏离均值的距离的平方,再开方(也叫均方差)

方差:各个数据偏离均值的距离的平方

MSE=(xix^i)2N M S E = ∑ ( x i − x ^ i ) 2 N

RMSE=1N(xix^i)2 R M S E = 1 N ∑ ( x i − x ^ i ) 2

均方根值(RMS):也称有效值

XRMS=1N(X21+X22+...X2N) X R M S = 1 N ( X 1 2 + X 2 2 + . . . X N 2 )

比如幅度为100V而占空比为0.5的方波信号,如果按平均值计算,它的电压只有50V,而按均方根值计算则有70.71V。这是为什么呢?举一个例子,有一组100伏的电池组,每次供电10分钟之后停10分钟,也就是说占空比为一半。如果这组电池带动的是10Ω电阻,供电的10分钟产生10A的电流和1000W的功率,停电时电流和功率为零。

也就是说均方根值反映的是有效值而不是平均值,它具有一定的实际(物理)意义。

你可能感兴趣的:(算法基础)