方差、标准差、均方差、均方根值、均方误差、均方根误差

方差(variance)

标准差(Standard Deviation)

均方差、均方根值(RMS)

均方误差(MSE)

均方根误差(RMSE)

均值和期望

均值(mean value)是针对既有的数值(简称母体)全部一个不漏个别都总加起来,做平均值(除以总母体个数),就叫做均值.
当然,此法针对小群体做此加总后除以个数得到均值的方法,是很准确无误的,这个得到的均值是准确的,不会有模糊的概念.


但是当这个数群(data group)的数量(numbers)很大很多时,我们只好做个抽样(sampling),并“期望”透过抽样所得到的均值,去预测整个群体的“期望值(expectation value)”.


因此,一旦听到“期望值”,就有了推敲,而推敲或预测(prediction)得来的根据,系按照数学的方法,透过抽样(母体群体中进行部分的小群体随机抽取),而从其均值和演算去预测大群体(母体)的均值,这时的均值不是最准确的,但是符合数学预测推敲的方法(包括信心水准和百分之几的容差内等概率法则)所得的数值,就叫做期望值.

 

方差(variance)-----一组数据的波动大小

 概率论中的方差 用来度量随机变量和其数学期望(即均值)之间的偏离程度。

       样本方差,无偏估计、无偏方差(unbiased variance)。对于一组随机变量,从中随机抽取N个样本,这组样本的方差就 是Xi^2平方和除以N-1。这可以推导出来的。

                                                      

      总体方差,也叫做有偏估计,其实就是我们从初高中就学到的那个标准定义的方差,除数是N。

                                                           

   统计中的方差表示方法 :  

                                                          

标准差(Standard Deviation)---数据的大概波动范围

又常称均方差,是方差的算术平方根,用σ表示。标准差能反映一个数据集的离散程度。  其实方差与标准差都是反映一个数据集的离散程度,只是由于方差出现了平方项造成量纲的倍数变化,比如身高(cm)的方差,变成了身高的平方,无法直观反映身高(cm)的偏离程度。于是出现了标准差。

                               

                  

 

协方差

方差

协方差  

描述两个变量的一致性关系

相关系数

方差、标准差、均方差、均方根值、均方误差、均方根误差_第1张图片

Corr(X,Y)= 1的时候,说明两个随机变量完全正相关,即满足Y=aX+b,a>0

考虑Corr(X,X),两个随机变量相同,肯定满足线性关系,此时,Cov(X,X)=Var(X),容易得到Corr(X,Y)=1

Corr(X,Y)= -1的时候,说明两个随机变量完全负相关,即满足Y=-aX+b,a>0

 0<| Corr(X,Y)|<1的时候,说明两个随机变量具有一定程度的线性关系。

 

均方根值(RMS)----

也称方均根值或有效值,它的计算方法是先平方、再平均、然后开方。

                                                  

均方误差(mean squared error,MSE)----一组预测值与真实值的误差的波动大小

均方差与均方误差(mean squared error,MSE)不同,均方误差是各数据偏离真实值的距离平方和的平均数(预测值和真实值一  一对应的差值的平方和的均值),也即误差平方和的平均数,可用σ表示。均方误差可以用在机器学习中的损失函数,用于预测和回归。均方误差的公式为:
                                                                      

均方根误差(RMSE)-----一组预测值与真实值的误差的波动范围

是均方误差的算术平方根。

                                                                         

 

你可能感兴趣的:(基础数学)