方差(variance)
标准差(Standard Deviation)
均方差、均方根值(RMS)
均方误差(MSE)
均方根误差(RMSE)
均值(mean value)是针对既有的数值(简称母体)全部一个不漏个别都总加起来,做平均值(除以总母体个数),就叫做均值.
当然,此法针对小群体做此加总后除以个数得到均值的方法,是很准确无误的,这个得到的均值是准确的,不会有模糊的概念.
但是当这个数群(data group)的数量(numbers)很大很多时,我们只好做个抽样(sampling),并“期望”透过抽样所得到的均值,去预测整个群体的“期望值(expectation value)”.
因此,一旦听到“期望值”,就有了推敲,而推敲或预测(prediction)得来的根据,系按照数学的方法,透过抽样(母体群体中进行部分的小群体随机抽取),而从其均值和演算去预测大群体(母体)的均值,这时的均值不是最准确的,但是符合数学预测推敲的方法(包括信心水准和百分之几的容差内等概率法则)所得的数值,就叫做期望值.
概率论中的方差 用来度量随机变量和其数学期望(即均值)之间的偏离程度。
样本方差,无偏估计、无偏方差(unbiased variance)。对于一组随机变量,从中随机抽取N个样本,这组样本的方差就 是Xi^2平方和除以N-1。这可以推导出来的。
总体方差,也叫做有偏估计,其实就是我们从初高中就学到的那个标准定义的方差,除数是N。
统计中的方差表示方法 :
又常称均方差,是方差的算术平方根,用σ表示。标准差能反映一个数据集的离散程度。 其实方差与标准差都是反映一个数据集的离散程度,只是由于方差出现了平方项造成量纲的倍数变化,比如身高(cm)的方差,变成了身高的平方,无法直观反映身高(cm)的偏离程度。于是出现了标准差。
方差
协方差
描述两个变量的一致性关系
相关系数
Corr(X,Y)= 1的时候,说明两个随机变量完全正相关,即满足Y=aX+b,a>0
考虑Corr(X,X),两个随机变量相同,肯定满足线性关系,此时,Cov(X,X)=Var(X),容易得到Corr(X,Y)=1
Corr(X,Y)= -1的时候,说明两个随机变量完全负相关,即满足Y=-aX+b,a>0
0<| Corr(X,Y)|<1的时候,说明两个随机变量具有一定程度的线性关系。
也称方均根值或有效值,它的计算方法是先平方、再平均、然后开方。
均方差与均方误差(mean squared error,MSE)不同,均方误差是各数据偏离真实值的距离平方和的平均数(预测值和真实值一 一对应的差值的平方和的均值),也即误差平方和的平均数,可用σ表示。均方误差可以用在机器学习中的损失函数,用于预测和回归。均方误差的公式为:
是均方误差的算术平方根。