详解几个基本概念“标准差&标准误差,方差&均方差”

对于从事数据工作的人来说,经常需要用到方差、标准差、均方差等概念,但即使是一个数学专业的毕业生(比如我自己),经常也会被这几个概念弄得头晕脑胀,使用的时候也是清楚的少,碰运气的多。
这里,我通俗易懂的把这几个概念总结归纳一下,力争弄得清楚,用得明白。

方差(variance)

方差是用来衡量一组数据离散程度的统计量。

σ2=1nin(xix¯)2
其中 xi 为第i个数据, x¯ xi 的平均数。

标准差=均方差

标准差(standard deviation)等同于均方差(mean square error, MSE)。standard deviation英文译为“标准偏离”,事实上,标准差计算一组数据偏离均值的平均幅度,不管这组数据是样本数据还是总体数据。标准差的计算公式为:

σ=1nin(xix¯)2
其中 xi 为每个数据点, x¯ xi 的平均数。
标准差是方差的平方根。

标准差&标准误差

标准差和标准误差往往很难区分。
标准误差(standard error,SE)体现使用样本统计量估计总体参数时的一种估计精度
但是,总体参数往往是不可估计的,因此经常使用样本标准差 s 来估计总体标准误差 σ
标准误差估算值为:

σ=1n1in(xix¯)2
其中 xi 为每个数据点, x¯ xi 的平均数。

标准差表示数据之间差异大小,也即数据精密度的度量,标准误差表示样本平均数和总体平均数的变异程度,可以用来反映结果精密度

你可能感兴趣的:(统计基础)