标准差和标准误差
标准差(standard deviation)和标准误差(standard error of mean)
根据国际标准化组织(ISO)的定义:标准差σ是方差σ2的正平方根;而方差是随机变量期望的二次偏差的期望。
什么是标准误差(standard error)呢?通常来说有两种定义方式:
样本容量为的标准误差是样本的标准差除以。有人用样本的标准差除以n来作为标准误差(如果标准误差是基于总体均值来估计标准差,所以也没有必要说人家错);
一个统计量的标准误差还可以用估计误差的标准差来刻画即:。
下文编辑学报郝拉娣的《标准差与标准误》
标准差作为随机误差(或真差) 的代表,是随机误差绝对值的统计均值。在国家计量技术规范中,标准差的正式名称是标准偏差,简称标准差,用符号表示。标准差的名称有10 余种,如总体标准差、母体标准差、均方根误差、均方根偏差、均方误差、均方差、单次测量标准差和理论标准差等。
标准差的定义式为:
由于上式中含有的参数:总体算术平均数 ( 亦称数学期望 , 或称真值) 和总体数, 是不能进行实际计算的 ,因此,上式只有理论上的意义, 无法求出; 而经常采用的方法是用样本参数来估计总体的参数 ,即用样本标准差 的值作为总体标准差的估计值。
用样本标准差的值作为总体标准差的估计值。样本标准差的计算公式为:
式中 : 为样本算术平均数( 以下简称平均数); 为观测样本数。反映了整个样本变量的分散程度 。样本标准差小 ,说明样本变量的分布比较密集在平均数附近,否则 ,表明样本的分布比较离散。当时, 趋向于。
样本平均数的标准误及其估计
在抽样试验( 或重复的等精度测量) 中 ,常用到样本平均数的标准差,亦称样本平均数的标准误或简称标准误( standard error of mean) 。因为样本标准差不能直接反映样本平均数与总体平均数究竟误差多少, 所以, 平均数的误差实质上是样本平均数与总体平均数之间的相对误差。可推出样本平均数的标准误为
与总体标准差类似 ,样本平均数的标准误也无法求出,只能估计。为了区别是用样本标准差的值来估计总体标准差的值, 样本平均数的标准误的估计值用表示( 也称平均数的标准偏差 ),即
反映了样本平均数的离散程度。标准误越小, 说明样本平均数与总体平均数越接近, 否则 ,表明样本平均数比较离散。当时 , 趋向于
在表达有随机误差的实验结果数据中 , 我们常见到“平均数 ±标准差” 中的“标准差” , 实际上是指总体标准差的估计值,在以下的讨论中如无特别指明 ,标准差均指样本标准差。
标准差与标准误的区别
标准差与标准误的意义、作用和使用范围均不同。标准差( 亦称单数标准差) 一般用表示, 是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标 ; 而标准误一般用表示, 反映样本平均数对总体平均数的变异程度, 从而反映抽样误差的大小 ,是量度结果精密度的指标。
随着样本数( 或测量次数)的增大 , 标准差趋向某个稳定值,即样本标准差越接近总体标准差σ,而标准误则随着样本数( 或测量次数)n 的增大逐渐减小,即样本平均数越接近总体平均数 μ; 故在实验中也经常采用适当增加样本数( 或测量次数) 减小的方法来减小实验误差, 但样本数太大意义也不大 。
标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度; 标准误一般用于统计推断中, 主要包括假设检验和参数估计 ,如样本平均数的假设检验、参数的区间估计与点估计等[ 3]。
标准差与标准误既有明显区别 ,又密切相关: 标准误是标准差的 ; 二者都是衡量样本变量(观测值) 随机性的指标, 只是从不同角度来反映误差 ;M 、S . D . 、S . E . 分别是平均数 mean 、标准差standarddeviation 、标准误 standarderror 的英文缩写。
GB 3358 —82《统计学名词及符号的规定》已对一些常用统计学符号作了明确规定: 统计学符号一般用斜体, 但有大小写之分,如( 样本大小)、( 样本的算术平均数)、( 标准差)、 ( 标准误)、 ( 平均数 ±标准差)、 ( 平均数 ±标准误) 等 。因此, 正确的表示是:“平均数 ±标准差”为“” ; “平均数 ±标准误”为“” 。而英文 ”和用中文“平均数±标准差”“平均数±标准误”都属于用量名称表示, 除此之外 ,均属于不正确的表示