平均值的标准误差(SEM)

定义

数学公式定义:

σ \sigma σ:样本标准差
n n n:样本数量
σ ′ = σ n \sigma'=\frac{\sigma}{\sqrt{n}} σ=n σ

python公式定义:

# 样本的(无偏估计)标准差/sqrt(样本数量)
sem = np.std(arr,ddof=1) / np.sqrt(len(arr))

区别

标准误差(SD)与平均值标准误差(SEM)之间主要区别在于:

  1. SD量化了分散值之间的差值有多大;

  2. SEM量化了你对总体实际平均值的了解程度。其考虑了SD的值和样本量;

  3. 根据定义,SEM始终小于SD;

随着你的样本量变大,SEM会变小。因为大样本量的平均值可能比小样本量的平均值更接近真实的总体平均值。在一个巨大样本的情况下,即使数据非常分散,你也能非常精确地知道平均值是多少。
即,SEM是衡量样本平均值整体平均值差异的指标。

和中心极限定理的联系

我们知道,满足中心极限定理的情况下,样本分布会满足如下正态分布:

N ( μ , σ 2 n ) N(\mu,\frac{\sigma^2}{n}) N(μ,nσ2)

可以发现,该正态分布的标准差就是我们上文所说的平均值标准差SEM!!!!

你可能感兴趣的:(数学,python)