EXCEL描述统计输出详解:标准误、置信度、偏度、峰度和JB检验

本文介绍EXCEL描述统计输出的各个细节,主要围绕标准差相关指标展开。包括:

  1. 解释标准差、标准误差、置信度之间的关系
  2. 介绍各指标在EXCEL中如何单独计算
  3. 介绍各指标的统计学公式
  4. 重点强调一下峰度和偏度在EXCEL中的底层计算公式
  5. 顺便一提基于峰度和偏度的正态分布检验:Jarque-Bera检验

进入正文…

EXCEL-数据-数据分析-描述统计,得出以下输出。图中蓝色框体为EXCEL输出,右侧为EXCEL中指标单独计算公式。
EXCEL描述统计输出详解:标准误、置信度、偏度、峰度和JB检验_第1张图片

1.标准差、标准误差与置信度

标准差、方差、标准误差、置信度中,关键指标为标准差,已知标准差和其他相关信息(观测数、置信水平)可相应计算出其他三个指标。具体来说:
方差=标准差²
标准误差=标准差/sqrt(观测数)
置信度=t分位数*标准误差,注意是t分布而不是正态分布
其中t分位数在第2部分中介绍。

2. EXCEL中如何单独计算

EXCEL中对每一指标都有对应公式可单独计算,如果只想获得其中某指标,大可不必上整套描述统计。
其中:
方差=var(数据)
标准差=stdev(数据)
峰度=kurt(数据)
偏度=skew(数据)
这里需要注意的是,以上均为样本指标,即计算所得为样本方差、样本标准差…而计算总体指标,对应函数一般后缀.p,例如var.p(数据)计算总体方差。
p即population(总体),很好理解。
另外,StDev即standard deviation,我总是容易写错。

另外关于t分位数函数, EXCEL中分单双尾:
1) 单尾:t.inv(概率,自由度),计算左分位数。例如t.inv(0.025,11)=-2.20,计算左0.025分位数。

2) 双尾:t.inv.2t(概率,自由度),计算双尾分位数。例如t.inv.2t(0.05,11)=2.20。与上面单尾绝对值相同。t分布为对称分布,意会一下。

顺便一提,若计算某分位数概率,则函数为t.dist()和t.dist.2t()。可结合上面的分位数函数,探究这两个函数的用法。

3. 统计学公式

各指标的定义公式
EXCEL描述统计输出详解:标准误、置信度、偏度、峰度和JB检验_第2张图片
这里要注意的是,样本标准差分母为n-1,如此才是总体标准差的无偏估计。其他相关公式中出现样本标准差,也都是n-1。

4. 峰度和偏度在EXCEL中的底层计算公式

EXCEL描述统计输出详解:标准误、置信度、偏度、峰度和JB检验_第3张图片
样本偏度、峰度均在总体偏度、峰度公式上有一个系数调整,以达成无偏估计。其中:
正态分布偏度为0,峰度为3。
偏度大于0为右偏,反之为左偏;
峰度大于3为厚尾(fat tail),反之为thin tail。
通常将计算所得峰度减3,以使峰度指标跟偏度一样,以0为界。而在EXCEL计算中,不直接减3,而是减去略大于3
EXCEL描述统计输出详解:标准误、置信度、偏度、峰度和JB检验_第4张图片
即EXCEL中kurt()输出峰度为0即为正态分布。
样本偏度EXCEL中底层计算即图中样本偏度对应公式。

5. 正态分布检验:Jarque-Bera检验

鉴于正态分布峰度为3,偏度为0,JB检验正是基于这两个指标检验一组数据是否符合正态分布。
对于正态分布,其偏度、峰度也符合正态分布:
在这里插入图片描述
对二者标准化再加和得到JB统计量,符合自由度为2的卡方分布:
在这里插入图片描述
以α=0.05为例,对应卡方分位数约等于6。即JB>6时,不接受数据服从正态分布的原假设。
注意:JB检验为单侧检验,貌似很多卡方检验都是单侧检验。
在EXCEL中计算JB统计量时,需注意Kt中已经减去了3。

金风玉露一相逢,记我的第一篇博客,编辑耗时2h,请多指教。

你可能感兴趣的:(统计学,excel,数据分析)