数理统计复习笔记九——正态性检验

假设 X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn是来自正态总体为 F ( x ) F(x) F(x) I I D IID IID样本,现感兴趣的假设为 H 0 : F ( x ) ∈ { Φ ( x − μ σ ) : μ ∈ R , σ > 0 } (1) H_0:F(x)\in\{\Phi(\frac{x-\mu}{\sigma}):\mu\in \bm R, \sigma\gt0\}\tag1 H0:F(x){ Φ(σxμ):μR,σ>0}(1)

对于正态性检验,建议首先利用直方图或核密度估计得到样本数据的分布图,若分布严重偏态或尖峰,可认为其不是来自于正态分布;若根据直方图或核密估计分布不容易做出判断,再利用各检验方法对其检验。

注意:对于正态性检验,应该避免仅根据一种检验方法便轻易的做出决策,应该使用多种方法,综合评价

一、图示法

1.1 直方图或核密度图法

直方图(histogram)是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的。绘制该图时,在平面直角坐标系中,用横轴表示数据分组,纵轴表示频数或频率,这样就形成了一个矩形(即直方图)。

直方图与柱状图的区别:
①直方图的高度与宽度都有意义。柱状图是用柱子的长度表示各类别频数的多少,其宽度(表示类别)固定;而直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距;
②由于分组数据具有连续性,直方图的各矩形通常是连续排列,而柱状图则是分开排列;
③柱状图用于展示分类型数据,直方图用于展示数值型数据

1.2 Q-Q图

QQ图通过把样本数据的分位数与已知分布相比较,从而来检验数据的分布情况。QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图。要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,图形是直线说明是正态分布。而且该直线的斜率为标准差,截距为均值.

1.3 P-P图

P-P图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地检测样本数据是否符合某一概率分布。如果被检验的数据符合所指定的分布,则代表样本数据的点应当基本在代表理论分布的对角线上。

P-P图和Q-Q图的用途完全相同,只是检验方法存在差异。

二、假设检验

2.1 Wilk-Shapiro的W检验

W W W统计量越接近1就越表明数据和正态分布拟合得越好

如果不计常数因子,那么 W W W统计量是正态分布的标准差 σ \sigma σ最佳线性无偏估计样本标准差的比值的平方,即关于 σ \sigma σ的两个估计量的比值的平方。其计算是繁杂的,且随着样本容量的增加,繁杂性在增加,于是,随着样本容量的增加,不得不放弃用 W W W检验(一般样本容量超过50时,就不用了),转而用下面的 D D D检验。

2.2 D检验

D检验是针对W检验在处理大样本数据计算繁杂进行的优化,同样是当 D D D统计量远离1时,有理由拒绝正态性假设。

2.3 Kolmogorov检验

详见Kolmogorov检验,但只适用于检验标准正态分布

2.4 修正后的Kolmogorov检验——lilliefors检验

将Kolmogorov-Smirnov检验改进用于一般的正态性检验

2.5 Pearson卡方拟合优度检验

详见Pearson卡方拟合优度检验

你可能感兴趣的:(概率论与数理统计,统计学,数据分析)