做方差分析需要正态性检验吗_你必须知道的有关正态性检验的几个问题

1. 正态分布,也叫高斯分布。 Gaussian distributions = Normal distributions 需要明确的是,通常情况下,我们检验一组数据的正态性,并不是说检验的这组数据是不是服从正态分布,而是指的这组数据是不是来自于正态分布的总体, 单纯的这组数据是不存在正态不正态一说的,正态针对的是总体 。   举个简单的例子,总体是基本不可能获得的,所以总体的分布情况只能通过从中抽取的样本来检验。   2. 哪种正态性检验方法比较好? 这个问题我们在推文如何利用GraphPad软件做正态性检验中已有提到,GraphPad官方推荐使用 D'Agostino-Pearson omnibus test,不推荐使用Kolmogorov-Smirnov test (with Dallal-Wilkinson-Lilliefor P value),对于Shapiro-Wilk normality test,当数据集中的数据无重复值时,该方法的检验效果比较好,但是当数据集中有些数据不是独一无二的,即有些数据的数值是相同的,那么该方法的检验效果就不是很好。   3. 为什么不同的检验方法得到的结果不同? 这个问题其实很好理解,因为不同的方法检验正态性的原理不一样,但是都是计算其与理想的高斯分布之间的距离。至于想弄清楚各种方法的检验原理,GraphPad官方也说了,非数学家真的很难搞懂,所以我们会用就行了。   4. 需要多少个数据才可以做正态性检验? Kolmogorov-Smirnov test (with Dallal-Wilkinson-Lilliefor P value)需要至少5个数据,Shapiro-Wilk normality test需要至少3个数据,D'Agostino-Pearson omnibus test需要至少8个数据。   5. 如何判断正态分布还是非正态分布?   原始假设是这组数据来自于正态分布的总体,然后通过计算P值来确定其到底符不符合正态分布。 P值的默认临界值为0.05,小于0.05,则认为不服从正态分布,大于0.05,则认为服从正态分布。当然,P值的临界值可以自己调整。 此外,输出结果中三种正态性方法会给出KS(Kolmogorov-Smirnov test), K2(D'Agostino-Pearson omnibus test)和W(Shapiro-Wilk normality test)值,不过无法直接通过这些值来判断正态性, 所以还是直接看P值就可以了 。

做方差分析需要正态性检验吗_你必须知道的有关正态性检验的几个问题_第1张图片

6. 正态性检验到底有用吗?   大多数情况下是没有用的。如果样本量很小的话,无论哪种正态性检验方法都没有足够的能力判断,结果也只是作为参考。而对于大样本量来说,是不是服从正态分布也不是很重要。虽然之前我们讲到,t检验还是单因素方差分析,都要求数据服从正态分布。 但是实际上,t检验或者单因素方差分析对于即使不服从正态分布的大样本量也是很稳健的。 只是说,如果正态分布或者近似正态分布,检验效果会更好。   7. 检验结果不服从正态分布,数据分析时就用非参数检验吗? 绝对不是这样。 对于这个问题,我们后续推文会继续解读。

你可能感兴趣的:(做方差分析需要正态性检验吗)