R与正态分布(3)分布的检验

Shapiro—Wilk检验法是S.S.Shapiro与M.B.Wilk提出用顺序统计量W来检验分布的正态性,对研究的对象总体,先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序排列编秩,然后由确定的显著性水平α,以及根据样本量为n时所对应的系数αi,根据特定公式计算出检验统计量W。最后查特定的正态性W检验临界值表,比较它们的大小,满足条件则接受假设,认为总体服从正态分布,否则拒绝假设,认为总体不服从正态分布。该方法推荐在样本量很小的时候使用,样本在3到5000之间。

该检验原假设为H0:数据集符合正态分布,统计量W为:

统计量W 最大值是1,越接近1,表示样本与正态分布匹配
p值,如果p-value小于显著性水平α(0.05),则拒绝H0

> set.seed(1)
> S<-rnorm(1000)
> shapiro.test(S)

	Shapiro-Wilk normality test

data:  S
W = 0.9988, p-value = 0.7256

结论: W接近1,p-value>0.05,不能拒绝原假设,所以数据集S符合正态分布!

Kolmogorov-Smirnov分布检验:(柯尔莫哥洛夫-斯摩洛夫检验),用来检验数据的分布是不是符合一个理论的已知分布。
该检验原假设为H0:数据集符合正态分布,H1:样本所来自的总体分布不符合正态分布。令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数.
统计量D为: D=max|F0(x) - Fn(x)|
D值越小,越接近0,表示样本数据越接近正态分布
p值,如果p-value小于显著性水平α(0.05),则拒绝H0


> set.seed(1000)
> s <- rnorm(1000)
> ks.test(s,'pnorm')

	One-sample Kolmogorov-Smirnov test

data:  s
D = 0.0171, p-value = 0.9326
alternative hypothesis: two-sided

结论: D值很小, p-value>0.05,不能拒绝原假设,所以数据集S符合正态分布!

你可能感兴趣的:(r)