非参数统计检验

非参数统计的方法用于总体分布未知的情形,其目的在于检验一个变量的分布在不同组中是否具有相同的位置参数。

NPAR1WAY语句

功能

格式:

proc npar1way data=数据集名 [选项];
by 变量名;
class 变量名;
var 变量名;
run;

注:
proc的选项:
i.wilcoxon:指定使用Wilcoxon秩和分析方法;
ii.noprint:结果输出窗口不显示计算结果;

单个样本的非参数检验

此情形使用Univariate过程。
目的: 检验某个样本均值是否等于特定值。

某产品标注的净含量为1kg,现对该产品进行抽样统计分析,试判断该产品重量是否与标注一致?
非参数统计检验_第1张图片
代码:

data test;              /*创建数据集*/
input x @@;
cards;
0.998 0.997 0.995 0.994 0.990 0.981 0.986 0.995
0.976 0.986 0.996 0.976 0.965 0.986 0.992 1.001
0.985 1.002 0.999 0.993 0.994 0.995 0.993 0.991
0.975 0.984 0.976 0.954 0.987 0.986 0.985 0.976
;
run;
proc univariate data=test mu0=1;   /*设置mu0为1,检验其*均值是否为1/
var x;
run;

结果:
给出了一些基本统计信息:
非参数统计检验_第2张图片
下图显示秩检验的p值<0.05的显著水平,应拒绝原假设:
非参数统计检验_第3张图片

两样本的非参数检验

概述: 当两个独立样本来自正态分布和具有相同的方差时,一般采用T检验比较均值。当样本不满足这两个条件时,则采用Wilcoxon秩和检验。

对某校高一高二学生的英语学习能力作评价,主要测试学生的口语能力,测试分数如下,分析两个年级的学生英语口语能力是否有显著差异?
非参数统计检验_第4张图片
代码:

data test;                        /*创建数据集*/
input x type$;
cards;
78 1
67 1
88 1
98 1
78 1
77 1
65 1
85 1
70 1
67 2
78 2
69 2
87 2
85 2
87 2
90 2
65 2
77 2
;
run;
proc npar1way data=test wilcoxon;    /*进行wilcoxon检验*/
class type;                   /*指定分组变量*/
var x;                        /*指定非参数检验变量*/
run;

结果:
t检验双边概率值为1,故可接受原假设,认为这两个年级的口语能力是无显著差别的。
非参数统计检验_第5张图片

多个样本的非参数检验

概述: 当多个样本数据满足正态分布且具有相等的方差时,比较它们的均值可以采用方差分析。当数据不满足上述条件时,可采用多样本均值比较的非参数Kruskal-Wallis秩和检验。此检验的目的是分析某个变量在另一分类变量取不同值时,它的取值(用位置统计量衡量)是否有显著不同。
编程实现: NPAR1WAY过程可以实现,与两样本情形不同的是,class语句的分类变量它有两个以上的取值水平。

成对样本的非参数检验

类似于单样本的非参数检验,使用Univariate过程,成对的数据作差处理,检验其均值是否显著为0。

现对某培训机构的培训后的学员的基础能力是否有提高进行抽样调查,学生培训前后的成绩如下表。
非参数统计检验_第6张图片
代码:

data test;                           /*创建数据集*/
input x y;
d=x-y;
cards;
89 95
78 88
96 95
78 87
74 80
75 83
84 90
79 76
80 83
85 88
;
run;
proc univariate data=test;            /*配对样本的符号检验*/
var d;
run;

结果:
符号检验的p值大于0.05,说明应该接受原假设,即认为培训前后的成绩没有显著差别。
非参数统计检验_第7张图片

你可能感兴趣的:(SAS入门)