SAS用proc means和proc univariate求数据的样本均值、中位数、四分位数、样本方差、极差、变异系数、二阶、三阶和四阶中心矩、偏度、峰度、标准差和对数据进行正态性检验

例题:

1.在某工厂生产的型号的圆轴中任取20个,测得其直径数据如下:

15.63 15.13 15.46 15.40 15.56 15.35 15.56 15.38 15.21
15.58 15.57 15.36 15.48 15.46 15.52 15.29 15.42 15.69
求上序数据的样本均值,中位数,四分位数,样本方差,极差,变异系数,二阶、三阶和四阶中心距;求偏度,峰度,并把数据中心距和标准差。

2.下列列出了84个伊特拉斯人男子头颅的最大宽度(单位:mm)

148 132 138 154 142 150 146 155 158 150 140 147 148 144

150 149 145 149 158 143 141 144 144 126 140 144 142 141 140

145 135 147 146 141 140 136 146 142 137 148 154 137 139 143

140 131 141 143 149 148 135 148 152 143 144 141 143 147 146

150 132 142 142 143 153 149 146 149 138 142 149 142 137 134

144 146 147 140 142 137 152 140 145

在显著性水平a=0.01下,试检验上述头颅的最大宽度数据是否来自正态总体?

实验代码:
data YZTJ;
input d @@;
cards;
15.28 15.63 15.13 15.46 15.40 15.56 15.35 15.56 15.38 15.21
15.48 15.58 15.57 15.36 15.48 15.46 15.52 15.29 15.42 15.69
;
run;
proc means noprint data=YZTJ mean median qrange var range cv skewness kurtosis std;
var d;
output out=YZTJResult1 mean=mean median=median qrange=qrange var=var range=range cv=cv skewness=skewness kurtosis=kurtosis std=std
run;
data YZTJResult2;
input x1-x20 @;
mean=sum(of x1-x20)/20;
B2=sum((x1-mean)**2,(x2-mean)**2,(x3-mean)**2,(x4-mean)**2,
(x5-mean)**2,(x6-mean)**2,(x7-mean)**2,(x8-mean)**2,(x9-mean)**2,(x10-mean)**2,(x11-mean)**2,(x12-mean)**2,
(x13-mean)**2,(x14-mean)**2,(x15-mean)**2,(x16-mean)**2,(x17-mean)**2,(x18-mean)**2,(x19-mean)**2,(x20-mean)**2)/20;
B3=sum((x1-mean)**3,(x2-mean)**3,(x3-mean)**3,(x4-mean)**3,
(x5-mean)**3,(x6-mean)**3,(x7-mean)**3,(x8-mean)**3,(x9-mean)**3,(x10-mean)**3,(x11-mean)**3,(x12-mean)**3,
(x13-mean)**3,(x14-mean)**3,(x15-mean)**3,(x16-mean)**3,(x17-mean)**3,(x18-mean)**3,(x19-mean)**3,(x20-mean)**3)/20;
B4=sum((x1-mean)**4,(x2-mean)**4,(x3-mean)**4,(x4-mean)**4,
(x5-mean)**4,(x6-mean)**4,(x7-mean)**4,(x8-mean)**4,(x9-mean)**4,(x10-mean)**4,(x11-mean)**4,(x12-mean)**4,
(x13-mean)**4,(x14-mean)**4,(x15-mean)**4,(x16-mean)**4,(x17-mean)**4,(x18-mean)**4,(x19-mean)**4,(x20-mean)**4)/20;
run;
cards;
15.28 15.63 15.13 15.46 15.40 15.56 15.35 15.56 15.38 15.21 15.48 15.58 15.57 15.36 15.48 15.46 15.52 15.29 15.42 15.69
;
run;
data YZTJResult;
merge study.YZTJResult1 study.YZTJResult2;
drop x1-x20;
run;
proc print data=study.YZTJResult;
run;
实现结果:
SAS用proc means和proc univariate求数据的样本均值、中位数、四分位数、样本方差、极差、变异系数、二阶、三阶和四阶中心矩、偏度、峰度、标准差和对数据进行正态性检验_第1张图片

2、
data TLTJ;
input d @@;
cards;
141 148 132 138 154 142 150 146 155 158 150 140 147 148 144
150 149 145 149 158 143 141 144 144 126 140 144 142 141 140
145 135 147 146 141 140 136 146 142 137 148 154 137 139 143
140 131 141 143 149 148 135 148 152 143 144 141 143 147 146
150 132 142 142 143 153 149 146 149 138 142 149 142 137 134
144 146 147 140 142 137 152 140 145
;
run;
proc univariate data=TLTJ normal;
var d;
run;
实现结果:
SAS用proc means和proc univariate求数据的样本均值、中位数、四分位数、样本方差、极差、变异系数、二阶、三阶和四阶中心矩、偏度、峰度、标准差和对数据进行正态性检验_第2张图片
分析实验结果:
(1)代码1中,先建立study.YZTJ数据集把圆轴直径数据导入,用proc means方法把计算的统计关键词output到study.YZTJResult1中,接着创建临时数据集temp1和temp2,分别把mean和x1-x20的数据导入其中,创建study.YZTJResult2并接temp1和temp2,算出2到4阶的中心矩B2-B4,最后把study.YZTJResult1和study.YZTJResult2并接,得到最终结果数据集study.YZTJResult。

(2)创建数据集study.TLTJ,用proc univariate方法和normal选项进行正态性检验,由结果可以看出,在显著性水平a=0.01下,数据量小于2000,算出的p值0.7>0.01,故接受H0,拒绝H1,即头颅的最大宽度数据是来自正态总体。

你可能感兴趣的:(SAS,统一建模语言,数据分析)