(三)SAS图形

1、PROC MEANS分析

PROC MEANS DADA = <数据集名>[<统计量关键字列表>];
[VAR <分析变量列表>;]
[BY|CLASS<分组变量列表>;]
[OUTPUT OUT=<输出数据集名> <关键字>=<变量名>...;]
RUN;
  • 统计关键字列表:指定要计算的统计量,省略此项,过程会自动计算观测值、均值、标准差、最大值、最小值5个统计量;
  • 分析变量列表:指定所要分析的所有变量,多个变量之间用空格隔开;
  • 分组变量列表:指定统计分组变量,多个变量之间用空格隔开;
  • means过程中可以使用class和by两个语句进行分组统计,其区别为:
  • 使用by时,必须按分组变量排序,使用class无此要求;
  • 使用by时,统计结果每组一张表,使用class语句将所有统计结果放在一张表中
统计学生体检表中身高的观测数、均值、标准差、最大值、最小值
proc means data=sashelp.class;
var height;
run;

2、PROC UNIVARIATE分析

PROC UNIVARIATE DATA=<数据集名>[选项];
[VAR<分析变量列表>;]
[BY|CLASS <分组变量列表>;]
[OUTPUT OUT=<输出数据集名> <关键字>=<变量名>...;]
RUN;

UNIVARIATE过程,相比MEANS过程,能够进行更为全面的描述性统计分析;

计算学生体检数据表中体重的各种统计量
proc univariate data=SASHELP.class;
var weight;
run;

在SAS中,必须采用proc univariate过程中的normal命令来检验正态性

3、SGPLOT过程制图

3.1 条形图

proc sgplot [data=数据集];
var|hbar 分类变量名/[选项];

选项:

  • group=变量名 指定数据分组变量

  • groupdisplay=cluster|stack 分组柱形图的方式,默认为satck堆叠

  • response=响应变量名 指定要汇总的数值变量

  • stat=means|freq|sum 未指定响应变量时,默认统计量是freq;指定了响应变量时,默认sum

  • datalabel = 变量名 该变量的值显示为每个bar的标签值

  • Barwidth=n 指定条形的宽度,范围为0.1-1,默认值为0.8

绘制条形图坐标轴:
proc sgplot[data=数据集];
XAXIS|YAXIS [选项]; /*定义坐标轴*/

选项:

  • GRID 绘制坐标轴上每个刻度标记线;指定要汇总的数值变量

  • VALUES={value-list} 坐标轴上刻度标记的值

    • 如:VALUES={0 10 20 30 40 50 60 70 80}或VALUES={0 to 80 by 10}

3.2 盒形图

proc sgplot[data=数据集];
VBOX|HBOX 连续变量名/[选项];

选项:

  • CATEGOPY=分类变量名 为变量的每一个值都分别绘值盒形图

3.3 直方图

proc sgplot[data=数据集];
Histogram 连续变量名/[选项];

选项:

  • NBINS=n 指定直条的个数

  • BINWIDTH=n 如果没有指定“NBINS=”选项,则由此指定直条的宽度

  • BINSTART=n 指定第一直条的中点

  • SCALE=尺度类型 指定垂直轴的尺度,包括PERCENT(默认值)、COUNT或PROPORTION

4、GPLOT制作点线图

绘制散点图和连线图
PROC GPLOT DATA=<数据集名>;
PLOT<纵轴变量>*<横轴变量>[=<分组变量>][/<选项1>];
[SYMBOL <选项2>];
RUN;
  • 选项1:用来设置图形的整体特性,例如坐标轴的值、颜色、外框颜色、填充色等

  • 选项2:点或连线的相关参数

5、GCHART过程制图

GCHART可以绘制方块图、条形图、饼图、环形图等
PROC GCHART DATA=<数据集名>;
<图形关键字><变量名>/<选项列表>;
RUN;
图形关键字 图形类型
block 方块图
hbar 水平条形图
hbar3d 三维水平条形图
vbar 垂直条形图
vbar3d 三维垂直条形图
pie 饼图
pie3d 三维饼图
donut 环形图
star 星型图

<选项列表>

  • type=统计量关键字 常用的统计量关键字有Freq(频数)、mean(均值)、sum(总数)、percent(频数百分比),默认为频数;

  • group=变量 指定分组变量;

  • subgroup=变量 指定第二次分组的变量

  • midpoints=值列表 指定条形图每个矩形中点

  • levels=值 指定条形图中矩形的个数

你可能感兴趣的:(SAS教程,开发语言,SAS)