样本含量估计之前需要实现确定以下因素
一类错误
二类错误
单侧检验/双侧检验
其他
步骤1:确定设计方法
步骤2:样本含量估计
步骤3:研究对象随机分组
在样本量估计时,只要确定研究因素和校正因素,相关和回归所求的样本量估计值是一致的
proc ttest<选项>;
class 分组变量;
var 分析变量;
paired 变量1*变量2;
proc glm<选项>;
class 分组变量;
model 分析变量=分组变量;
lsmeans 分组变量;
means 分组变量;
完全随机设计秩和检验:两组wilcoxon 多组kruskal-wallis
proc nparlway<选项>;
class 分组变量;
var 分析变量;
freq 频数;
随机区组设计秩和检验:friedman
proc freq<选项>;
table 区组分组变量分析变量/<选项>;
目前没有提供秩和检验两两比较的选项和菜单,可根据两两比较的公式自己编程来实现结果的输出,还可以采用基于秩的方差分析实现
proc multtest<选项>;
class 分组变量;
test 分析变量<选项>;
对于多组数据比较,只有每组数据均符合正态分布,才算符合正态分布
proc univariate normal;
class 分组变量;
var 分析变量;
run;
shapiro-wilk检验常用于50例以下的正态性检验,kolmogorov-smirnov检验多用于50例以上的正态性检验
卡方检验的sas程序
proc freq<选项>;
table 行*列/ <选项>;
test 统计量关键字;
weight 权重变量;
by 分层变量;
proc corr<选项>;
var 变量1 变量2;
partial 变量1 变量2;
对数线性模型
proc catmod<选项>;
weight 权重变量;
model 变量1变量2…=response;
loglin 效应;
proc corr pearson spearman;
var bmi tc fbg;
run;
proc corr pearson spearman;
var bmi fbg;
partial tc;
run;
proc reg<选项>;
model 因变量=自变量选项>;
plot
proc princomp<选项>;
var变量选项>;
run;
proc pls<选项>;
model 因变量=自变量选项>;
run;
VIP代表自变量对模型拟合的重要程度
proc robustreg<选项>;
model 因变量=自变量选项>;
run;
1.首先用线性回归对数据进行异常点诊断分析
2.由于存在强影响点,且其值较大,进行稳健回归分析
proc gam;
model 因变量=param(自变量)spline(自变量)loess(自变量)spline2(自变量)选项>;
score out=数据集;
run;
proc logistic<选项>;
class 自变量选项>;
model 因变量=自变量选项>;
freq 变量;
proc catmod<选项>;
direct 自变量;
model 因变量=自变量;
proc lifetest<选项>;
time 生存时间*生存状态(截尾值列表);
strata 分组变量;
proc phreg<选项>;
model 生存时间*生存状态(截尾值列表)=分析变量<选项>;
output out=数据集名称 关键字1=名称1;
方差分析、简单线性回归、多重线性回归、协方差分析
proc glm<选项>;
class 分类变量;
model 因变量=自变量;
二项分布、poisson分布、负二项分布
proc genmod<选项>;
class 分类变量;
model 因变量=自变量;
weight 变量;
proc mixed 选项;
class 变量;
model 因变量=自变量/选项;
random 随机效应/选项;
proc genmod<选项>;
class 分类变量;
model 因变量=自变量;
repeated subject=水平2变量/<选项>;
weigh 变量;
步骤1:确定分析方法
步骤2:空模型拟合–只包含截距项
步骤3:在模型中加入解释变量
步骤4:拟合随机斜率模型
步骤5:在模型中加入交互项
步骤6:结论