1.单正态总体的检验
方差已知,检验均值:Z检验
z.test():BSDA包,调用格式:
z.test(x, y = NULL, alternative = "two.sided", mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)
x,y为样本数据,单样本时忽略y;alternative选择检验类型;mu为检验的均值;sigma.x,sigma.y为标准差;conf.level为置信水平
方差未知,检验均值:t检验
t.test():调用格式:
t.test(x, y = NULL, alternative=c("two sided","less","greater"), mu = 0,paired = TRUE, var.equal = FALSE, conf.level = 0.95,...)
x,y为样本数据,单样本时忽略y;alternative选择检验类型;mu为检验的均值;paired设置是否为成对检验;var.equal设置双样本时方差是否相等;sigma.x,sigma.y为标准差;conf.level为置信水平
均值已知/未知,检验方差:卡方检验
2.双正态总体检验
方差已知,比较两总体均值:Z检验
z.test():BSDA包
z.test(x, y = NULL, alternative = "two.sided", mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)
方差未知,且两方差相等/不等,比较均值:t检验
t.test():
t.test(x, y = NULL, alternative=c("two sided","less","greater"), mu = 0,paired = TRUE, var.equal = FALSE, conf.level = 0.95,...)
成对数据,检验区别是否明显:t检验
t.test():
t.test(x, y = NULL, alternative=c("two sided","less","greater"), mu = 0,paired = TRUE, var.equal = FALSE, conf.level = 0.95,...)
注意参数paired要为TRUE
两总体方差比较:F检验
var.test():
var.test(x, y, ratio = 1, alternative = c("two.sided","less","greater"), conf.level = 0.95,...)
x,y为样本数据;ratio为原假设的方差比值,进行两样本比较时可以使用默认值1;alternative设置检验类型为双尾或是单尾;conf.level为置信水平
3.比率检验:
精确检验:二项分布检验
binom.test():
binom.test(x, n, p = 0.5, alternative = c("two.sided","less","greater"),conf.level= 0.95)
x为具有特征样本数,n为样本总数,p为检验的比率
近似检验(样本量较大):正态检验
prop.test():
prop.test(x, n, p = NULL, alternative = c("two.sided","less","greater"),conf.level = 0.95,correct = TRUE)
x为具有特征的样本数;n为样本总数;p设置假设检验的原假设比率值;alternative设置检验方式;conf.level为置信水平;correct设置是否使用Yates连续修正,默认为TRUE。
4.非参数检验
总体分布的卡方检验:
chisq.test():
chisq.test(x, y = NULL, correct = TRUE, p = rep(1/length(x), length(x)),rescale.p = FALSE, simulate.p.value = FALSE, B = 2000)
x是样本数据的向量或矩阵;y是与x长度相同的向量,当x时矩阵时忽略y;correct设置计算检验统计量时是否进行连续修正,默认为TRUE;p为原假设落在区间内的理论概率,默认为均匀分布,实际应用时需要自己构造分布函数后计算概率分布;rescale设置为TRUE时,概率之和不等于1时将报错们重新计算p,设置为FALSE时不作此要求;simulate.p.value设置为TRUE时采用仿真方法计算p值
KS检验:
ks.test(x, y, ...,alternative=c("two.sided","less","greater"),exact = NULL)
x为数据向量;y可以为另一个数据向量,也可以是字符串作为分布名称指定一个分布(如pexp为指数分布,pnorm为正态分布),也可以是实际的累计分布函数,也可以是ecdf函数对象;“...”给出y分布指定的参数,alternative指定检验类型;exact指定P值是否应该被计算
双样本时,检验x与y是否来自同一分布。
KS检验对数据的利用更完整,更稳健。
卡方检验主要用于分类数据,KS检验主要用于有计量单位的连续和定量数据。