R语言实现统计推断,T检验方差分析相关分析卡方检验

计算不同样本类型的T置信区间

  • 配对样本T置信区间,使用自带的sleep数据:
data(sleep)
g1<-sleep$extra[1:10];g2<-sleep$extra[11:20];diff<-g2-g1
mn<-mean(diff);s<-sd(diff);n<-10
mn+c(-1,1)*qt(0.975,n-1)*s/sqrt(n)  ##置信区间计算原理
## [1] 0.7001142 2.4598858
  • 使用函数的方法
t.test(diff)$conf[1:2]   
## [1] 0.7001142 2.4598858
t.test(g2,g1,paired=T)$conf[1:2]
## [1] 0.7001142 2.4598858
t.test(extra~I(relevel(group,2)),paired=T,data=sleep)$conf[1:2]
## [1] 0.7001142 2.4598858
  • 同方差独立组的T置信区间
t.test(extra~I(relevel(group,2)),paired=F,data=sleep)$conf[1:2]
## [1] -0.2054832 3.3654832
  • 异方差独立组的T置信区间
    如果不确定两组样本是否同方差,则可以假设两组样本异方差,对应计算方法如下
  1. 单样本T检验
t.test(rate,mu=0.1)
  1. 两样本T检验
  • 双样本T检验需要满足的前提条件:观测之间相互独立;每组均服从正态分布

  • 这里需要注意两组方差的异同,方差相同与方差不同对应的T统计量的计算公式是不一样的。

  • 方差的异同可以通过方差齐性检验判断。检验原假设:两个样本方差相同

    双样本T检验流程
    根据两样本数据或者是分组变量计算相应的均值
    进行方差齐性检验
    进行双样本T检验,根据方差齐性检验的结果设置T检验的参数

R代码实现: 方差齐性检验 #先做方差齐性检验

var.test(avg_exp~gender)

R代码实现:T检验 #后做T检验

t.test(avg_exp~gender,var.equal=T)  #如果方差齐,equal选择true

方差分析:用于探讨连续型变量和分类型变量之间的关系

  1. 各组样本均服从正态分布或逼近正态分布。
  • 各组样本必须相互独立
  • 各组的方差必须相等
  • 原假设:均值相等,无差异
  • 描述
par(mar=c(4,4,1,4))
boxplot(avg_exp~edu_class)   #图像描述

单因素方差分析

anova(lm(avg_exp~edu_class))  
```
多因素方差分析
```
anova(lm(avg_exp~edu_class+gender+edu_class*gender))  
```

##相关分析
- 数据描述
```
par(mar=c(4,4,1,4));plot(Income,avg_exp)
abline(lm(avg_exp~Income))
```
- 计算相关系数
```
cor.test(Income,avg_exp,method='pearson/spearman')
```

##卡方检验
- 数据描述
```
library(prettyR)   #加载相关包
xtab( ~bankruptcy_ind+bad_ind)
```
- 计算chisq
```
xtab( ~bankruptcy_ind+bad_ind,data=accepts,chisq = T)  #直接在交叉表里显示卡方
chisq.test(x=accepts$bankruptcy_ind,y=accepts$bad_ind) 
```

你可能感兴趣的:(R语言实现统计推断,T检验方差分析相关分析卡方检验)