r语言如何计算t分布临界值_第十二讲 R-配对样本t检验

r语言如何计算t分布临界值_第十二讲 R-配对样本t检验_第1张图片

配对样本t检验用于样品的两个相关组之间的比较手段。在这种情况下,同一样本有两个值(即一对值)。

举个例子,在1个月内有20只小鼠接受了治疗X。我们想知道处理X是否会对小鼠的体重产生影响。

为了回答这个问题,在治疗之前和之后测量了20只小鼠的体重。通过测量相同小鼠体重的两次,我们得到了治疗前的20组值和治疗后的20组值。

在这种情况下,可以使用配对t检验比较治疗前后的平均体重。

配对的t检验分析如下:

  1. 计算配对的两组的差值(d),每只小鼠会有一个差值
  2. 计算平均值(m)和差值(d)的标准差(s)
  3. 比较平均差异与0有无差异。如果两对样本之间存在显著差异,则d的平均值(m)会远离0。

注意,仅当差值(d)呈正态分布时,才可以使用配对样本t检验。可以使用Shapiro-Wilk test进行检查。请参看第六讲

1. 研究问题和统计假设

典型的研究问题是:

  1. 差值(d)的均值(m)是否等于0?
  2. 差值(d)的均值(m)是否小于0?
  3. 差值(d)的均值(m)是否大于0?

在统计数据中,我们可以定义相应的无效假设(H0) 如下:

  1. H0:m = 0
  2. H0:m≤ 0
  3. H0:m≥ 0

相应的备择假设(H1)如下:

  1. H1:m ≠ 0(不同)
  2. H1:m> 0(大于)
  3. H1:m< 0(小于)

注意:

  • 假设1)称为双向检验
  • 假设2)和3)称为单向检验

2. 配对样本t检验的公式

t统计量可以计算如下:

3a8bcbcf950b70bc64d85201261293ac.png

其中,

  • m是样本差值的均值
  • n是样本
  • s是样本差值的标准差,自由度df为n-1

我们可以为自由度(df)计算与t检验统计量(| t |),通过查询t分布表格对比其在df=n-1处的P值。

如何解释结果?

如果p值低于或等于显着性水平0.05,我们可以拒绝无效假设并接受备择假设。换句话说,我们得出结论,两配对样本有显著差异。

3. 用R完成配对样本t检验

可以使用R函数t.test()计算单样本t检验:

t.test(x, y, paired=TRUE, alternative = "two.sided")

x,y:数值向量

  • paired:一个逻辑值,指定我们要计算配对的t检验
  • alternative:备择假设。允许值为“two.sided”(默认),也可以根据需要设置为“greater”或“less”之一。

3.1 将数据导入R

我们将使用一个示例,其中包含治疗前后10只小鼠的体重。

# 治疗前小鼠体重
before <-c(15.4,25.3,25.6,34.7,28.8,18.9,30.0,36.7,25.8,27.7)
# 治疗后小鼠的体重
after <-c(32.5,23.4,36.7,35.7,38.7,32.5,32.4,37.0,26.7,30.0)
# 创建数据框
my_data <- data.frame( 
                group = rep(c("before", "after"), each = 10),
                weight = c(before,  after)
                )

我们想知道,治疗前后体重是否有显着差异?

3.2 检查数据

print(my_data)
   group weight
1  before   15.4
2  before   25.3
3  before   25.6
4  before   34.7
5  before   28.8
6  before   18.9
7  before   30.0
8  before   36.7
9  before   25.8
10 before   27.7
11  after   32.5
12  after   23.4
13  after   36.7
14  after   35.7
15  after   38.7
16  after   32.5
17  after   32.4
18  after   37.0
19  after   26.7
20  after   30.0

使用dplyr软件包按组计算统计信息(平均值和标准差)。

  • 要安装dplyr软件包,请输入以下命令:
install.packages("dplyr")
  • 按组计算摘要统计信息:
library("dplyr")
group_by(my_data, group) %>%
  summarise(
    count = n(),
    mean = mean(weight, na.rm = TRUE),
    sd = sd(weight, na.rm = TRUE)
  )
Source: local data frame [2 x 4]
   group count   mean       sd
  (fctr) (int)  (dbl)    (dbl)
1 after     10  32.6  4.82
2 before    10  26.9  6.43

3.3 使用箱形图和配对图可视化数据

(请参看第五讲 R-数据描述性统计分析作图)

r语言如何计算t分布临界值_第十二讲 R-配对样本t检验_第2张图片

箱形图显示了增长与否,但丢失了配对信息。我们可以使用功能plot.paired()[在pairedData包中]绘制配对数据(“ before-after”图)。

  • 安装pairedData包:
install.packages("PairedData")
  • 绘制配对数据:
# 提取治疗前数据
before <- subset(my_data,  group == "before", weight,
                 drop = TRUE)

# 提取治疗后数据

after <- subset(my_data,  group == "after", weight,
                 drop = TRUE)

# 画配对图

library(PairedData)
pd <- paired(before, after)
plot(pd, type = "profile") + theme_bw()

r语言如何计算t分布临界值_第十二讲 R-配对样本t检验_第3张图片

3.4 初步检验配对样本t检验的假设条件(正态性检验)

(请参看第六讲 R-数据正态分布检验)
假设1:两个样本是否配对?

是的,因为通过测量相同小鼠体重治疗前后两次来收集数据。

假设2:这是一个大样本吗?

否,因为n <30。由于样本大小不够大(小于30),我们需要检查对的差异是否遵循正态分布。

如何检查正常性?

# 计算之前前后的差异
d <- with(my_data, weight[group == "before"] - weight[group == "after"])
#Shapiro-Wilk正态性检验差值是否符合正态分布
shapiro.test(d) # p-value = 0.11

从输出中,p值大于显着性水平0.05,表明差值(d)的分布与正态分布没有显著差异。说明差值(d)符合正态分布,可以使用配对样本t检验。

请注意,如果数据不是正态分布的,建议使用非参数配对样本Wilcoxon检验。(我们在下一次推文会详细讲解)

3.5 计算配对样本t检验

# 配对样本t检验
res <- t.test(after,before, paired = TRUE)
# 显示结果
res 
	data:  after and before
t = 2.7111, df = 9, p-value = 0.02395
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  0.9388936 10.4011064
sample estimates:
mean of the differences 
                   5.67 

在上面的结果中:

  • tt检验统计值(t = 2.71),
  • df是自由度(df = 9),
  • p值t检验的显着性水平(p值=0.024)。
  • http://conf.int是平均值的置信区间,为95%(http://conf.int = [0.94,10.40]);
  • sample estimates是两组的差值的平均值(平均值= 5.67)。

也可以使用如下代码,输出内容一样。

res <- t.test(weight ~ group, data = my_data, paired = TRUE)
res

注意:

  • 如果要测试治疗前的体重是否小于治疗后的体重,请输入以下命令:
t.test(weight ~ group, data = my_data, paired = TRUE,
        alternative = "less")
  • 或者,如果要测试治疗前的体重是否大于治疗后的体重,请输入
t.test(weight ~ group, data = my_data, paired = TRUE,
       alternative = "greater")

3.6 结果解释

检验的p值为 0.024,小于显着性水平alpha = 0.05。然后我们可以否定原假设,并得出结论,治疗前小鼠的体重与治疗后小鼠的体重显著不同,p值 = 0.024。

3.7 获得t.test()函数的返回值

(请参看第八讲 R-单样本t检验)

如果您觉得我说的对您有帮助,请点赞让我感到您的支持,您的支持是我写作最大的动力~

ijournal:高颜值的期刊检索网站,助您快速找到理想目标期刊(weixin小程序也上线了哦)

投必得:全专业中英文论文润色编辑助力您的论文快速发表,点击了解业务详情

r语言如何计算t分布临界值_第十二讲 R-配对样本t检验_第4张图片

专栏传送门:

投必得科研软件安装使用手册;投必得:SCI期刊介绍与选择;投必得,教你写论文;投必得统计分析大讲堂;投必得科研生活解忧杂货店

你可能感兴趣的:(r语言如何计算t分布临界值,t检验的p值对照表)