卡方检验 & Fisher exact 检验 & Mantel-Haenszel

5.1 不同年龄段对各商场的购物倾向性是否存在差异

H_0:不同年龄段对各商场的购物倾向性无差异 H_1: 不同年龄段对各商场的购物倾向性存在差异

data1 <- matrix(c(83, 91, 41, 70, 86, 38, 45, 15, 10), byrow = F, nrow = 3)
chisq.test(data1)    # Chi-square test
## 
##  Pearson's Chi-squared test
## 
## data:  data1
## X-squared = 18.651, df = 4, p-value = 0.0009203

结论: 在0.95的显著性水平下,可以拒绝原假设,即认为不同年龄段对各商场的购物倾向性存在差异。

5.2 不同种族与所支持的政党之间是否存在独立性

H_0:不同种族所支持的政党之间存在独立性 H_1:不同种族与所支持的政党之间相关

data2 <- matrix(c(341, 103, 405, 11, 105, 15), byrow = F, nrow = 2)
chisq.test(data2)    # Chi-square test
##  Pearson's Chi-squared test
## 
## data:  data2
## X-squared = 79.431, df = 2, p-value < 2.2e-16

结论: 在0.95的显著性水平下,可以拒绝原假设,即认为不同种族与所支持的政党之间存在相关性。

5.3 当前患某类肺炎和曾经患某类肺炎之间的疾病继承性关系

H_0:患某类肺炎和曾经患某类肺炎之间不存在疾病继承性 H_1:患某类肺炎和曾经患某类肺炎之间存在疾病继承性

由于观测数目较少,渐进$\chi^2$分布不再适用,应使用fisher.test 精确检验法。

data3 <- matrix(c(6, 1, 4, 19), byrow = F, nrow = 2)
fisher.test(data3)   # Fisher's exact test
##  Fisher's Exact Test for Count Data
## 
## data:  data3
## p-value = 0.002122
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##     2.152514 1362.408171
## sample estimates:
## odds ratio 
##    24.2696

结论: 在0.95的显著性水平下,可以拒绝原假设,即认为存在疾病继承性。

5.7 学生家庭经济情况与其高考成绩之间的关系

H_0:学生家庭经济情况与其高考成绩无关 H_1:学生家庭经济情况与其高考成绩相关

  • 首先使用mantelhaen.test消除层次因素干扰,检验学生家庭经济情况是否与其高考成绩相关

  • 进一步使用chisq.test比较各类学校,分别检验学生家庭经济情况是否与其高考成绩相关

# Mantel-Haenszel test
school1 <- matrix(c(43, 87, 65, 77), byrow = F, 2)
school2 <- matrix(c(9, 15, 73, 30), byrow = F, 2)
school3 <- matrix(c(7, 9, 18, 11), byrow = F, 2)
data7 <- array(c(school1, school2, school3), dim = c(2,2,3))
mantelhaen.test(data7)
##  Mantel-Haenszel chi-squared test with continuity correction
## 
## data:  data7
## Mantel-Haenszel X-squared = 11.638, df = 1, p-value = 0.0006461
## alternative hypothesis: true common odds ratio is not equal to 1
## 95 percent confidence interval:
##  0.3222519 0.7298350
## sample estimates:
## common odds ratio 
##         0.4849646
# Further comparison
T1 <- chisq.test(data7[,,1])  # school1
T2 <- chisq.test(data7[,,2])  # school2
T3 <- chisq.test(data7[,,3])  # school3  
T1; T2; T3
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  data7[, , 1]
## X-squared = 4.0557, df = 1, p-value = 0.04402
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  data7[, , 2]
## X-squared = 8.0736, df = 1, p-value = 0.004491
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  data7[, , 3]
## X-squared = 0.75768, df = 1, p-value = 0.3841

结论: 在0.95的显著性水平下,可以拒绝原假设,即认为学生家庭经济情况与其高考成绩相关。其中在第一和第二类学校,家庭经济情况与高考成绩相关性显著,而在第三类学校不存在显著关系。

你可能感兴趣的:(卡方检验 & Fisher exact 检验 & Mantel-Haenszel)