R语言学习:卡方检验

本文是个人学习笔记

卡方检验用来检验类别变量。

一、频数与频率

  • 性别在不同组中的频数:
> gender_f <- table(data_paper$gender, 
    data_paper$group)
> print(gender_f)
   
     1  2  3
  1  6 16  9
  2  7  7 10
#行是性别,列是组
  • 性别在不同组中的频率:
> prop.table( gender_f, 2 )

注意,这里2代表 “gender_f” 中的第二个变量,即组别,因为我们需要的是不同性别在每个组中的频率

二、卡方检验

2.1 在R中进行卡方检验

有时候需要把连续变量分成分类变量,目前还没有碰到这类分析,后续如有需要会补上。这里的gender和group本身就是因子变量:

> S = chisq.test(gender, group)
> print (S)

即可得到卡方值与p值。

2.2 对结果进行确认

  1. 首先计算估计期望频数,是储存在"S"的“expected”分量中
  2. 再调出储存在table(gender,group)这个列联表中的观测频数
> S$expected
> sum((table(gender,group)-S$expected)^2 / S$expected)

所得结果与上一节的卡方值相同。

函数“pchisq”可以用来计算一个卡方随机变量的累积分布函数,自由度df是(行-1)(列-1)

1 - pchisq(2.805835, df= 2)

所得值也与p值相同。

本文参考了 《通过实例学习R》 [美] 吉姆·艾伯特,玛利亚·里佐

你可能感兴趣的:(r语言)