R - 卡方分析

卡方检验,又称χ2检验,是一种非参数检验,主要是比较两个以及两个以上样本率以及两个分类变量之间是否具有显著的相关性,其根本思想是统计样本的实际观测值与理论推断值之间的偏离程度。

卡方检验有3种推导过程:

  • 四格表法的卡方检验;
  • 行列表法的卡方检验;
  • 列联表法的卡方检验;

卡方检验应用情况

举个例子,两独立样本率的比较时,

  1. 所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验.
  2. 如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检验.
  3. 如果有理论数T<1或n<40,则用Fisher’s检验.

卡方:
>? chisq.test()

chisq.test(x, y = NULL, correct = TRUE,
           p = rep(1/length(x), length(x)), rescale.p = FALSE,
           simulate.p.value = FALSE, B = 2000)


x	:a numeric vector or matrix. x and y can also both be factors.

y	:a numeric vector; ignored if x is a matrix. If x is a factor, y should be a factor of the same length.

#计算理论频数
chisq.test()$expected

通过 n>=40 ,T >5

皮尔逊检验
cor.test()

n>=40 , 1<= T <5
修正的卡方检验
chisq.test(x, correct = TRUE)

n<40 || 1< T <5
fisher.test()

R - 卡方分析_第1张图片

R - 卡方分析_第2张图片

详细内容参考:https://www.jianshu.com/p/bb0bd72bc428 
http://blog.fens.me/r-test-x2/

你可能感兴趣的:(R数据处理,卡方分析)