关于卡方检验(Chi-square test/Chi-Square Goodness-of-Fit Test)的基础及实例

近来在学习chaid算法时涉及到了卡方检验的知识,于是补习了下,在此分享出来。

1.什么是卡方检验

卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。

2.卡方检验的基本原理及其思想

卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。

该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。

χ2值表示观察值与理论值之问的偏离程度。计算这种偏离程度的基本思路如下。

  (1)设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差称为残差。

  (2)显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。

  (3)另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1 000时20的残差就很小了。考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。

  进行上述操作之后,就得到了常用的χ2统计量,由于它最初是由英国统计学家Karl Pearson在1900年首次提出的,因此也称之为Pearson χ2,其计算公式为 \chi^2=\sum \frac{(A-E)^2}{E}=\sum_{i=1}^k \frac{(A_i-E_i)^2}{E_i}=\sum_{i=1}^k \frac{(A_i-np_i)^2}{np_i}  (i=1,2,3,…,k)

  其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。i水平的期望频数Ti等于总频数n×i水平的期望概率pi,k为单元格数。当n比较大时,χ2统计量近似服从k-1(计算Ei时用到的参数个数)个自由度的卡方分布

由卡方的计算公式可知,当观察频数与期望频数完全一致时,χ2值为0;观察频数与期望频数越接近,两者之间的差异越小,χ2值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,χ2值越大。换言之,大的χ2值表明观察频数远离期望频数,即表明远离假设。小的χ2值表明观察频数接近期望频数,接近假设。因此,χ2是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。如果χ2值“小”,研究者就倾向于不拒绝H0;如果χ2值大,就倾向于拒绝H0。至于χ2在每个具体研究中究竟要大到什么程度才能拒绝H0,则要借助于卡方分布求出所对应的P值来确定。

3.卡方检验的类型

一、四格表资料的x2检验

    例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?

表20-11 两种疗法治疗卵巢癌的疗效比较



组别  有效  无效  合计  有效率(%) 
化疗组  19  24  43  44.2 
化疗加放疗组  34  10  44  77.3 
合计  53  34  87  60.9 

    表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:

    式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。

    检验步骤:

    1.建立检验假设:

    H0:π1=π2

    H1:π1≠π2

    α=0.05

    2.计算理论数(TRC),计算公式为:

    TRC=nR.nc/n 公式(20.13)

    式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。

    第1行1列: 43×53/87=26.2

    第1行2列: 43×34/87=16.8

    第2行1列: 44×53/87=26.8

    第2行2列: 4×34/87=17.2

    以推算结果,可与原四项实际数并列成表20-12:

表20-12 两种疗法治疗卵巢癌的疗效比较



组别  有效  无效  合计 
化疗组  19(26.2)  24(16.8)  43 
化疗加放疗组  34(26.8)  10(17.2)  44 
合计  53  34  87 

    因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:

    T1.1=26.2

    T1.2=43-26.2=16.8

    T2.1=53-26.2=26.8

    T2.2=44-26.2=17.2

    3.计算x2值 按公式20.12代入

关于卡方检验(Chi-square test/Chi-Square Goodness-of-Fit Test)的基础及实例_第1张图片

    4.查x2值表求P值

    在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.01即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。

    通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。

    二、四格表的专用公式

    对于四格表资料,还可用以下专用公式求x2值。


    式中a、b、c、d各代表四格表中四个实际数,现仍以表20-12为例,将上式符号标记如下(表20-13),并示范计算。

表20-13 两种疗法治疗卵巢肿瘤患者的疗效



组别  有效  无效  合计 
化疗组  19(a)  24(b)  43(a+b) 
化疗加放疗组  34(c)  10(d)  44(c+d) 

53(a+c)  34(b+d)  87(n) 

    计算结果与前述用基本公式一致,相差0.01用换算时小数点后四舍五入所致。

    三、四格表x2值的校正

    x2值表是数理统计根据正态分布中的定义计算出来的。    是一种近似,在自由度大于1、理论数皆大于5时,这种近似很好;当自由度为1时,尤其当1<T<5,而n>40时,应用以下校正公式:

    如果用四格表专用公式,亦应用下式校正:

    例20.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表20-14.试比较两种疗法效果有无差异?

表20-14 两种疗法效果比较的卡方较正计算



疗法  痊愈数  未愈数  合计 
甲  26(28.82)  7(4.18)  33 
乙  36(33.18)  2(4.82)  38 
合计  62  9  71 

    从表20-14可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正公式(20.15)检验。步骤如下:

    1.检验假设:

    H0:π1=π2

    H1:π1≠π2

    α=0.05

    2.计算理论数:(已完成列入四格表括弧中)

    3.计算x2值:应用公式(20.15)运算如下:

关于卡方检验(Chi-square test/Chi-Square Goodness-of-Fit Test)的基础及实例_第2张图片

    查x2界值表,x20.05(1)=3.84,故x2<x20.05(1),P>0.05.

    按α=0.05水准,接受H0,两种疗效差异无统计学意义。

    如果不采用校正公式,而用原基本公式,算得的结果x2=4.068,则结论就不同了。

    如果观察资料的T<1或n<40时,四格表资料用上述校正法也不行,可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。

    四、行×列表的卡方检验(x2test for R×C table)

    适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相同,简单计算公式如下:

    式中n为总例数;A为各观察值;nR和nC为与各A值相应的行和列合计的总数。

    例20.9北方冬季日照短而南移,居宅设计如何适应以获得最大日照量,增强居民体质,减少小儿佝偻病,实属重要。胡氏等1986年在北京进行住宅建筑日照卫生标准的研究,对214幢楼房居民的婴幼儿712人体检,检出轻度佝偻病333例,比较了居室朝向与患病的关系。现将该资料归纳如表20-15作行×列检验。

表20-15居室朝向与室内婴幼儿佝偻病患病率比较



检查结果  居室朝向  合计 
南  西、西南  东、东南  北、东北、西北 
患病  180  14  120  65  379 
无病  200  16  84  33  333 
合计  380  30  204  98  712 
患病率(%)  47.4  46.7  58.8  66.3  53.2 
/P>

    该表资料由2行4列组成,称2×4表,可用公式(20.17)检验。

    (一)检验步骤

    1.检验假设

    H0:四类朝向居民婴幼儿佝偻病患病率相同。

    H1:四类朝向居民婴幼儿佝偻病患率不同。

    α=0.05

    2.计算x2值

关于卡方检验(Chi-square test/Chi-Square Goodness-of-Fit Test)的基础及实例_第3张图片

    3.确定P值和分析

    本题v=(2-1)(4-3)=3,据此查附表20-1:

    x20.01(3)=11.34,本题x2=15.08,x2>x20.01(3),P<0.01,按α=0.05水准,拒绝H0,可以认为居室朝向不同的居民,婴幼儿佝偻病患病率有差异。





你可能感兴趣的:(统计学卡方检验)