SPSS卡方检验笔记


卡方检验基础


1.如果有加权记得加权
2.适用于分类变量与分类变量的情况
3.行变量就是自变量,列变量就是因变量
4.卡方检验只会揭示变量和变量间有关系,但不会说明具体是哪些变量,所以需要事后两两比较。且配对卡方需要进行人为的卡方分割(人为手动的两两比较)
5.仅渐进法:系统默认设置,表示显著性水平的计算基于渐进分布假设。渐进方法要求足够大的样本容量,如果样本容量偏小,该方法将会失效。
蒙特卡洛法:一般用于不满足渐进分布假设的巨量数据。使用时,应在“置信度级别”和“样本数”输入相应数据。
精确:该方法可以得到精确的显著性水平,但是缺点是计算量过大。用户可以设置相应的计算时间,如果超过该时间,SPSS将自动停止计算并输出结果。
当数据量较大时,我们可以选择上面的蒙特卡洛近似法计算,速度会极大提升,结果与Fisher确切概率法几乎一致。
6.卡方分割方法
卡方分割就是对检验水准α进行调整,有两种分割方式
注:需要p小于检验水准α才行,而不是传统的0.05
(1)比如A、B和C三组资料比较,则两两比较需要进行3次,AB、AC和BC,则检验水准α′=2α/K(K-1)=α/3=0.0167;
(2)若是A组、B组和对照组三组资料,各组只和对照组比较,则比较次数为组数K-1次,即α′=α/(k-1)=0.05/2=0.025。得到α′之后,我们进行卡方检验,只有统计分析得到的P值小于α′才为具有统计学意义,不再是小于0.05为有统计学意义的标准了。

7.a. 卡方:
包括皮尔逊卡方检验和似然比卡方检验,用了检验行变量和列变量之间是否相关
b. 相关性:
生成Spearman相关系数Rho,用来等级顺序之间的相关性
c. 名义选项栏:
列联系数:基于卡方统计的想象测量,0-1之间,越接近1,表示关联性越强
Phi和Cramer V:基于卡方统计的相关性测量,校正的列联系数
Lambda:以一变量的不同水平来预测另一变量可能结果时,误差的几率减少的比率,反映使用自变量的值来预测因变量的值时可能发生的错误。取值0-1之间,1表示预测效果最好,0表示最差
不确定系数:取值0~1之间,用于计算不定和非对称的系数。接近1,表明从第一个观察量获得的有关第二个变量的信息越多。
d. 有序:行、列变量均为有序分类变量
Gamma:两个有序变量的对称关联程度,取值-1到+1之间
萨默斯:Gamma的非对称扩展,与Gamma相同
肯德尔tau-b:对两个有序变量进行非参数相关性检验,考虑相同的观测量情况,表示关联大小
肯德尔tau-c:对两个有序变量进行非参数相关性检验,不考虑相同的观测量情况,表示关联大小
e. Eta:关联度统计量,取值 0~1,用于描述因变量为定量变量,自变量为分类变量的两个变量之间的关联度
f. Kappa:一致性度量系数,只适合方表(行数=列数)
g. 风险:针对2×2表,表明事情的发生与某因素之间的关联性,当某因素发生的可能性非常小,使用比数比(OR)统计量来测定相对危险度
h. 麦克尼玛尔:2×2配对卡方检验
i. 柯克兰和奥特尔-亨塞尔统计:两个二分变量独立性检验的统计量,条件是给定一个或多个分层变量定义的协变量模式。

线性趋势


观察两个变量间有无线性关系,看数值和p决定有没有意义和使用多少

配对设计


卡方检验—配对设计列联表资料
配对设计是指:将受试对象按配对条件配成对子,每对中的个体接受不同的处理。配对设计一般以主要的非实验因素作为配比条件,而不以实验因素作为配比条件。
优点:最大限度排除干扰因素


配对设计分类:
自身配对(同源配对)
自身前后配对:观察同一个体在处理前后某些指标变化的一种设计,如同一批病人采用不同治疗方法前后治疗效果或者缓解率比较。
自身左右配对:指两种不同处理分别施加于同一个体左右两部分的设计,如分别对人体左右肢体、神经或者肌肉等施加不同处理后观察某指标变化情况。
异体配对:将同一受试对象按照一定条件(依据专业知识确定),将条件相同或者相似的个体配成对子,然后在对子内部按照随机方法,将一个分配至实验组,平一个分配到对照组,最后对其结果以配对设计的统计方法加以处理


分层卡方


三维表可以使用分类卡方进行检验,再多的维度表需要进行logistic回归
结果:
(1)卡方检验:注意样本容量和理论频数,然后选择适当的值进行sig显著性观测

成组四格表卡方检验结果选择依据:
(1)N≥40 and T≥5:选择Pearson卡方
(2)N≥40 and 1≤T<5:选择连续性校正χ2检验
(3)n<40 or T<1:选择Fisher精确概率法
(4)N≥40 and T≥5:选择似然比χ2检验与Pearson卡方一致

(2)比值比齐性检验:其实是层间差异性检验,就是比较分层变量有没有用,如果结果发现P>0.05,即为无统计学意义
(3)条件独立性检验:在扣除了分层变量影响之后,自变量与因变量间关系,发现P均小于0.05,说明存在统计学意义。

(4)Mantel-Haenszel OR值估算:图11-28结果可见ORMH=0.151,因为本例变量设置年龄(1=儿童,2=成人),病变(1=皮炎型,2=其他类型),故OR=0.151是指成人得其他类型的松毛虫病是儿童的0.151倍,换言之,成人得皮炎型松毛虫病的机会是儿童的1/0.151=6.62倍。

卡方规律:


成组设计:
■ 成组设计四格表(2×2)
■ 成组设计行列表(2×C、R×2、R×C)
■ 2×C:(C若无序):Pearson卡方
■ (C若有序):非参数检验
■ R×2:R有序等同无序:Pearson卡方
■ R有序,看线性趋势:线性趋势卡方
■ R无序:Pearson卡方
■ R×C:双向无序:Pearson卡方
■ R有C无:Pearson卡方
■ R无C有:非参数
■ R有C有属性不同:Spearman相关
■ 配对设计:
■ 配对设计四格表(2×2)-McNemar
■ 配对设计行列表(方表)
■ 双向无序属性相同:McNemar-Bowker(MB)
■ 双向有序属性不同:Spearman、线性趋势卡方
■ 双向有序属性相同:Kappa一致性、MB

属性的判别方法:
所谓属性相同,是指配对设计的效应指标均为同一指标,均是等级资料。

因为考虑结果是否有差异,因此考虑McNemar-Bowker检验;判断结果是否一致,可以采用Kappa一致性检验。
Kappa值的专业意义如下:Kappa≥0.75时,表明两者一致性较好;0.75>Kappa ≥0.4时,表明一致性一般;Kappa<0.4时,表明两者一致性较差。

你可能感兴趣的:(SPSS,数据分析)