如何用非参数检验,分析多个相关样本数据?

在之前的文章中,我们介绍过检验数据一致性的多种方法。其实,差异性与一致性可以看作是一体两面的分析,如果一组数据具有很强的差异性,那就表示数据的一致性很差。相反,如果一致性很强,那么数据间的差异性就很小。

不同的方法有不同的要求和侧重,因此才出现这么多的检验方法,分别针对不同的应用场景。下面就介绍几种侧重于检验多组相关数据的非参数检验方法。


① Friedman检验

Friedman检验,是研究多相关样本差异性的方法,属于非参数检验的一种。如果研究数据为多组且为配对样本,可使用Friedman检验方法。

相关样本的意思几组样本的数据之间有对应关系,比如同一组学生进行两次相同试卷考试,前后两次的成绩都是同一个学生的对同一份试卷作答的成绩,如果第一次结果改变那么第二组结果也应该会改变。与之相对应的另一种样本类型,是独立样本,即几组数据之间没有必要的关联性。

1、背景

当前新出一款激光测量身高的仪器,现希望测试仪器的差异性情况。找好15个身高基本都均是1.7米左右的学生进行测试,并且让仪器分别测量3次,最终得到15行3列的数据。由于3次数据具有相关性,因而需要使用多样本Friedman检验进行分析差异关系。

2、操作

操作路径:SPSSAU→实验/医学研究→多样本Friedman检验  

*特别提示:如果检验显示具有差异性,可继续用Nemenyi两两比较进行研究,选中“Nemenyi两两比较”即可。

3、结果分析

SPSSAU-多样本Friedeman分析结果  

首先看分析结果是否呈现显著性,即P值情况。(P值小于0.05或0.01代表呈现出显著性)由于是非参数检验,平均值受极端值的影响较大,所以如果P值呈现出显著性,可进一步通过中位数对比分析。

从上表看,三次测量的并不没有呈现出显著性(P=0.867>0.05),意味着数据之间没有统计意义上的差异性。

同时还可同箱线图对比,图中中部较粗的横线代表中位数,可以看到三次测量的中位数大小是一致的。

因而总结可知:3次测量身高的结果没有明显的差异,进而说明测量身高仪器结果准确无误。

② CochranQ检验

如果说Friedman检验更多用于分析定量数据,那么当数据来自于多相关样本,且为二分类数据时,则应该选择用CochranQ检验

Cochran's Q检验用于研究多组相关样本的差异性认知。比如10个评委对于4名选手的评定结果是否有差异。CochranQ检验时评分上只能为0和1,通常0代表不认可,1代表认可。

1、背景

共有10位顾客参与对4种不同品牌的奶茶是否满意的评价调查,1分表示满意,0分表示不满意。整理后的数据如下图所示:

*非真实数据,仅用于说明

2、操作步骤

路径分析:SPSSAU→实验/医学研究→CochranQ检验


3、结果分析

上图可知,上表格中P值为0.767>0.05,代表10位顾客的打分不具有差异性,即说明顾客对4种品牌的奶茶满意程度并无差异。


③Kendall协调系数检验

除了上面介绍的两种方法外,Kendall协调系数检验也可用于研究多相关样本的比较分析。Kendall协调系数检验的举例在之前的文章已有介绍,这里不再赘述。有需要请戳此链接阅读:一致性检验

其中具体区别在于Kendall偏向研究一致性关系,而Friedman检验则是研究差异关系。



总的来说,当数据为多相关样本时,可使用包括Friedeman检验,Kendall协调系数,Cochran检验等方法分析。三者具体差异,整理如下:

如果是多相关样本,并且目的在于研究差异性,则有Friedeman检验和CochranQ检验两项可用,但CochranQ检验涉及的数据一定是二分类(即1和0这样的数据);如果是研究多相关样本的一致性情况,则可使用Kendall协调系数。


更多干货内容可登录SPSSAU官网查看

你可能感兴趣的:(如何用非参数检验,分析多个相关样本数据?)