1)判断3个及以上独立的组间均数是否存在差异;
2)判断前后变化的差值是否存在差异。
假设1:因变量为连续变量;
假设2:有一个包含2个及以上分类、且组别间相互独立的自变量;
假设3:每组间和组内的观测值相互独立;
假设4:每组内没有明显异常值;
假设5:每组内因变量符合正态分布;
假设6:进行方差齐性检验,观察每组的方差是否相等。
1.方差分析拒绝H0,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较;两两比较分为事前比较和事后比较,前者借助于对比(Contrast),后者借助于两两比较(Post Hoc )提供的许多方法;
2.在分组变量包含次序信息时,如果方差分析做出了各组间差异有统计学意义的结论,并且Means-Plot均数图提示各组均数的某种趋势时,可以利用趋势分析讨论观察值与分组变量取值间的数量依存关系。借助于对比(Contrast)完成。
有研究者认为,体力活动较多的人能更好地应对职场的压力。为了验证这一理论,某研究招募了31名受试者,测量了他们每周进行体力活动的时间(分钟),以及应对职场压力的能力。根据体力活动的时间数,受试者被分为4组:久坐组、低、中、高体力活动组,变量名为group。利用Likert量表调查的总得分来评估应对职场压力的能力,分数越高,表明应对职场压力的能力越强,变量名coping_stress。研究者想知道coping_stress变量的平均得分是否随着group变量的不同而不同。
部分数据视图前三假设需要自己根据实际情况判断,这里不赘述。在SPSS中利用箱图(Boxplots)验证假设4:每组内没有明显异常值。点击【分析】-【探索】模块实现。
SPSS中将距离箱子边缘超过1.5倍箱身长度的数据点定义为异常值,以圆点表示;将距离箱子边缘超过3倍箱身长度的数据点定义为极端值(极端异常值),以星号(*)表示。为容易识别,在Data View窗口异常值均用其所在行数标出。
本例数据箱线图无圆点或星号,因此无异常值下面验证假设5:每组内因变量符合正态分布。
正态性检验有很多方法,这里只介绍最常用的一种:Shapiro-Wilk正态性检验(其他还有偏度和峰度值、直方图等)。如果样本量较小,并且对正态Q-Q图或其他图形方法的结果诠释不够有把握,推荐采用Shapiro-Wilk检验。如果样本量大于50,推荐使用正态Q-Q图等图形方法进行正态判断,因为当样本量较大时,Shapiro-Wilk检验会把稍稍偏离正态分布的数据也标记为有统计学差异,即数据不服从正态分布。
显著性水平(蓝框中的Sig.)大于0.05 , 说明数据符合正态分布验证假设6:方差齐性检验,观察每组的方差是否相等。
把因变量coping_stress送入Dependent List框中,自变量group送入Factor框中 点击Options,在Statistics模块勾选Descriptive(描述性),Homogeneity of variance test(方差同质性检验)和Welch,同时勾选Means plot(均值图) 点击Post Hoc,对话框根据方差齐性检验的假设是否满足,分为2个主要区域。勾选Tukey和Games-Howell。当满足方差齐性的条件时,推荐使用Tukey检验进行组间两两比较。当不满足方差齐性的条件时,推荐使用Games-HowellA、当满足方差齐性的条件时:
Tukey检验。 本例中自变量分为4组,因此会有6种不同的组间组合。 如图中黄字,低体力活动组的CWWS平均分比久坐组高1.72762分,P=0.092>0.05,表示两组间差异无统计学意义(即两组间均数差值等于0)。两组间均数差值的95%可信区间为-0.2058~3.6610,该区间范围包括0,等同于P>0.05,差异无统计学意义B、当不满足方差齐性的条件时:
当方差不齐时,必须使用校正的单因素方差分析。本例采用Welch方差分析 ,可以看出:不同水平的体力活动组间,应对职场压力的能力(CWWS得分)差异具有统计学意义,Welch F(3,14.574)=14.821, P<0.05。当方差不齐,而且关心所有组间的两两比较时,推荐采用Games-Howell检验。Games-Howell检验不仅提供了每两个组间比较的P值,也给出了均数差值的可信区间
Games-Howell检验的结果解释方法与Tukey检验相同,这里不再赘述采用单因素方差分析方法,判断不同水平体力活动组间的应对职场压力的能力(CWWS得分)是否有差异。受试者被分为4组:久坐组7人、“低”体力活动组9人、“中”体力活动组8人、“高”体力活动组7人。
1)经箱线图判断,数据无异常值;
2)经Shapiro-Wilk检验,各组数据服从正态分布(P>0.05);
3)经Levene's方差齐性检验,各组数据方差齐(P=0.120)。数据以均数±标准差的形式表示。
不同体力活动组间的CWWS得分差异具有统计学意义,F(3,27)=8.316, P<0.05,ω2=0.42。CWWS得分按照从久坐组(4.2±0.8)、“低”体力活动组(5.9±1.7)、“中”体力活动组(7.1±1.6)、“高”体力活动组(7.5±1.2)的顺序增加。
4)Tukey检验结果表明,从久坐组到“中”体力活动组,CWWS平均得分增加2.97(95%CI:0.99~4.96),差异具有统计学意义(P=0.002);从久坐组到“高”体力活动组,CWWS平均得分增加3.35(95%CI:1.30~5.40),差异具有统计学意义(P=0.001);其他组间两两比较的结果差异无统计学意义。