成对数据T检验实例(用SPSS16.0实现)

一、 成对数据T检验原理
在对两个总体均值进行比较时,有时数据是成对出现的,此时若采用两独立样本T检验所得出的结论有可能是不对的,此时应采用成对数据T检验的方法,原因如下:成对数据的差di(i=1,2,…,n)已消除数据的非处理因素之间的差别(比如在比较两个类型种子的产量时,土质是非处理因素),从而用于检验的标准差sd(计算公式不包含样本的标准差)已排除非处理因素差异的影响,只保留成对数据间的差异;进一步来说,如果用两独立样本T检验的方法,非处理因素会使得用于检验的标准差sw(计算公式包含两独立样本的标准差)增大,从而导致因子不显著。换句话说,如果非处理因素完全相同的情况下,我们选择两独立样本T检验会更好一些,因为它能提供更多的自由度去估计误差。
成对样本T检验是根据样本数据对样本的两成对总体均值的差与零是否有显著性差异进行推断的,一般用于同一研究对象(或成对对象)分别给予两种不同处理的效果比较,或者用于同一研究对象(或成对对象)相同处理前后的效果比较,前者推断不同处理的效果有无差异,后者推断某种处理是否有效(即前后是否有差异)。
可以进行成对数据T检验的前提条件如下:第一,两个样本应该是配对的。在应用中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相似者。第二、两个样本的观察数目要相同,并且观察值的顺序不能随意改变。第三,样本来自的两个总体应服从正正态分布。
成对数据T检验实例(用SPSS16.0实现)_第1张图片
检验步骤如下:首先求出每对观察值的差值,得到差值序列;然后对差值求均值;最后检验差值序列的均值,即平均差是否与零有显著差异。如果平均差和零有显著差异,则认为两总体均值间存在显著差异;否则,认为两总体均值间不存在显著差异。
在运用SPSS软件实现的时候,SPSS将自动计算T值,由于该统计量服从n−1个自由度的T分布,SPSS将根据T分布表给出t值对应的相伴概率值。如果相伴概率值小于或等于用户设想的显著性水平α,则拒绝H0,认为两总体均值之间存在显著差异。相反,相伴概率大于显著性水平α,则不拒绝H0,可以认为两总体均值之间不存在显著差异。
二、 成对数据T检验实例与SPSS实现过程
(1) 实例
研究一个班同学在参加了暑假数学、化学培训班后,学习成绩是否有显著变化,数据如下表所示:
成对数据T检验实例(用SPSS16.0实现)_第2张图片
(2)SPSS实现过程
打开统计分析软件SPSS16.0的数据编辑器SPSS Data Editor,新建一个文件,设置四个变量(此处需要注意的是,这四个变量必须添加四个不同的标签,否则后续的步骤会报错),并把上面的数据输入到变量数据内容区中,然后在菜单栏依次点击Analyze -> Compare Mean ->Paired-Samples T Test,进入Paired-Samples T Test会话框,将左边的四个变量分别导入Paired Variables方框的Variable1和Variable2位置,如图1所示:
图1
成对数据T检验实例(用SPSS16.0实现)_第3张图片

然后点击右上角的Options按钮,将置信水平(Confidence Interval)设置为95%(相当于将显著性水平α设置为0.05),缺失值(Missing Values)保持默认选项,点击continue按钮回到Paired-Samples T Test会话框,点击OK按钮,得到结果如图2所示:成对数据T检验实例(用SPSS16.0实现)_第4张图片
三、 结果分析
首先看到成对样本统计表(Paired Samples Statistics),可以看到两组成对数据的均值(Mean)和标准差(Std Deviation)有差异但并不是特别明显,下面需要进一步验证培训前后的成绩是否有明显变化;另外,SPSS还给出了成对样本相关度(Paired Samples Correlations)的计算结果,可以看到第一对数据的相关度仅为-0.077,相关度很低,而第二队数据的相关度为0.434,相关程度相对高一些;最后看到成对样本T检验表(Paired Samples Test),第二列为差值序列的均值,第一对样本的差值序列均值很小,第二对样本的差值序列均值为-7.6111,比较小,最后一列为T检验的统计量的伴随概率,两者均大于显著性水平α=0.05,说明没有充分的理由拒绝原假设H0,即两成对总体均值的差μ与零没有显著性差异,从而得到结论为:培训前后数学和化学的成绩没有发生明显变化,进一步说明这个培训是没有显著效果的。

备注:
1、由于Markdown编辑器不支持数学公式编辑器MathType的公式复制,所以不得已只能事前在word写好博文,然后以截图的方式复制过来,所以有显示不清晰的地方请谅解一下,如果有疑问可以在评论留言,我们互相学习交流,谢谢。
2、文章的知识原理是学习了概率论与数理统计相关书籍后编写的,部分公式则是直接引用。

你可能感兴趣的:(数据分析与挖掘)