推断统计是根据样本数据推断总体特征的方法。 参数检验是推断统计的重要组成部分。
总体分布已知情况下为参数检验;总体分布未知的情况下,为非参数检验。
SPSS的均值过程是描述和分析尺度变量(Scale)的一种有用的方法,可以获取要分析变量的许多中心趋势和离散趋势的统计指标,同时可以对不同组别或者交叉组别进行比较。其中,t检验应用于研究单样本均值的比较和两个均值的比较。
T检验,主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。
SPSS中t检验有三类可选:
以SPSS自带数据范例sample中的brakes.sav为例,进行单样本的T检验分析。
该假设数据文件涉及某生产高性能汽车盘式制动器的工厂的质量控制。该数据文件包含对 8 台专用机床中每一台的 16 个盘式制动器的直径测量。盘式制动器的目标直径为 322 毫米。
我们需要对各个机器分别进行检验其是否符合标准,因此需要根据机器拆分数据文件。
数据 > 拆分文件 > 比较组
数据为小样本并且样本服从正态分布,可以采用单样本的T检验分析。
分析 > 比较平均值 > 单样本T检验
设置检验值为322
机器号为2,4,7的机器刹车片直径不符合要求。其t检验显著性低于0.05,差异具有统计学意义,表示其刹车片直径和目标直径为 322 毫米有显著性差异。
两独立样本的T检验,目的是推断两个样本分别代表的总体均数是否相等,一般假设为相等,sig<0.05,即拒绝原假设,两样本有差异。
使用SPSS自带数据范例sample中的creditpromo.sav。
该假设数据文件涉及某百货公司在评价最新信用卡促销的效果方面的举措。为此,随机选择了 500 位持卡人。其中一半收到了宣传关于在接下来的三个月内降低消费利率的广告。另一半收到了标准的季节性广告。
目的是比较两种促销方式下用户信用卡消费均值,看两者是否在统计上有明显差异。
使用T检验前需要检查样本是否服从正态分布。
可以应用直方图、Q-Q图、K-S检验等方法检验差值变量的正态性。 还可以利用箱图检验离群值。
进行探索性分析,通过正态分布检验,检验数据是否服从正态分布。
分析 > 描述统计> 探索
显著性sig >0.05,说明与正态性没有显著差异,成正态分布。
查看Q-Q图进一步确认。
显然,散点能够与斜线重合,说明该数据序列符合正态分布。
若数据点明显分散在直线两侧,则说明数据不成正态分布。
分析 > 比较平均值 > 独立样本T检验
从样本均值来看,新促销下,消费者平均消费要高于标准促销71美元。
T检验统计量为-2.26,sig值为0.024<0.05,两者差异显著。超市应该推广新促销模式。
以samples中dietstudy.sav为案例进行分析。
该假设数据文件包含对"Stillman diet" 7 的研究结果。每个个案对应一个单独的主体,并记录其在实行饮食方案前后的体重(磅)以及甘油三酸酯的水平(毫克/100 毫升)。
两个样本某变量均值不同,其差异是否具有统计意义,能否说明总体差异?需要进行均值比较来来研究。
与之前相同,使用配对T检验前也需要检查两个样本是否服从正态分布。
经检验,样本符合T检验使用标准,下面进行分析。
施行饮食方案后,样本甘油三酸酯指标水平下降14.06,体重下降8磅。从标准差看,体重相对于甘油三酸酯变异度更大。
甘油三酸酯指标的相关系数为-0.286,统计意义上无显著相关关系。因为总体上看甘油三酸酯虽然降低了,但16个样本在该指标上的变化很不一致,有的没有变化,有的反而上升了。
但所有样本的体重相关系数为0.996, 显著性为0.00,数据差异性显著,说明实行饮食方案前后样本的体重都一致的降低了。
t值为t统计量。