总结:14种常用的统计假设检验的方法

本文分享利用SPSSAU进行14个常用的统计假设检验的方法,分为以下五个部分:

一、正态性检验

正态性特质是很多分析方法的基础前提,如果不满足正态性特质,则应该选择其它的分析方法,因此在做某些分析时,需要先进行正态性检验。如果样本量大于50,则应该使用Kolmogorov-Smirnov检验结果,反之则使用Shapro-Wilk检验的结果。

SPSSAU将常见的分析方法正态性特质要求归纳如下表(包括分析方法,以及需要满足正态性的分析项,如果不满足时应该使用的分析方法)。

总结:14种常用的统计假设检验的方法_第1张图片

  • 分析步骤:

如果p 值大于0.05,则说明具有正态性特质,反之则说明数据没有正态性特质。

  • 关于问卷研究数据的正态性特质:

如果是问卷研究,数据很难满足正态性特质,而实际研究中却也很少使用不满足正态性分析时的分析方法。

SPSSAU认为有以下三点原因:

① 参数检验的检验效能高于非参数检验,比如方差分析为参数检验,所以很多时候即使数据不满足正态性要求也使用方差分析

② 如果使用非参数检验,呈现出差异性,则需要对比具体对比差异性(但是非参数检验的差异性不能直接用平均值描述,这与实际分析需求相悖,因此有时即使数据不正态,也不使用非参数检验,或者Spearman相关系数等)

③ 理想状态下数据会呈现出正态性特质,但这仅会出现在理想状态,现实中的数据很难出现正态性特质(尤其是比如问卷数据)【可直接使用“直方图”直观展示数据正态性情况】。

  • SPSSAU操作

总结:14种常用的统计假设检验的方法_第2张图片

二、方差齐检验

如果要进行方差分析,需要满足方差齐性的前提条件,需要进行方差齐检验,其用于分析不同定类数据组别对定量数据时的波动情况是否一致。例如研究人员想知道三组学生的智商 波动情况是否一致(通常情况希望波动一致,即方差齐)。

  • 分析步骤

判断p 值是否呈现出显著性(p <0.05),如果呈现出显著性,则说明不同组别数据波动不一致,即说明方差不齐;反之p 值没有呈现出显著性(p >0.05)则说明方差齐。

  • SPSSAU操作

总结:14种常用的统计假设检验的方法_第3张图片

提示:方差不齐时可使用‘非参数检验’,或者还可使用welch 方差,或者Brown-Forsythe方差。

三、相关性检验

(1)相关分析

相关分析是一种简单易行的测量定量数据之间的关系情况的分析方法。可以分析包括变量间的关系情况以及关系强弱程度等。相关系数常见有三类,分别是:

1.Pearson相关系数

2.Spearman等级相关系数

3.Kendall相关系数

三种相关系数最常使用的是Pearson相关系数;当数据不满足正态性时,则使用Spearman相关系数,Kendall相关系数用于判断数据一致性,比如裁判打分。下图是详细使用场景:

总结:14种常用的统计假设检验的方法_第4张图片

  • 分析步骤

如果呈现出显著性(结果右上角有*号,此时说明有关系;反之则没有关系)。

有了关系之后,关系的紧密程度直接看相关系数大小即可。(一般0.7以上说明关系非常紧密;0.4~0.7之间说明关系紧密;0.2~0.4说明关系一般。)

如果说相关系数值小于0.2,但是依然呈现出显著性(右上角有*号,1个*号叫0.05水平显著,2个*号叫0.01水平显著;显著是指相关系数的出现具有统计学意义普遍存在的,而不是偶然出现),说明关系较弱,但依然是有相关关系。

  • SPSSAU操作

总结:14种常用的统计假设检验的方法_第5张图片

(2)卡方检验

卡方检验主要用于研究定类与定类数据之间的差异关系。卡方检验要求X、Y项均为定类数据,即数字大小代表分类。并且卡方检验需要使用卡方值和对应p 值去判断X与Y之间是否有差异。通常情况下,共有三种卡方值,分别是Pearson卡方,yates校正卡方,Fisher卡方;优先使用Pearson卡方,其次为yates校正卡方,最后为Fisher卡方。

具体应该使用Pearson卡方,yates校正卡方,也或者Fisher卡方;需要结合X和Y的类别个数,校本量,以及期望频数格子分布情况等,选择最终应该使用的卡方值。SPSSAU已经智能化处理这一选择过程。

  • 分析步骤

第一:分析X分别与Y之间是否呈现出显著性(p值小于0.05或0.01);

第二:如果呈现出显著性;具体对比选择百分比(括号内值),描述具体差异所在;

第三:对分析进行总结。

  • SPSSAU操作

总结:14种常用的统计假设检验的方法_第6张图片

  • 方法说明:

卡方检验,SPSSAU提供两个按钮,二者的区别是,后者输出更多的统计量过程值以及深入指标表格,满足需要更多分析指标的研究人员,如下各图。

总结:14种常用的统计假设检验的方法_第7张图片

SPSSAU输出表

总结:14种常用的统计假设检验的方法_第8张图片

总结:14种常用的统计假设检验的方法_第9张图片

  • 数据格式说明:

进行卡方检验,上传数据时需要特别注意数据格式,有两种格式:常规格式和加权格式。

① 常规格式数据,如下图。则通用方法中的【交叉(卡方)】和实验/医学研究中的【卡方检验】都可以使用。

总结:14种常用的统计假设检验的方法_第10张图片

② 加权数据:但在某些情况下,我们得到的不是原始数据,而是经过整理的汇总统计数据。比如下面这样格式的数据:

总结:14种常用的统计假设检验的方法_第11张图片

类似这样的格式,不能直接使用的,需要整理成加权数据格式,只能使用实验/医学研究中的【卡方检验】

总结:14种常用的统计假设检验的方法_第12张图片


这时候点击实验/医学研究面板中的【卡方检验】-拖拽三个【分析变量】分别到对应分析框-【开始分析】即可。

总结:14种常用的统计假设检验的方法_第13张图片

四、参数检验

(1) 单样本t检验

单样本T检验用于比较样本数据与一个特定数值之间是否存在差异情况。

例如,调查某公司以五级李克量表进行员工满意度调查,‘4分’代表满意,可通过单样本t检验分析员工总体满意程度与“满意”(4)之间是否存在显著差异。
  • 分析步骤:

首先判断p 值是否呈现出显著性,如果呈现出显著性,则分析项明显不等于设定数字,具体差异可通过平均值进行对比判断。

  • SPSSAU操作:

总结:14种常用的统计假设检验的方法_第14张图片

(2)独立样本T检验(T检验)

独立样本T检验用于分析定类数据(X)与定量数据(Y)之间的差异情况。

独立样本T检验除了需要服从正态分布、还要求两组样本的总体方差相等。当数据不服从正态分布或方差不齐时,则考虑使用非参数检验。

例如,比较男生与女生的职业认知得分均值是否存在显著差异,可采用独立样本T检验进行分析。

  • 分析步骤:

首先判断p 值是否呈现出显著性,如果呈现出显著性,则说明两组数据具有显著性差异,具体差异可通过平均值进行对比判断。

  • SPSSAU操作:

总结:14种常用的统计假设检验的方法_第15张图片

(3)配对样本T检验

用于分析配对定量数据之间的差异对比关系。与独立样本t检验相比,配对样本T检验要求样本是配对的。两个样本的样本量要相同;样本先后的顺序是一一对应的。

常见的配对研究包括几种情况:

总结:14种常用的统计假设检验的方法_第16张图片

  • 数据格式例子

总结:14种常用的统计假设检验的方法_第17张图片

  • 分析步骤:

判断p 值是否呈现出显著性,如果呈现出显著性,,则说明配对数据具有显著性差异,具体差异可通过平均值进行对比判断。

  • SPSSAU操作:

总结:14种常用的统计假设检验的方法_第18张图片

(4)方差分析

方差分析(单因素方差分析),用于分析定类数据与定量数据之间的关系情况.例如研究人员想知道三组学生的智商平均值是否有显著差异。

进行方差分析需要数据满足以下两个基本前提:

  • 各观测变量总体要服从正态分布
  • 各观测变量的总体满足方差齐

理论上讲,数据必须满足以上两个条件才能进行方差分析,如不满足,则使用非参数检验。但现实研究中,数据多数情况下无法到达理想状态。正态性检验要求严格通常无法满足,实际研究中,若峰度绝对值小于10并且偏度绝对值小于3,或正态图基本上呈现出钟形,则说明数据虽然不是绝对正态,但基本可接受为正态分布,此时也可使用方差分析进行分析。

  • 分析步骤:

第一:分析X与Y之间是否呈现出显著性(p值小于0.05或0.01)。

第二:如果呈现出显著性;通过具体对比平均值大小,描述具体差异所在。

第三:如果没有呈现出显著性;说明X不同组别下,Y没有差异。

  • SPSSAU操作:

总结:14种常用的统计假设检验的方法_第19张图片

(5)重复测量方差

在某些实验研究中,常常需要考虑时间因素对实验的影响,当需要对同一观察单位在不同时间重复进行多次测量,每个样本的测量数据之间存在相关性,因而不能简单的使用方差分析进行研究,而需要使用重复测量方差分析。

  • 分析步骤:

第一、首先进行球形度检验,p <0.05说明没有通过球形度检验,p >0.05说明通过球形度检验;

第二、如果没有通过球形度检验,并且球形度W值大于0.75,则使用HF校正结果;

第三、如果没有通过球形度检验,并且球形度W值小于0.75,则使用GG校正结果;

第四、如果通过球形度检验,组内效应分析结果时使用“满足球形度检验”结果即可;

  • SPSSAU操作:

将数据上传至SPSSAU分析,选择【实验/医学研究】--【重复测量方差】。

总结:14种常用的统计假设检验的方法_第20张图片

总结:14种常用的统计假设检验的方法_第21张图片

五、非参数检验

凡是在分析过程中不涉及总体分布参数的检验方法,都可以称为“非参数检验”。因而,与参数检验一样,非参数检验包括许多方法。以下是最常见的非参数检验及其对应的参数检验对应方法:

总结:14种常用的统计假设检验的方法_第22张图片

非参数秩和检验研究X不同组别时Y的差异性,针对方差不齐,或者非正态性数据(Y)进行差异性对比(X为两组时使用mannWhitney检验,X超过两组时使用Kruskal-Wallis检验,系统默认进行判断);

(1)单样本Wilcoxon检验

单样本Wilcoxon检验是单样本t检验的代替方法。该检验用于检验数据是否与某数字有明显的区别,如对比调查对象整体态度与满意程度之间的差异。首先需要判断数据是否呈现出正态性分析特质,如果数据呈现出正态性特质,此时应该使用单样本t检验进行检验;如果数据没有呈现出正态性特质,此时应该使用单样本Wilcoxon检验

  • 分析步骤:

首先判断p 值是否呈现出显著性,如果呈现出显著性,则分析项明显不等于设定数字,具体差异可通过中位数进行对比判断。

  • SPSSAU操作:

总结:14种常用的统计假设检验的方法_第23张图片

(2)Mann-Whitney检验

Mann-Whitney检验是独立样本t检验的非参数版本。该检验主要处理包含等级数据的两个独立样本,SPSSAU中称为非参数检验。

  • 分析步骤:

第一:分析X与Y之间是否呈现出显著性(p值小于0.05或0.01)。

第二:如果呈现出显著性;通过具体对比中位数大小,描述具体差异情况。

  • SPSSAU操作:

总结:14种常用的统计假设检验的方法_第24张图片

(3)Kruskal-Wallis检验

Kruskal-Wallis检验是单因素方差分析的非参数替代方法。Kruskal-Wallis检验用于比较两个以上独立组的等级数据。

在SPSSAU中,与Mann-Whitney检验统称为“非参数检验”,分析时SPSSAU会根据自变量组别数自动选择使用Kruskal-Wallis检验或Mann-Whitney检验。

  • SPSSAU操作:

总结:14种常用的统计假设检验的方法_第25张图片

(4)配对Wilcoxon检验

Wilcoxon符号秩检验是配对样本t检验的非参数对应方法。该检验将两个相关样本与等级数据进行比较。

  • 分析步骤:

第一:分析每组配对项之间是否呈现出显著性差异(p值小于0.05或0.01)。

第二:如果呈现出显著性;具体对比中位数(或差值)大小,描述具体差异所在。

  • SPSSAU操作:

总结:14种常用的统计假设检验的方法_第26张图片

你可能感兴趣的:(数据分析,统计学,回归,数据挖掘,人工智能)