连续变量的统计推断

连续变量的统计推断_第1张图片

连续变量的统计推断

    • 1 t检验
      • 1.1 t检验概述
      • 1.2 成组设计两样本均数的比较
    • 2 单因素方差分析
      • 2.1 方差分析概述

1 t检验

1.1 t检验概述

在针对连续变量的统计推断方法中,最常用的有t检验和方差分析两种,其中t检验是最基本的检验方法。

对于 X ‾ \overline{X} X - μ 仅看这一个数字很难判断出这种差异究竟是大是小。为此需要找到某种方式对这一差值进行标准化。标准化的思路是将该差值除以某种表示离散程度的指标。标准化变换:
在这里插入图片描述
其中,样本均数 X ‾ \overline{X} X的分布规律为正态分布n(μ,σ2/N),连续变量的统计推断_第2张图片
U检验看上去虽然很好,却实际上毫无用处,因为σ X ‾ \overline{X} X在 计算中需要使用总体标准差,但在实际工作中和总体均数一样也常常未知,能够使用的仅仅是样尔标准差s。

如果用样本标准量来代替总体标准差来进行计算,即s X ‾ \overline{X} X = s / 根号n ,则由于样本标准差s会随样本而变。相应的标化统计量的变异程度要大于 U,它的密度曲线看上去有些像标准正态分布但是尖一些而且尾巴长一些,这种分布称为t分布,相应的标化后统计量也就被称为t统计量。显然,t统计量的分布规律是和样本量有关的,更准确地说是和自由度(v/df)有关的。自由度是信息量的度量,描述了样本数据能自由取值的个数,在t分布中由于有给定的样本均数这一限定,所以自由度为 v = n - 1。从图中可以看出,自由度增加时它的分布就逐渐接近标准正态分布了。因此,在样本量较大时,可以用标准正态分布来近似t分布。
连续变量的统计推断_第3张图片
连续变量的统计推断_第4张图片
t检验仍然采用小概率反证法原理,其基本思想是:首先假设H0成立 ,然后考察在H0成立的条件下,按照现有样本量做随机抽样在相应的总体中抽到现有样本,以及比现有样本与总体的差异更大的样本的累积概率,如果相应的概率 P<=α( 检验水准),因 拒绝H0假设,接受对立的H1假设,认为现有样本井非来自于所假定的总体。

另外,根据具体的设计方案和希望解决的问题不同,又可以将t检验分为单样本t检验、两样本t检验和配对t检验等,但它们的基本原理都是相同的。

t检验在SPSS中基本上被集中在“比较均值”子菜单中,具体如下:

  • 单样本t检验过程:进行样本均数与已知总体均数的比较
  • 独立样本t检验过程:进行两样本均数差别的比较,及通常所说的两组资料的t检验
  • 配对样本t检验过程:进行配对资料的均数比较,即配对t检验

1.2 成组设计两样本均数的比较

作为参数方法,t检验也有适用的条件,但相对而言它比较稳健,对使用条件的违反有一定的耐受性。但如果使用条件被严重违反,则可以采用校正的t检验,或者换用非参数方法来进行分析。

在应用t检验进行两样本均数的比较时,要求数据满足以下条件:

  • 独立性,各观察值之间是相互独立的,不能相互影响
  • 正态性,各个样本均来自于正态分布的总体
  • 方差齐性,各样本所在总体的方差相等

2 单因素方差分析

2.1 方差分析概述

方差分析(ANOVA)的理论基础:将总变异分解为由研究因素所造成的部分和 由抽样误差所造成的部分,通过比较来自于不同部分的变异,借助F分布做出统计推断。后人又将线性模型的思想引入方差分析,更是为这一方法提供了近乎无穷的发展空间。

单因素方差分析所针对的是多组均数间的比较。它的基本思想:方差分析是基于变异分解的思想进行的,在单因素方差分析中,整个样本的变异可以看成由如下两个部分构成:

总变异 = 随机变异 + 处理因素导致的变异

其中随机变异是永远存在的,确定处理因素导致的变异是否存在就是所要达到的研究目标,即只要能证明它不等于0,就等同于证明了处理因素的确存在影响。

连续变量的统计推断_第5张图片

方差分析的检验统计量可以简单地理解为利用随机误差作为尺度来衡量各组间的变异,即
F = 组间变异测量指标 / 组内变异测量指标

则在H0成立时,处理所造成的各组间均数的差异应为0(理论上应为0,但由于抽样误差不可能恰好为0),即
μ1 = μ2 = μ3 = … … = μk

连续变量的统计推断_第6张图片
连续变量的统计推断_第7张图片

单因素方差分析的应用条件

  • 观察对象是来自于所研究因素的各个水平之下的独立随机抽样(Independence)
  • 每个水平下的应变量应当服从正态分布( Normality)
  • 各水平下的总体具有相同的方差(Homoscedascity)
    其实,与t检验的应用条件大同小异,概括起来就是独立性、正态性和方差齐性。

方差分析拒绝H0只能说明各组之间存在差异,但并不足以说明各组之间的关系。利用多重比较可以初步判断各组间的关系。

多重比较可以分为事前计划好的比较和事后比较。前者往往借助于 Contrast,而很多种不同的方法,这些方法的核心问题都是如何控制总的一类错误的大小。

在分组变量包含次序信息时,如果方差分析给出了各组间差异有统计学意义的结论,井且 Means-Plot 提示各组均数的某种趋势时,可以利用趋势分析探讨观察值与分组变量间间的数量依存关系。

你可能感兴趣的:(统计学)