统计学--假设检验过程

假设检验原理

  • 基础:小概率原理,即一般认为小概率事件在一次随机抽样中不会发生。
  • 基本思想:先建立一个关于样本所属总体的假设,考察在假设条件下随机样本的特征信息是否属小概率事件,若为小概率事件,则怀疑假设成立有悖于该样本所提供特征信息,因此拒绝假设
  • 事实上,小概率事件在随机抽样中还是可能发生的,只是发生的概率很小。若正好碰上了,则假设检验的结论就是错误的。当然,犯这种错误的概率很小。

假设检验过程

一、建立假设

根据统计推断的目的而提出的对总体特征的假设。统计学中的假设有两方面的内容:
  1. 检验假设(hypothesis to be tested),亦称原假设或无效假设(null hypothesis),记为 H 0 H_0 H0
  2. 与H0相对立的备择假设(alternative hypothesis),记为 H 1 H_1 H1。后者的意义在于当 H 0 H_0 H0 被拒绝时供采用。两者是互斥的,非此即彼。
    H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 H_0:\mu=\mu_0, H1:\mu≠\mu_0 H0μ=μ0H1μ̸=μ0;
    H 0 : μ 0 = 7.4 , H 1 : μ 0 ≠ 7.4 H_0:\mu _0=7.4, H1:\mu _0≠7.4 H0μ0=7.4H1μ0̸=7.4

二 、确定检验水准

  • 实际上就是确定拒绝 H 0 H_0 H0时的最大允许误差的概率。检验水准(size of test),常用 α \alpha α 表示,是指检验假设 H 0 H_0 H0本来是成立的,而根据样本信息拒绝 H 0 H_0 H0的可能性大小的度量,换言之, α \alpha α是拒绝了实际上成立的 H 0 H_0 H0的概率。
  • 常用的检验水准为 α \alpha α = 0.05,其意义是:在所设 H 0 H_0 H0的总体中随机抽得一个样本,其均数比手头样本均数更偏离总体均数的概率不超过5%

三、计算检验统计量和P值

  • 实际上在此之前还有一步叫做进行试验,所需的样本数据即从此得来
  • 统计量只是工具,概率值才是目的,它可以客观衡量样本对假设总体偏离程度
    • H 0 H_0 H0假设的总体中抽出现有样本(及更极端情况)的概率,即 P P P
  • 检验统计量的特点
    • 该统计量应当服从某种已知分布,从而可以计算出 P P P
    • 各种检验方法所利用的分布及计算原理不同,从而检验统计量也不同
    • 初学者往往本末倒置,很认真地在学工具,却忘记了统计学的本质是思维方式

四、得出推断结论

  • 按照事先确定的检验水准 α \alpha α界定上面得到的 P P P值,并按小概率原理认定对 H 0 H_0 H0的取舍,作出推断结论
  • 若P ≤ α \alpha α基于 H 0 H_0 H0假设的总体情况出现了小概率事件,则拒绝 H 0 H_0 H0,接受 H 1 H_1 H1,可以认为样本与总体的差别不仅仅是抽样误差造成的,可能存在本质上的差别,属“非偶然的(significant)”,因此,可以认为两者的差别有统计学意义。 进一步根据样本信息引申,得出实用性的结论
  • 若P> α \alpha α基于 H 0 H_0 H0出现了很常见的事件
    则样本与总体间的差别尚不能排除纯粹由抽样误差造成,可能的确属“偶然的(non-significant)”,故尚不能拒绝 H 0 H_0 H0
    因此,认为两者的差别无统计学意义,但这并不意味着可以接受 H 0 H_0 H0

结论不能绝对化

  • 本身就保留了犯错误的可能性
  • 样本量导致的检验效能问题
  • 样本量太小,导致检验效能不足,从而无法检出可能存在的差异
  • 样本量太大,得出的有统计学意义的结论可能根本就没有实际意义

你可能感兴趣的:(统计学)