参数假设检验

目录

    • 一、基本思想
    • 二、两类错误
    • 三、检验步骤
    • 四、一个总体参数的检验
      • 总体均值的检验
      • 总体比例的检验
      • 总体方差的检验
    • 五、两个总体参数的检验
      • 两个总体均值之差的检验
      • 两个总体比例之差的检验
      • 两个样本方差比的检验


一、基本思想

​ 无论是怎样的假设,假设检验的思想是一样的,就是所谓概率性质的反证法。其根据是实际推断原理:小概率事件在一次试验中是几乎不可能发生的。进一步讲,要检验某假设H0,先假设H0正确,在此假设下构造某一事件A,它在H0正确的条件下概率很小,例如 P ( A ∣ H 0 ) = α ( = 0.05 ) P(A|H_0)=α(=0.05) P(AH0)=α(=0.05)。现在进行一次实验,如果A事件发生了,也就是说小概率事件在一次实验中居然发生了,这与实际推断原理相矛盾,这表明“假定H0为正确”是错误的,因而拒绝H0;反之,如果小概率事件没有发生,我们就没有理由拒绝H0,通常就接受H0


二、两类错误

​ 从主观上讲,我们总希望经过假设检验,能作出正确的判断,即若H0确实为真,则接受H0;若H0确实为假,则拒绝H0。但在客观上,我们是根据样本所确定的统计量的值来推断的,由于样本的随机性,在推断时就不免要犯错误。

  • 第一类错误——弃真 α = P ( 拒 绝 H 0 ∣ H 0 为 真 ) α=P(拒绝H_0|H_0为真) α=P(H0H0)
  • 第二类错误——取伪 β = P ( 接 受 H 0 ∣ H 0 为 假 ) β=P(接受H_0|H_0为假) β=P(H0H0)

​ 我们当然希望犯两类错误的概率都很小,但是在样本容量固定时是办不到的。通常把解决这一问题的原则简化成只对第一类错误的最大概率α加以限制,而不考虑犯第二类错误的概率β。这种统计假设检验问题称为显著性检验,并将犯第一类错误的最大概率α称为假设检验的显著性水平

​ 在一个假设检验问题中,拒绝原假设H0的最小显著性水平称为检验的p值


三、检验步骤

  1. 提出原假设H0与备择假设H1
  2. 选择检验统计量W并确定其分布;
  3. 在给定的显著性水平下,确定H0关于统计量W的拒绝域;
  4. 算出样本点对应的检验统计量的值;
  5. 判断:若统计量的值落在拒绝域内,则拒绝H0,否则接受H0

四、一个总体参数的检验

总体均值的检验

1、方差已知时μ的检验:z检验
z = X ‾ − μ 0 σ 0 / n ∼ N ( 0 , 1 ) z = {\overline{X}-μ_0\overσ_0/\sqrt{n}} \sim N(0,1) z=σ0/n Xμ0N(0,1)

2、方差未知时μ的检验:t检验
t = X ‾ − μ 0 S / n ∼ t ( n − 1 ) t={\overline X-μ_0\over S/\sqrt n}\sim t(n-1) t=S/n Xμ0t(n1)

总体比例的检验

X 1 , . . . , X n X_1,...,X_n X1,...,Xn为来自总体比例为 p 0 p_0 p0的二项分布的样本。当样本容量较大时,比例p的抽样分布可近似地服从正态分布,因此我们可将问题转化为正态分布处理。
z = p − p 0 p 0 ( 1 − p 0 ) / n ∼ N ( 0 , 1 ) z={p-p_0\over \sqrt {p_0(1-p_0)/n}}\sim N(0,1) z=p0(1p0)/n pp0N(0,1)

总体方差的检验

方差σ2的检验:χ2检验
χ 2 = ( n − 1 ) S 2 σ 0 2 ∼ χ 2 ( n − 1 ) χ^2={(n-1)S^2\over σ_0^2}\sim χ^2(n-1) χ2=σ02(n1)S2χ2(n1)


五、两个总体参数的检验

两个总体均值之差的检验

1、 σ 1 2 , σ 2 2 σ_1^2,σ_2^2 σ12,σ22已知:z检验

​ 当两个总体均服从正态分布或虽然两个总体的分布形式未知,但抽自两个总体的样本量均较大,且两个总体的方差已知时,可以证明,由两个独立样本计算出的 x 1 ‾ − x 2 ‾ \overline {x_1}-\overline {x_2} x1x2的抽样分布服从正态分布,标准差为:
σ x 1 ‾ − x 2 ‾ = σ 1 2 n 1 + σ 2 2 n 2 σ_{\overline {x_1}-\overline {x_2}}=\sqrt{{σ_1^2\over n_1}+{σ_2^2\over n_2}} σx1x2=n1σ12+n2σ22
此时,作为检验统计量z的计算公式为:
z = ( x 1 ‾ − x 2 ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) z={(\overline {x_1}-\overline {x_2})-(μ_1-μ_2)\over \sqrt{{σ_1^2\over n_1}+{σ_2^2\over n_2}}}\sim N(0,1) z=n1σ12+n2σ22 (x1x2)(μ1μ2)N(0,1)
2、 σ 1 2 , σ 2 2 σ_1^2,σ_2^2 σ12,σ22未知,且n较小:t检验
t = ( x 1 ‾ − x 2 ‾ ) − ( μ 1 − μ 2 ) ( 1 n 1 + 1 n 2 ) S 2 ∼ t ( n 1 + n 2 − 2 ) t={(\overline {x_1}-\overline {x_2})-(μ_1-μ_2)\over \sqrt {(\frac 1{n_1}+\frac 1{n_2})S^2}}\sim t(n_1+n_2-2) t=(n11+n21)S2 (x1x2)(μ1μ2)t(n1+n22)

两个总体比例之差的检验

​ 设两个总体服从二项分布,这两个总体中具有某种特征单位数的比例分别为 π 1 π_1 π1 π 2 π_2 π2,但 π 1 π_1 π1 π 2 π_2 π2未知,可以用样本比例 p 1 p_1 p1 p 2 p_2 p2代替。在大样本条件下,统计量z的表达式为
z = p 1 − p 2 p ( 1 − p ) ( 1 n 1 + 1 n 2 ) ∼ N ( 0 , 1 ) z={p_1-p_2\over \sqrt{p(1-p)(\frac 1{n_1}+\frac 1{n_2})}}\sim N(0,1) z=p(1p)(n11+n21) p1p2N(0,1)
其中 p = p 1 n 1 + p 2 n 2 n 1 + n 2 p={p_1n_1+p_2n_2\over n_1+n_2} p=n1+n2p1n1+p2n2为将两个样本合并后得到的比例估计量。

两个样本方差比的检验

方差的比较:F检验
F = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac {S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22S12F(n11,n21)

你可能感兴趣的:(数据分析)