无论是怎样的假设,假设检验的思想是一样的,就是所谓概率性质的反证法。其根据是实际推断原理:小概率事件在一次试验中是几乎不可能发生的。进一步讲,要检验某假设H0,先假设H0正确,在此假设下构造某一事件A,它在H0正确的条件下概率很小,例如 P ( A ∣ H 0 ) = α ( = 0.05 ) P(A|H_0)=α(=0.05) P(A∣H0)=α(=0.05)。现在进行一次实验,如果A事件发生了,也就是说小概率事件在一次实验中居然发生了,这与实际推断原理相矛盾,这表明“假定H0为正确”是错误的,因而拒绝H0;反之,如果小概率事件没有发生,我们就没有理由拒绝H0,通常就接受H0。
从主观上讲,我们总希望经过假设检验,能作出正确的判断,即若H0确实为真,则接受H0;若H0确实为假,则拒绝H0。但在客观上,我们是根据样本所确定的统计量的值来推断的,由于样本的随机性,在推断时就不免要犯错误。
我们当然希望犯两类错误的概率都很小,但是在样本容量固定时是办不到的。通常把解决这一问题的原则简化成只对第一类错误的最大概率α加以限制,而不考虑犯第二类错误的概率β。这种统计假设检验问题称为显著性检验,并将犯第一类错误的最大概率α称为假设检验的显著性水平。
在一个假设检验问题中,拒绝原假设H0的最小显著性水平称为检验的p值。
1、方差已知时μ的检验:z检验
z = X ‾ − μ 0 σ 0 / n ∼ N ( 0 , 1 ) z = {\overline{X}-μ_0\overσ_0/\sqrt{n}} \sim N(0,1) z=σ0/nX−μ0∼N(0,1)
2、方差未知时μ的检验:t检验
t = X ‾ − μ 0 S / n ∼ t ( n − 1 ) t={\overline X-μ_0\over S/\sqrt n}\sim t(n-1) t=S/nX−μ0∼t(n−1)
X 1 , . . . , X n X_1,...,X_n X1,...,Xn为来自总体比例为 p 0 p_0 p0的二项分布的样本。当样本容量较大时,比例p的抽样分布可近似地服从正态分布,因此我们可将问题转化为正态分布处理。
z = p − p 0 p 0 ( 1 − p 0 ) / n ∼ N ( 0 , 1 ) z={p-p_0\over \sqrt {p_0(1-p_0)/n}}\sim N(0,1) z=p0(1−p0)/np−p0∼N(0,1)
方差σ2的检验:χ2检验
χ 2 = ( n − 1 ) S 2 σ 0 2 ∼ χ 2 ( n − 1 ) χ^2={(n-1)S^2\over σ_0^2}\sim χ^2(n-1) χ2=σ02(n−1)S2∼χ2(n−1)
1、 σ 1 2 , σ 2 2 σ_1^2,σ_2^2 σ12,σ22已知:z检验
当两个总体均服从正态分布或虽然两个总体的分布形式未知,但抽自两个总体的样本量均较大,且两个总体的方差已知时,可以证明,由两个独立样本计算出的 x 1 ‾ − x 2 ‾ \overline {x_1}-\overline {x_2} x1−x2的抽样分布服从正态分布,标准差为:
σ x 1 ‾ − x 2 ‾ = σ 1 2 n 1 + σ 2 2 n 2 σ_{\overline {x_1}-\overline {x_2}}=\sqrt{{σ_1^2\over n_1}+{σ_2^2\over n_2}} σx1−x2=n1σ12+n2σ22
此时,作为检验统计量z的计算公式为:
z = ( x 1 ‾ − x 2 ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) z={(\overline {x_1}-\overline {x_2})-(μ_1-μ_2)\over \sqrt{{σ_1^2\over n_1}+{σ_2^2\over n_2}}}\sim N(0,1) z=n1σ12+n2σ22(x1−x2)−(μ1−μ2)∼N(0,1)
2、 σ 1 2 , σ 2 2 σ_1^2,σ_2^2 σ12,σ22未知,且n较小:t检验
t = ( x 1 ‾ − x 2 ‾ ) − ( μ 1 − μ 2 ) ( 1 n 1 + 1 n 2 ) S 2 ∼ t ( n 1 + n 2 − 2 ) t={(\overline {x_1}-\overline {x_2})-(μ_1-μ_2)\over \sqrt {(\frac 1{n_1}+\frac 1{n_2})S^2}}\sim t(n_1+n_2-2) t=(n11+n21)S2(x1−x2)−(μ1−μ2)∼t(n1+n2−2)
设两个总体服从二项分布,这两个总体中具有某种特征单位数的比例分别为 π 1 π_1 π1和 π 2 π_2 π2,但 π 1 π_1 π1和 π 2 π_2 π2未知,可以用样本比例 p 1 p_1 p1和 p 2 p_2 p2代替。在大样本条件下,统计量z的表达式为
z = p 1 − p 2 p ( 1 − p ) ( 1 n 1 + 1 n 2 ) ∼ N ( 0 , 1 ) z={p_1-p_2\over \sqrt{p(1-p)(\frac 1{n_1}+\frac 1{n_2})}}\sim N(0,1) z=p(1−p)(n11+n21)p1−p2∼N(0,1)
其中 p = p 1 n 1 + p 2 n 2 n 1 + n 2 p={p_1n_1+p_2n_2\over n_1+n_2} p=n1+n2p1n1+p2n2为将两个样本合并后得到的比例估计量。
方差的比较:F检验
F = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac {S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22S12∼F(n1−1,n2−1)