这里只讨论双侧参数假设检验,不包含单侧及非参的假设检验。
在参数假设检验中,总体的分布类型已知,假设检验的目的是对总体参数进行检验,为此,研究者需要事先提出某个假设,才能根据样本统计量判断假设是否真实。在参数假设检验中,“假设”是对总体参数的具体数值所作的陈述。为了使得作为证据的样本统计量必然支持且仅支持一个假设,要建立对于总体参数在逻辑上完备互斥的一对假设,即原假设(null hypothesis,记为 H 0 H_0 H0),备择假设(alternative hypothesis,记为 H 1 H_1 H1)。
原假设(又称零假设),是假定总体参数未发生变化;备择假设(又称对立假设),是假定总体参数发生变化。实际建立假设时,原假设与备择假设方向不同,会导致不同的结论,为此,在选择原假设和备择假设时,我们通常根据研究者是希望收集证据予以支持还是拒绝的判断作为选择依据。通常将研究者希望收集证据予以拒绝的假设作为原假设,而将研究者希望通过搜集证据予以支持的假设作为备择假设。
例如某产品质量标准为100g,我们想验证某一批产品是否合格,研究者通常想找出不合格产品,所以 H 0 : μ = 100 H_0: \mu=100 H0:μ=100, H 1 : μ ≠ 100 H_1: \mu\neq100 H1:μ=100。
第一类错误:原假设是正确的,却拒绝了原假设。
第二类错误:原假设是错误的,却没有拒绝原假设。
我们分别称之为拒真和纳伪。
决策 | H0为真 | H1为真 |
---|---|---|
接受H0 | 正确 | Type2 |
拒绝H0 | Type1 | 正确 |
我们想要在检验中尽可能地使两种错误概率同时减小,但实际上两种错误概率无法同时优化,除非提高样本量。所以通常的做法就是仅限制第一类错误的概率,为其找到一个阈值 α \alpha α,称之为显著性水平。
在假设检验中我们做出判断有两种方式:
p值计算方式:
用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值
以双侧检验U检验为例, x 0 x_0 x0为样本数据
H 0 : μ = μ 0 H_0: \mu=\mu_0 H0:μ=μ0, H 1 : μ ≠ μ 0 H_1: \mu\neq\mu_0 H1:μ=μ0
p v a l u e = P H 0 ( ∣ U ( X ) ∣ > U ( x 0 ) ) pvalue=P_{H_0}(|U(X)|>U(x_0)) pvalue=PH0(∣U(X)∣>U(x0))
U检验又称Z检验,U检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法(总体的方差已知)。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
推导:
X ‾ ∼ N ( μ , σ 0 2 n ) \overline{X}\sim N(\mu,\frac{\sigma_0^2}{n}) X∼N(μ,nσ02),得到 n ( X ‾ − μ ) σ ∼ N ( 0 , 1 ) \frac{\sqrt n(\overline{X}-\mu)}{\sigma}\sim N(0,1) σn(X−μ)∼N(0,1)。第一类错误概率 P H 0 ( ∣ n ( X ‾ − μ ) σ 0 ∣ > c ) ≤ α P_{H_0}(|\frac{\sqrt n(\overline{X}-\mu)}{\sigma_0}|>c)\leq \alpha PH0(∣σ0n(X−μ)∣>c)≤α,所以 c = u α / 2 c=u_{\alpha/2} c=uα/2,当 ∣ U ( x ) ∣ > u α / 2 |U(x)|>u_{\alpha/2} ∣U(x)∣>uα/2时拒绝原假设。
推导:
X 1 ‾ ∼ N ( μ 1 , σ 1 2 n 1 ) \overline{X_1}\sim N(\mu_1,\frac{\sigma_1^2}{n_1}) X1∼N(μ1,n1σ12), X 1 ‾ ∼ N ( μ 2 , σ 2 2 n 2 ) \overline{X_1}\sim N(\mu_2,\frac{\sigma_2^2}{n_2}) X1∼N(μ2,n2σ22),所以 X 1 ‾ − X 2 ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \overline{X_1}-\overline{X_2}\sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) X1−X2∼N(μ1−μ2,n1σ12+n2σ22),得到 X 1 ‾ − X 2 ‾ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\overline{X_1}-\overline{X_2}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) n1σ12+n2σ22X1−X2−(μ1−μ2)∼N(0,1)。第一类错误概率 P H 0 ( ∣ ( X 1 ‾ − X 2 ‾ ) σ 1 2 n 1 + σ 2 2 n 2 ∣ > c ) ≤ α P_{H_0}(|\frac{(\overline{X_1}-\overline{X_2})}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|>c)\leq \alpha PH0(∣n1σ12+n2σ22(X1−X2)∣>c)≤α,所以 c = u α / 2 c=u_{\alpha/2} c=uα/2,当 ∣ U ∣ > u α / 2 |U|>u_{\alpha/2} ∣U∣>uα/2时拒绝原假设。
T检验又称student t检验,T检验是一般用于小样本(即样本容量小于30)平均值差异性检验的方法(总体的方差未知)。所以T分布中用样本方差 S n 2 S_n^2 Sn2作为总体方差 σ 2 \sigma^2 σ2一个点估计进行计算。
推导:
首先引入一个定理, X 1 , . . . , X n ∼ i i d N ( μ , σ 2 ) X_1,...,X_n\sim_{iid}N(\mu,\sigma^2) X1,...,Xn∼iidN(μ,σ2), S n 2 = 1 n − 1 ∑ i = 1 n ( X − X ‾ ) 2 S_n^2=\frac{1}{n-1}\sum_{i=1}^{n}(X-\overline{X})^2 Sn2=n−11∑i=1n(X−X)2为样本方差,则
根据t分布的定义: T = ξ η / n T=\frac{\xi}{\sqrt{\eta/n}} T=η/nξ,其中 ξ ∼ N ( 0 , 1 ) \xi\sim N(0,1) ξ∼N(0,1), η ∼ X 2 ( n ) \eta\sim\mathcal{X}^2(n) η∼X2(n),则记为 T ∼ t ( n ) T\sim t(n) T∼t(n)。
所以检验统计量 T ( X ) = n ( X ‾ − μ 0 ) S n T(X)=\frac{\sqrt n(\overline{X}-\mu_0)}{S_n} T(X)=Snn(X−μ0)是满足 t ( n − 1 ) t(n-1) t(n−1)分布的,在 ∣ T ( x ) ∣ > t α / 2 ( n − 1 ) |T(x)|>t_{\alpha/2}(n-1) ∣T(x)∣>tα/2(n−1)情况下拒绝原假设。
推导:
总样本方差 S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 m ( Y i − Y ‾ ) 2 m + n − 2 S_{mn}^{*2}=\frac{\sum_{i=1}^m(X_i-\overline X)^2+\sum_{i=1}^m(Y_i-\overline Y)^2}{m+n-2} Smn∗2=m+n−2∑i=1m(Xi−X)2+∑i=1m(Yi−Y)2,在 H 0 H_0 H0成立时, ( m + n − 2 ) S m n ∗ 2 ∼ X 2 ( m + n − 2 ) (m+n-2)S_{mn}^{*2}\sim \mathcal{X}^2(m+n-2) (m+n−2)Smn∗2∼X2(m+n−2),所以 T ∼ t ( m + n − 2 ) T\sim t(m+n-2) T∼t(m+n−2), ∣ T ∣ > t α / 2 ( n − 1 ) |T|>t_{\alpha/2}(n-1) ∣T∣>tα/2(n−1)时拒绝原假设。
不同的前面的内容,F检验的内容更多也更复杂,先看一下百科上的介绍:
F检验(F-test),最常用的别名叫做联合假设检验(英语:joint hypotheses
test),此外也称方差比率检验、方差齐性检验。它是一种在零假设(null hypothesis,
H0)之下,统计值服从F-分布的检验。其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。
在实际应用中F检验有如下用途:
方差齐性检验是其最原始的用途,也与我们前面内容一脉相承,其他的用途在本文不过多介绍。在此之前我们先思考一个问题,前面的U和T检验都是对正态总体的均值进行假设,区别是方差是否已知,那么正态总体方差的检验又是什么样呢?
内容 | μ = μ 0 \mu=\mu_0 μ=μ0已知 | μ \mu μ未知 |
---|---|---|
假设 | H 0 : σ = σ 0 H_0: \sigma=\sigma_0 H0:σ=σ0, H 1 : σ ≠ σ 0 H_1: \sigma\neq\sigma_0 H1:σ=σ0 | H 0 : σ = σ 0 H_0: \sigma=\sigma_0 H0:σ=σ0, H 1 : σ ≠ σ 0 H_1: \sigma\neq\sigma_0 H1:σ=σ0 |
满足分布 | ∑ i = 1 n ( X i − μ 0 ) 2 σ 2 ∼ X 2 ( n ) \frac{\sum_{i=1}^n(X_i-\mu_0)^2}{\sigma^2}\sim\mathcal{X}^2(n) σ2∑i=1n(Xi−μ0)2∼X2(n) | ∑ i = 1 n ( X i − X ‾ ) 2 σ 2 ∼ X 2 ( n − 1 ) \frac{\sum_{i=1}^n(X_i-\overline X)^2}{\sigma^2}\sim\mathcal{X}^2(n-1) σ2∑i=1n(Xi−X)2∼X2(n−1) |
检验统计量 | X 2 = ∑ i = 1 n ( X i − μ 0 ) 2 σ 0 2 \mathcal{X}^2=\frac{\sum_{i=1}^n(X_i-\mu_0)^2}{\sigma_0^2} X2=σ02∑i=1n(Xi−μ0)2 | X 2 = ∑ i = 1 n ( X i − X ‾ ) 2 σ 0 2 \mathcal{X}^2=\frac{\sum_{i=1}^n(X_i-\overline X)^2}{\sigma_0^2} X2=σ02∑i=1n(Xi−X)2 |
拒绝域 | { X 2 < X 1 − α / 2 2 ( n ) } ∪ { X 2 > X α / 2 2 ( n ) } \{\mathcal{X}^2<\mathcal{X}_{1-\alpha/2}^2(n)\}\cup\{\mathcal{X}^2>\mathcal{X}_{\alpha/2}^2(n)\} {X2<X1−α/22(n)}∪{X2>Xα/22(n)} | { X 2 < X 1 − α / 2 2 ( n − 1 ) } ∪ { X 2 > X α / 2 2 ( n − 1 ) } \{\mathcal{X}^2<\mathcal{X}_{1-\alpha/2}^2(n-1)\}\cup\{\mathcal{X}^2>\mathcal{X}_{\alpha/2}^2(n-1)\} {X2<X1−α/22(n−1)}∪{X2>Xα/22(n−1)} |
内容 | μ 1 \mu_1 μ1, μ 2 \mu_2 μ2已知 | μ 1 \mu_1 μ1, μ 2 \mu_2 μ2未知 |
---|---|---|
假设 | H 0 : σ 1 = σ 2 H_0: \sigma_1=\sigma_2 H0:σ1=σ2, H 1 : σ 1 ≠ σ 2 H_1: \sigma_1\neq\sigma_2 H1:σ1=σ2 | H 0 : σ 1 = σ 2 H_0: \sigma_1=\sigma_2 H0:σ1=σ2, H 1 : σ 1 ≠ σ 2 H_1: \sigma_1\neq\sigma_2 H1:σ1=σ2 |
满足分布 | ∑ i = 1 n ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n ∼ F ( m , n ) \frac{\sum_{i=1}^n(X_i-\mu_1)^2/m}{\sum_{i=1}^n(Y_i-\mu_2)^2/n}\sim F(m,n) ∑i=1n(Yi−μ2)2/n∑i=1n(Xi−μ1)2/m∼F(m,n) | ∑ i = 1 n ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) ∼ F ( m − 1 , n − 1 ) \frac{\sum_{i=1}^n(X_i-\overline X)^2/(m-1)}{\sum_{i=1}^n(Y_i-\overline Y)^2/(n-1)}\sim F(m-1,n-1) ∑i=1n(Yi−Y)2/(n−1)∑i=1n(Xi−X)2/(m−1)∼F(m−1,n−1) |
检验统计量 | F = ∑ i = 1 n ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum_{i=1}^n(X_i-\mu_1)^2/m}{\sum_{i=1}^n(Y_i-\mu_2)^2/n} F=∑i=1n(Yi−μ2)2/n∑i=1n(Xi−μ1)2/m | F = ∑ i = 1 n ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum_{i=1}^n(X_i-\overline X)^2/(m-1)}{\sum_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=∑i=1n(Yi−Y)2/(n−1)∑i=1n(Xi−X)2/(m−1) |
拒绝域 | { F < F 1 − α / 2 2 ( m , n ) } ∪ { F > F α / 2 2 ( m , n ) } \{F |
{ F < F 1 − α / 2 2 ( m − 1 , n − 1 ) } ∪ { F > F α / 2 2 ( m − 1 , n − 1 ) } \{F |