U 检验


U 检验也叫 Z 检验,指检验统计量服从方差已知的正态分布的假设检验。


U检验/Z检验

  • 单样本 U 检验
    • 应用条件
    • 应用过程
      • [2°](#2 '点击跳转到定义')
      • [3°](#2 '点击跳转到定义')
    • 实验设计
  • 双样本 U 检验
    • 应用条件
    • 应用过程
      • [2°](#3 '点击跳转到定义')
  • 附录
    • 中心极限定理
    • 假设检验一般步骤
    • 势函数
  • Technical Note
  • 推荐资源

U 检验_第1张图片

单样本 U 检验

U 检验也叫 Z 检验,定义为:检验的检验统计量 Z 由:
Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn (Xˉμ0)
求出,其中 n n n 为样本容量, μ 0 \mu_0 μ0 是通过假设知晓的常数, σ \sigma σ 为总体的标准差。

且满足如下条件:
服从正态分布 ⏟ 中心极限定理   +   且 分 布 的 σ 已知 ⏟ 有精准估计 \underbrace{\text{服从正态分布}}_{\text{中心极限定理}}~+~ \underbrace{且分布的 \sigma \text{已知}}_{\text{有精准估计}} 中心极限定理 服从正态分布 + 有精准估计 σ已知
U 检验一般用于:位置参数(location parameter)检验,例如总体的均值

中心极限定理:
多个样本和的标准化,在 n → ∞ n\to\infin n 的情况下服从正态分布。一般的,当 n > 30 n>30 n>30 时,可以视为正态分布,采用 U 检验
有精确估计:
很多情况下 σ \sigma σ 本质上都是测量而来,是一种精确的估计。因此,若 σ \sigma σ 未知,若能够保证精确度,也可以用估计值,样本标准差 S S S 代替。一般需要 n > 50 n>50 n>50

返回目录

应用条件

根据定义

前提    :       样 本 i . i . d , 且 分 布 等 于 总 体 分 布 1.    Z 服 从 正 态 分 布 , 且 分 布 的 σ 已 知 或    : 2.    样 本 容 量 n > 30 , 且 分 布 σ 已 知 或    : 3.    样 本 容 量 n > 50 \begin{aligned} && &\textbf{前提}~~:\\ && &~~~~~ 样本 i.i.d, 且分布等于总体分布\\ \\ && &1.~~ Z服从正态分布,且分布的 \sigma已知 \\ && &\textbf{或}~~:\\ && &2.~~ 样本容量 n>30,且分布\sigma已知 \\ && &\textbf{或}~~:\\ && &3.~~ 样本容量 n>50 \\ \end{aligned} 前提  :     i.i.d1.  Zσ  :2.  n>30σ  :3.  n>50

返回目录

应用过程

设总体 X 服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) μ \mu μ 未知, σ \sigma σ 已知。现从总体中抽出 n n n i . i . d i.i.d i.i.d 的样品 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn,共同的分布为总体分布。

验证假设:
1 ∘ : H 0 : μ = μ 0      H 1 : μ ≠ μ 0 1^{\circ}:H_0:\mu=\mu_0~~~~H_1:\mu\neq\mu_0 1:H0:μ=μ0    H1:μ=μ0
2 ∘ : H 0 : μ ≤ μ 0      H 1 : μ > μ 0 2^{\circ}:H_0:\mu\leq\mu_0~~~~H_1:\mu>\mu_0 2:H0:μμ0    H1:μ>μ0
3 ∘ : H 0 : μ ≥ μ 0      H 1 : μ < μ 0 3^{\circ}:H_0:\mu\geq\mu_0~~~~H_1:\mu<\mu_0 3:H0:μμ0    H1:μ<μ0

对于第一种假设,原假设取值为一个点,备选假设取值为两边,这类假设对应的检验,也叫双边检验。根据定义,检验统计量为:
Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn (Xˉμ0)
根据样本的性质,可知 X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu,\frac{\sigma^2}{n}) XˉN(μ,nσ2) ,于是 Z ∼ N ( n ( μ − μ 0 ) σ , 1 ) Z\sim N(\frac{\sqrt{n}(\mu-\mu_0)}{\sigma},1) ZN(σn (μμ0),1)

根据假设检验的一般步骤:
给 定 显 著 水 平 α , ∵ ∣ Z ∣ ↑ , H 0 越 难 成 立 , ⇓ 令 : P { ∣ Z = n ( X ˉ − μ 0 ) σ ∣ > C ∣ H 0 } ≤ α 在 原 假 设 和 成 立 时 , X ˉ ∼ N ( μ 0 , σ 2 / n ) , Z ∼ N ( 0 , 1 ) ⇓ C = u α / 2 , u 1 − α / 2 ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , u α / 2 ) ∪ ( u 1 − α / 2 , + ∞ ) 给定显著水平 \alpha,\because |Z|\uarr ,H_0 越难成立,\\ \Darr \\ 令:P\{\vert Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}\vert>C|H_0\}\leq \alpha \\ \\ 在原假设和成立时,\bar{X}\sim N(\mu_0,\sigma^2/n),Z\sim N(0,1)\\ \Darr\\ C=u_{\alpha/2},u_{1-\alpha/2}\\ \Darr\\ 求得拒绝域为 Z\in(-\infin,u_{\alpha/2})\cup(u_{1-\alpha/2},+\infin) αZ,H0P{ Z=σn (Xˉμ0)>CH0}αXˉN(μ0,σ2/n)ZN(0,1)C=uα/2,u1α/2Z(,uα/2)(u1α/2,+)
故只要求出检验统计量的观察值,根据拒绝域做出判断即可。

注意,检验是否属于双边,不是由拒绝域是否双边决定的,而是由假设决定,下文读者将会体会到其中的差异。

返回目录

根据定义,检验统计量为:
Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn (Xˉμ0)
根据假设检验的一般步骤
给 定 显 著 水 平 α , ∵ Z ↑ , H 0 越 难 成 立 , ⇓ 令 : P { Z = n ( X ˉ − μ 0 ) σ > C ∣ H 0 } ≤ α   P { n ( X ˉ − μ 0 ) σ > C ∣ μ ≤ μ 0 } ≤ α ⇓ P { n ( X ˉ − μ ) σ > C + n ( μ 0 − μ ) σ ∣ μ ≤ μ 0 } ⇓ ∵ n ( μ 0 − μ ) σ 随 着 μ ↑ 单 调 递 增   ∴ μ = μ 0 时 , P { n ( X ˉ − μ ) σ > C + n ( μ 0 − μ ) σ } 最 大 ⇓ 此 时 n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) ⇓ C = u 1 − α ⇓ 求 得 拒 绝 域 为 Z ∈ ( u 1 − α , + ∞ ) 给定显著水平 \alpha,\because Z\uarr,H_0 越难成立,\\ \Darr \\ 令:P\{ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}>C|\mu\leq\mu_0\}\leq \alpha \\ \Darr \\ P\{\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}>C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}|\mu\leq\mu_0\}\\ \Darr\\ \because\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}随着\mu\uarr 单调递增\\ ~\\ \therefore \mu=\mu_0时,P\{\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}>C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}\}最大\\ \Darr\\ 此时\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\\ \Darr\\ C=u_{1-\alpha}\\ \Darr\\ 求得拒绝域为 Z\in(u_{1-\alpha},+\infin) αZ,H0P{ Z=σn (Xˉμ0)>CH0}α P{ σn (Xˉμ0)>Cμμ0}αP{ σn (Xˉμ)>C+σn (μ0μ)μμ0}σn (μ0μ)μ μ=μ0P{ σn (Xˉμ)>C+σn (μ0μ)}σn (Xˉμ)N(0,1)C=u1αZ(u1α,+)
对于这类假设为单边,也称为单边(one-tailed)检验。单边检验的显著水平 α \alpha α,是对每个 μ \mu μ 都成立的上确界。而相反的,双边检验的原假设,往往对应一个值。

返回目录

根据定义,检验统计量为:
Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn (Xˉμ0)
根据假设检验的一般步骤
给 定 显 著 水 平 α , ∵ Z ↓ , H 0 越 难 成 立 , ⇓ 令 : P { Z = n ( X ˉ − μ 0 ) σ < C ∣ H 0 } ≤ α   P { n ( X ˉ − μ 0 ) σ < C ∣ μ ≥ μ 0 } ≤ α ⇓ P { n ( X ˉ − μ ) σ < C + n ( μ 0 − μ ) σ ∣ μ ≤ μ 0 } ⇓ ∵ n ( μ 0 − μ ) σ 随 着 μ ↑ 单 调 ↓   ∴ μ = μ 0 时 , P { n ( X ˉ − μ ) σ < C + n ( μ 0 − μ ) σ } 最 大 ⇓ 此 时 n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) ⇓ C = u α ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , u α ) 给定显著水平 \alpha,\because Z\darr,H_0 越难成立,\\ \Darr \\ 令:P\{ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}αZ,H0P{ Z=σn (Xˉμ0)<CH0}α P{ σn (Xˉμ0)<Cμμ0}αP{ σn (Xˉμ)<C+σn (μ0μ)μμ0}σn (μ0μ)μ μ=μ0P{ σn (Xˉμ)<C+σn (μ0μ)}σn (Xˉμ)N(0,1)C=uαZ(,uα)

返回目录

实验设计

在进行采样时,通常需要事前确定 n n n

以 2° 为例,给定显著水平 α \alpha α ∵ Z ↑ , H 0 \because Z\uarr,H_0 Z,H0 越难成立, ∴ \therefore 设定检验标准(拒绝)为: Z > C Z>C Z>C

定义势函数为:
p ( μ ) = P { Z > C ∣ μ ∈ ( − ∞ , ∞ ) } = P { n ( X ˉ − μ ) σ ≥ C + n ( μ 0 − μ ) σ ∣ μ ∈ ( − ∞ , ∞ ) } ∵    n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) = 1 − Φ ( C − n ( μ 0 − μ ) σ ) \begin{aligned} p(\mu)&=P\{ Z > C| \mu\in(-\infin,\infin)\} \\ &= P\{ \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \geq C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}| \mu\in(-\infin,\infin)\} \\ \because ~~&\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\\ &=1-\Phi(C-\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) \end{aligned} p(μ)  =P{ Z>Cμ(,)}=P{ σn (Xˉμ)C+σn (μ0μ)μ(,)}σn (Xˉμ)N(0,1)=1Φ(Cσn (μ0μ))
α \alpha α,则根据检验标准的临界值求取法则,有:
s u p μ { 1 − Φ ( C − n ( μ 0 − μ ) σ ) ∣ μ ∈ ( − ∞ , μ 0 ) } < = α \underset{\mu}{sup} \{1-\Phi(C-\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})|\mu\in(-\infin,\mu_0)\} <= \alpha μsup{ 1Φ(Cσn (μ0μ))μ(,μ0)}<=α
最后得到检验标准的临界值 C = u 1 − α C=u_{1-\alpha} C=u1α

回代入势函数,可得:
p ( μ ) = 1 − Φ ( u 1 − α − n ( μ 0 − μ ) σ ) p(\mu) = 1-\Phi(u_{1-\alpha}-\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) p(μ)=1Φ(u1ασn (μ0μ))
其中有两个重要的性质:

  1. 势函数是 n ( μ 0 − μ ) σ \frac{\sqrt{n}(\mu_0-\mu)}{\sigma} σn (μ0μ) 的函数,且是连续的、非减的。
  2. l i m μ → μ 0 Φ ( u 1 − α − n ( μ 0 − μ ) σ ) = α l i m μ → + ∞ Φ ( u 1 − α − n ( μ 0 − μ ) σ ) = 1 \underset{\mu\to\mu_0}{lim} \Phi(u_{1-\alpha}-\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=\alpha\\ \underset{\mu\to+\infin}{lim} \Phi(u_{1-\alpha}-\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=1 μμ0limΦ(u1ασn (μ0μ))=αμ+limΦ(u1ασn (μ0μ))=1

设无差别区域为 μ ∈ ( μ 0 , Δ ) \mu\in(\mu_0,\Delta) μ(μ0,Δ),则对于 [ Δ , + ∞ ] [\Delta,+\infin] [Δ,+],给定一个 β \beta β,使得 p ( μ ) ≥ 1 − β p(\mu)\geq1-\beta p(μ)1β。由于势函数是非减的,故问题转换为临界问题:
p ( μ ) = 1 − Φ ( u 1 − α − n ( μ 0 − μ ) σ ) = 1 − β Φ ( u 1 − α − n ( μ 0 − μ ) σ ) = β \begin{aligned} p(\mu) = 1- \Phi(u_{1-\alpha}-\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = 1-\beta \\ \Phi(u_{1-\alpha}-\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = \beta \end{aligned} p(μ)=1Φ(u1ασn (μ0μ))=1βΦ(u1ασn (μ0μ))=β
从而得出适当的 n , σ n, \sigma n,σ ,前者对应采样容量,后者是在测量问题上,可考虑提高测量精度。

其中, β \beta β 是当备选假设成立时,原假设被错误地接受的概率的临界值。

通过 β , α , Δ \beta,\alpha, \Delta β,α,Δ,即可知道我们进行试验设计,得出适当的 n n n

返回目录

双样本 U 检验

双样本 U 检验的检验统计量为:
Z = X 1 ˉ − X 2 ˉ − d 0 σ 1 2 n 1 + σ 2 2 n 2 Z=\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 X1ˉX2ˉd0
其中 X 1 ˉ , X 2 ˉ \bar{X_1},\bar{X_2} X1ˉ,X2ˉ 为总体 X 1 , X 2 X_1,X_2 X1,X2样本均值, d 0 d_0 d0 是根据假设得出的已知常数, n 1 , n 2 n_1,n_2 n1,n2 分别为总体 X 1 , X 2 X_1,X_2 X1,X2 的样本容量, σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 为总体的方差。

同单样本 U 检验,其应用条件亦需要 Z 服从正态分布,且分布的方差已知。当然,在大样本情况下,亦可以将 Z 视为正态分布,并用样本方差估计 σ \sigma σ

返回目录

应用条件

应用条件

应用过程

设总体 X 1 , X 2 X_1,X_2 X1,X2 服从正态分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2) N(μ1,σ12),N(μ2,σ22) μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 未知, σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 已知。现从总体中抽出 n n n 个独立同分布的样品 X 1 ( 1 ) , X 2 ( 1 ) , ⋯   , X n ( 1 ) ; X 1 ( 2 ) , X 2 ( 2 ) , ⋯   , X n ( 2 ) X_1^{(1)},X_2^{(1)},\cdots,X_n^{(1)};X_1^{(2)},X_2^{(2)},\cdots,X_n^{(2)} X1(1),X2(1),,Xn(1)X1(2),X2(2),,Xn(2)

验证假设
1 ∘ : H 0 : μ 1 − μ 2 = d      H 1 : μ 1 − μ 2 ≠ d 1^{\circ}:H_0:\mu_1-\mu_2=d~~~~H_1:\mu_1-\mu_2\neq d 1:H0:μ1μ2=d    H1:μ1μ2=d
2 ∘ : H 0 : μ 1 − μ 2 ≤ d      H 1 : μ 1 − μ 2 > d 2^{\circ}:H_0:\mu_1-\mu_2\leq d~~~~H_1:\mu_1-\mu_2>d 2:H0:μ1μ2d    H1:μ1μ2>d
3 ∘ : H 0 : μ 1 − μ 2 ≥ d      H 1 : μ 1 − μ 2 < d 3^{\circ}:H_0:\mu_1-\mu_2\geq d~~~~H_1:\mu_1-\mu_23:H0:μ1μ2d    H1:μ1μ2<d

对于第一种假设,原假设取值为一个点,备选假设取值为两边。根据定义,检验统计量为:
Z = X 1 ˉ − X 2 ˉ − d 0 σ 1 2 n 1 + σ 2 2 n 2 Z=\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 X1ˉX2ˉd0
根据样本的性质,可知 X 1 ˉ − X 2 ˉ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \bar{X_1}-\bar{X_2} \sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) X1ˉX2ˉN(μ1μ2,n1σ12+n2σ22) ,于是 Z ∼ N ( ( μ 1 − μ 2 − d 0 ) σ 1 2 n 1 + σ 2 2 n 2 , 1 ) Z\sim N\lparen\frac{(\mu_1-\mu_2-d_0)} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}},1\rparen ZN(n1σ12+n2σ22 (μ1μ2d0),1)

根据假设检验的一般步骤(补充):
给 定 显 著 水 平 α , ∵ ∣ Z ∣ ↑ , H 0 越 难 成 立 , ⇓ 令 : P { ∣ Z ∣ > C ∣ H 0 } ≤ α 在 原 假 设 和 成 立 时 , X 1 ˉ − X 2 ˉ ∼ N ( d 0 , σ 1 2 n 1 + σ 2 2 n 2 ) , Z ∼ N ( 0 , 1 ) ⇓ C = u α / 2 , u 1 − α / 2 ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , u α / 2 ) ∪ ( u 1 − α / 2 , + ∞ ) 给定显著水平 \alpha,\because |Z|\uarr ,H_0 越难成立,\\ \Darr \\ 令:P\{\vert Z\vert>C|H_0\}\leq \alpha \\ 在原假设和成立时, \bar{X_1}-\bar{X_2} \sim N(d_0,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}),Z\sim N(0,1)\\ \Darr\\ C=u_{\alpha/2},u_{1-\alpha/2}\\ \Darr\\ 求得拒绝域为 Z\in(-\infin,u_{\alpha/2})\cup(u_{1-\alpha/2},+\infin) αZ,H0P{ Z>CH0}αX1ˉX2ˉN(d0,n1σ12+n2σ22)ZN(0,1)C=uα/2,u1α/2Z(,uα/2)(u1α/2,+)
故只要求出检验统计量的观察值,根据拒绝域做出判断即可。

对比单边检验,可以看到临界值 C C C 是相同的,以 d 0 = 0 d_0=0 d0=0 为例:

U 检验_第2张图片

返回目录

给 定 显 著 水 平 α , ∵ Z ↑ , H 0 越 难 成 立 , ⇓ 令 : P { Z > C ∣ H 0 } ≤ α   P { X 1 ˉ − X 2 ˉ − d 0 σ 1 2 n 1 + σ 2 2 n 2 > C ∣ d ≤ d 0 } ≤ α ⇓ P { X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 > C + d 0 − d σ 1 2 n 1 + σ 2 2 n 2 ∣ d ≤ d 0 } ⇓ ∵ d 0 − d σ 1 2 n 1 + σ 2 2 n 2 随 着 d ↑ 单 调 递 增   ∴ d = d 0 时 , P { X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 > C + d 0 − d σ 1 2 n 1 + σ 2 2 n 2 ∣ d ≤ d 0 } 最 大 ⇓ 此 时 X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) ⇓ C = u 1 − α ⇓ 求 得 拒 绝 域 为 Z ∈ ( u 1 − α , + ∞ ) 给定显著水平 \alpha,\because Z\uarr,H_0 越难成立,\\ \Darr \\ 令:P\{ Z>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C|d\leq d_0\}\leq \alpha \\ \Darr \\ P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}\\ \Darr\\ \because \frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}随着d\uarr 单调递增\\ ~\\ \therefore d=d_0时, P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}最大\\ \Darr\\ 此时\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1)\\ \Darr\\ C=u_{1-\alpha}\\ \Darr\\ 求得拒绝域为 Z\in(u_{1-\alpha},+\infin) αZ,H0P{ Z>CH0}α P{ n1σ12+n2σ22 X1ˉX2ˉd0>Cdd0}αP{ n1σ12+n2σ22 X1ˉX2ˉd>C+n1σ12+n2σ22 d0ddd0}n1σ12+n2σ22 d0dd d=d0P{ n1σ12+n2σ22 X1ˉX2ˉd>C+n1σ12+n2σ22 d0ddd0}n1σ12+n2σ22 X1ˉX2ˉdN(0,1)C=u1αZ(u1α,+)
U 检验_第3张图片

返回目录

同 2°,可以得出拒绝域为: Z ∈ ( − ∞ , u α ) Z\in(-\infin, u_\alpha) Z(,uα)

U 检验_第4张图片
返回目录

附录

中心极限定理

Lindeberg–Lévy 极限定理:
X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn 是一组独立同分布的随机变量序列,其中 E ( X i ) = μ , V a r ( X i ) = σ 2 E(X_i)=\mu,Var(X_i)=\sigma^2 E(Xi)=μ,Var(Xi)=σ2,则统计量 n ( X i ˉ − μ ) \sqrt{n}(\bar{X_i}-\mu) n (Xiˉμ) n → ∞ n\to \infin n 时,收敛于正态分布,记为:
n ( X i ˉ − μ ) → p N ( 0 , σ 2 ) \sqrt{n}(\bar{X_i}-\mu) \xrightarrow{p} N(0,\sigma^2) n (Xiˉμ)p N(0,σ2)
σ > 0 \sigma>0 σ>0 ,则:
lim ⁡ n → ∞ P r [ n ( X ˉ n − μ ) ≤ z ] = lim ⁡ n → ∞ P r [ n ( X ˉ n − μ ) σ ≤ z σ ] = Φ ( z σ ) \lim _{n \rightarrow \infty} \mathcal{P} r\left[\sqrt{n}\left(\bar{X}_{n}-\mu\right) \leq z\right]=\lim _{n \rightarrow \infty} \mathcal{P} r\left[\frac{\sqrt{n}\left(\bar{X}_{n}-\mu\right)}{\sigma} \leq \frac{z}{\sigma}\right]=\Phi\left(\frac{z}{\sigma}\right) nlimPr[n (Xˉnμ)z]=nlimPr[σn (Xˉnμ)σz]=Φ(σz)
其中 Φ ( z σ ) \Phi(\frac{z}{\sigma}) Φ(σz) 是标准正态分布,在取值为 z / σ z/\sigma z/σ 的概率。

上式告诉我们,在样本容量达到一定数目时,U 检验的检验统计量 Z 是可以视为服从正态分布的。

不仅如此,实际上,样本均值的标准化,都收敛于正态分布。当标准差大于 0 时,可以用正态分布来估计。

返回目录

假设检验一般步骤

  1. 制定原假设、备选假设
  2. 制定检验统计量
  3. 取显著水平 α \alpha α,得出接受域、拒绝域
  4. [取 β \beta β,根据势函数得出 n n n]
  5. 判断检验统计量的观察值,所处的域,决定是否接受原假设

  1. [取 α , β \alpha, \beta α,β,根据势函数得出 n n n]
  2. 根据检验统计量的观察值,求出其 p-值,并据此做出决策

详见博文:假设检验

势函数

势函数是包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力。

详见博文:假设检验

返回目录

Technical Note

概念 含义
Z Z-test 的检验统计量
势函数 包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力
位置参数 决定分布位置的参数,如正态分布的均值
i . i . d i.i.d i.i.d 独立同分布

推荐资源

  • 上海市教育委员会,叶慈南,曹伟丽《应用数理统计》,机械工业出版社,2007年1月第一版,第二次印刷(P112~114)
  • 陈希孺 《概率论与数理统计》,中国科学技术大学出版社,2015年8月第一版,第7次印刷(P200~204)
  • 统计王国网站
  • 维基百科——Z检验
  • 统计方案网站

返回目录

你可能感兴趣的:(传统统计学,U,检验,Z,检验,正态参数检验,双边检验,试验设计)