t 检验

假设检验

  • 定义
    • 应用条件
    • 条件讨论
      • 满足应用条件的情况
      • 不满足应用条件,但可以使用的情况
  • 单样本 t 检验
    • [2°](#2 '点击跳转到定义')
    • [3°](#2 '点击跳转到定义')
    • 实验设计
  • 双样本 t 检验
    • 学生 t 检验
    • Welch t 检验
  • 配对样本 t 检验
    • 案例
    • 差异讨论
    • 分区组试验
  • Technical Note
  • 附录
    • 假设检验一般步骤
    • 势函数
    • t 分布
  • 推荐书目

t 检验_第1张图片

定义

检验是检验统计量,服从 t 分布的假设检验方法

t 检验的检验统计量的一般形式如下:
t = Z s t=\frac{Z}{s} t=sZ
其中 Z Z Z 是一个对备选假设敏感的变量。何谓敏感?如备选假设为真时, Z Z Z 可以越大。 s s s 则是一个比例系数,用于将 t t t “拉近” t 分布。

例如,对单样本 t 检验,检验统计量为:
t = X ˉ − μ 0 s / n t=\frac{\bar{X}-\mu_0}{s/\sqrt{n}} t=s/n Xˉμ0
其中 X ˉ \bar{X} Xˉ 为样本均值, μ 0 \mu_0 μ0 是通过假设确定的常量, s s s 是样本方差,即总体方差的无偏估计, n n n 为样本容量。

大家可以比较一下,上述的 t 对应的 Z、s。

返回目录

应用条件

以单样本为例:
1. X ˉ ∼ N ( μ , σ 2 n ) , 其 中 E ( X ) = μ , V a r ( X ) = σ 2 2. s 2 ( n − 1 ) σ 2 ∼ χ 2 ( n − 1 ) 3. Z , s 相 互 独 立 , 即 X ˉ − μ 0 和 s / n 相 互 独 立 \begin{aligned} &1. \bar{X} \sim N(\mu,\frac{\sigma^2}{n}),其中E(X)=\mu,Var(X)=\sigma^2\\ \\ &2. \frac{s^2(n-1)}{\sigma^2}\sim \chi^2(n-1)\\ \\ &3. Z,s 相互独立,即\bar{X}-\mu_0和s/\sqrt{n}相互独立 \end{aligned} 1.XˉN(μ,nσ2)E(X)=μ,Var(X)=σ22.σ2s2(n1)χ2(n1)3.Z,sXˉμ0s/n
对于双样本,上述条件亦是成立的。此时只要将 X ˉ \bar{X} Xˉ 改为 X ˉ − Y ˉ \bar{X}-\bar{Y} XˉYˉ。其余参数亦略加修改,且要求 V a r ( X ) = V a r ( Y ) = σ Var(X)=Var(Y)=\sigma Var(X)=Var(Y)=σ 即可。

返回目录

条件讨论

以单样本为例:

满足应用条件的情况

(1)总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2) , 样本 X 1 , X 2 , ⋯   , X n   i . i . d X_1,X_2,\cdots,X_n~i.i.d X1,X2,,Xn i.i.d,且总体分布为正态分布。


很容易证明 X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu,\frac{\sigma^2}{n}) XˉN(μ,nσ2),由于 s = ∑ ( X i − X ˉ ) 2 n − 1 s=\frac{\sum(X_i-\bar{X})^2}{n-1} s=n1(XiXˉ)2 ,故:
s 2 ( n − 1 ) σ 2 = ∑ ( X i − X ˉ ) 2 σ 2 \frac{s^2(n-1)}{\sigma^2} = \frac{\sum(X_i-\bar{X})^2}{\sigma^2} σ2s2(n1)=σ2(XiXˉ)2
根据卡方分布的定义,可知 s 2 ( n − 1 ) σ 2 ∼ χ 2 ( n − 1 ) \frac{s^2(n-1)}{\sigma^2}\sim \chi^2(n-1) σ2s2(n1)χ2(n1)


(2)总体,样本可以不是正态分布,如:

总体正态,样本不 i . i . d i.i.d i.i.d,且不正态
总体不正态,样本当然也不正态

但满足上述三个条件,也可以用 t 检验。

返回目录

不满足应用条件,但可以使用的情况

检验统计量 t t t 近似于 t 分布时,一般就可以用 t 检验了。

(1)
总体不需要是正态,样品不需要是正态:

  • 1 ∘ 1^{\circ} 1但接近于正态,
    2 ∘ 2^{\circ} 2 n n n 足够时,
    3 ∘ 3^{\circ} 3进行的是单边检验。

(2)
总体、样品可以偏离正态(程度可以很 large),但在大样本下,根据中心极限定理,均值的比较问题既可以用 t 检验,也可以用 U检验。

同时,大样本条件下,t 检验是渐进于 U 检验的。

(3)
对双样本,若 σ 1 ≠ σ 2 \sigma_1\neq \sigma_2 σ1=σ2,但若 n 1 = n 2 n_1 = n_2 n1=n2,可以使用 t 检验。

对双样本,若 σ 1 ≠ σ 2 \sigma_1\neq \sigma_2 σ1=σ2,考虑使用 Welch t 检验。

返回目录

单样本 t 检验

设总体 X 服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) μ \mu μ 未知, σ \sigma σ 未知。现从总体中抽出 n n n i . i . d i.i.d i.i.d 的样品 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn,共同的分布为总体分布。

验证假设:
1 ∘ : H 0 : μ = μ 0      H 1 : μ ≠ μ 0 1^{\circ}:H_0:\mu=\mu_0~~~~H_1:\mu\neq\mu_0 1:H0:μ=μ0    H1:μ=μ0
2 ∘ : H 0 : μ ≤ μ 0      H 1 : μ > μ 0 2^{\circ}:H_0:\mu\leq\mu_0~~~~H_1:\mu>\mu_0 2:H0:μμ0    H1:μ>μ0
3 ∘ : H 0 : μ ≥ μ 0      H 1 : μ < μ 0 3^{\circ}:H_0:\mu\geq\mu_0~~~~H_1:\mu<\mu_0 3:H0:μμ0    H1:μ<μ0

对于第一种假设,原假设取值为一个点,备选假设取值为两边,这类假设对应的检验,也叫双边检验。根据定义,检验统计量为:
t = n ( X ˉ − μ 0 ) s t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s} t=sn (Xˉμ0)
其中, s 2 s^2 s2 为方差 σ 2 \sigma^2 σ2 的无偏估计。

根据样本的性质,可知 X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu,\frac{\sigma^2}{n}) XˉN(μ,nσ2) ,于是 t ∼ t ( n − 1 ) t\sim t(n-1) tt(n1)

根据假设检验的一般步骤:
给 定 显 著 水 平 α , ∵ ∣ t ∣ ↑ , H 0 越 难 成 立 , ⇓ 令 : P { ∣ t = n ( X ˉ − μ 0 ) s ∣ > C ∣ H 0 } ≤ α   在 原 假 设 和 成 立 时 , X ˉ ∼ N ( μ 0 , σ 2 / n ) , t ∼ t ( 0 , 1 ) ⇓ C = t α / 2 ( n − 1 ) , t 1 − α / 2 ( n − 1 ) ⇓ 求 得 拒 绝 域 为 t ∈ ( − ∞ , t α / 2 ( n − 1 ) ) ∪ ( t 1 − α / 2 ( n − 1 ) , + ∞ ) 给定显著水平 \alpha,\because |t|\uarr ,H_0 越难成立,\\ \Darr \\ 令:P\{\vert t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s}\vert>C|H_0\}\leq \alpha \\ ~\\ 在原假设和成立时,\bar{X}\sim N(\mu_0,\sigma^2/n),t\sim t(0,1)\\ \Darr\\ C=t_{\alpha/2}(n-1),t_{1-\alpha/2}(n-1)\\ \Darr\\ 求得拒绝域为 t\in(-\infin,t_{\alpha/2}(n-1))\cup(t_{1-\alpha/2}(n-1),+\infin) αt,H0P{ t=sn (Xˉμ0)>CH0}α XˉN(μ0,σ2/n)tt(0,1)C=tα/2(n1),t1α/2(n1)t(,tα/2(n1))(t1α/2(n1),+)
故只要求出检验统计量的观察值,根据拒绝域做出判断即可。

注意,检验是否属于双边,不是由拒绝域是否双边决定的,而是由假设决定。

t 检验_第2张图片

返回目录

根据定义,检验统计量为:
t = n ( X ˉ − μ 0 ) s t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s} t=sn (Xˉμ0)
根据假设检验的一般步骤
给 定 显 著 水 平 α , ∵ t ↑ , H 0 越 难 成 立 , ⇓ 令 : P { t = n ( X ˉ − μ 0 ) s > C ∣ H 0 } ≤ α   P { n ( X ˉ − μ 0 ) s > C ∣ μ ≤ μ 0 } ≤ α ⇓ P { n ( X ˉ − μ ) s > C + n ( μ 0 − μ ) s ∣ μ ≤ μ 0 } ⇓ ∵ n ( μ 0 − μ ) s 随 着 μ ↑ 单 调 递 增   ∴ μ = μ 0 时 , P { n ( X ˉ − μ ) s > C + n ( μ 0 − μ ) s } 最 大 ⇓ 此 时 n ( X ˉ − μ ) s ∼ t ( n − 1 ) ⇓ C = t 1 − α ( n − 1 ) ⇓ 求 得 拒 绝 域 为 t ∈ ( t 1 − α ( n − 1 ) , + ∞ ) 给定显著水平 \alpha,\because t\uarr,H_0 越难成立,\\ \Darr \\ 令:P\{ t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s}>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\sqrt{n}(\bar{X}-\mu_0)}{s}>C|\mu\leq\mu_0\}\leq \alpha \\ \Darr \\ P\{\frac{\sqrt{n}(\bar{X}-\mu)}{s}>C+\frac{\sqrt{n}(\mu_0-\mu)}{s}|\mu\leq\mu_0\}\\ \Darr\\ \because\frac{\sqrt{n}(\mu_0-\mu)}{s}随着\mu\uarr 单调递增\\ ~\\ \therefore \mu=\mu_0时,P\{\frac{\sqrt{n}(\bar{X}-\mu)}{s}>C+\frac{\sqrt{n}(\mu_0-\mu)}{s}\}最大\\ \Darr\\ 此时\frac{\sqrt{n}(\bar{X}-\mu)}{s} \sim t(n-1)\\ \Darr\\ C=t_{1-\alpha}(n-1)\\ \Darr\\ 求得拒绝域为 t\in(t_{1-\alpha}(n-1),+\infin) αt,H0P{ t=sn (Xˉμ0)>CH0}α P{ sn (Xˉμ0)>Cμμ0}αP{ sn (Xˉμ)>C+sn (μ0μ)μμ0}sn (μ0μ)μ μ=μ0P{ sn (Xˉμ)>C+sn (μ0μ)}sn (Xˉμ)t(n1)C=t1α(n1)t(t1α(n1),+)
对于这类假设为单边,也称为单边(one-tailed)检验。单边检验的显著水平 α \alpha α,是对每个 μ \mu μ 都成立的上确界。而相反的,双边检验的原假设,往往对应一个值。

t 检验_第3张图片

返回目录

根据定义,检验统计量为:
t = n ( X ˉ − μ 0 ) s t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s} t=sn (Xˉμ0)
根据假设检验的一般步骤
给 定 显 著 水 平 α , ∵ t ↓ , H 0 越 难 成 立 , ⇓ 令 : P { t = n ( X ˉ − μ 0 ) s < C ∣ H 0 } ≤ α   P { n ( X ˉ − μ 0 ) s < C ∣ μ ≥ μ 0 } ≤ α ⇓ P { n ( X ˉ − μ ) s < C + n ( μ 0 − μ ) s ∣ μ ≤ μ 0 } ⇓ ∵ n ( μ 0 − μ ) t 随 着 μ ↑ 单 调 ↓   ∴ μ = μ 0 时 , P { n ( X ˉ − μ ) t < C + n ( μ 0 − μ ) t } 最 大 ⇓ 此 时 n ( X ˉ − μ ) t ∼ t ( n − 1 ) ⇓ C = t α ( n − 1 ) ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , t α ( n − 1 ) ) 给定显著水平 \alpha,\because t\darr,H_0 越难成立,\\ \Darr \\ 令:P\{ t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s}αt,H0P{ t=sn (Xˉμ0)<CH0}α P{ sn (Xˉμ0)<Cμμ0}αP{ sn (Xˉμ)<C+sn (μ0μ)μμ0}tn (μ0μ)μ μ=μ0P{ tn (Xˉμ)<C+tn (μ0μ)}tn (Xˉμ)t(n1)C=tα(n1)Z(,tα(n1))

t 检验_第4张图片

返回目录

实验设计

在进行采样时,通常需要事前确定 n n n

以 2° 为例,给定显著水平 α \alpha α ∵ t ↑ , H 0 \because t\uarr,H_0 t,H0 越难成立, ∴ \therefore 设定检验标准(拒绝)为: t > C t>C t>C

定义势函数为:

为了书写方便,这里将自由度,移到下标去啦,大家见谅哈。。总不能一大推符号做下标吧

p ( μ ) = P { t > C ∣ μ ∈ ( − ∞ , ∞ ) } = P { n ( X ˉ − μ ) s ≥ C + n ( μ 0 − μ ) s ∣ μ ∈ ( − ∞ , ∞ ) } ∵    n ( X ˉ − μ ) s ∼ t n − 1 = 1 − t n − 1 ( C − n ( μ 0 − μ ) s ) \begin{aligned} p(\mu)&=P\{ t > C| \mu\in(-\infin,\infin)\} \\ &= P\{ \frac{\sqrt{n}(\bar{X}-\mu)}{s} \geq C+\frac{\sqrt{n}(\mu_0-\mu)}{s}| \mu\in(-\infin,\infin)\} \\ \because ~~&\frac{\sqrt{n}(\bar{X}-\mu)}{s} \sim t_{n-1}\\ &=1-t_{n-1}(C-\frac{\sqrt{n}(\mu_0-\mu)}{s}) \end{aligned} p(μ)  =P{ t>Cμ(,)}=P{ sn (Xˉμ)C+sn (μ0μ)μ(,)}sn (Xˉμ)tn1=1tn1(Csn (μ0μ))
α \alpha α,则根据检验标准的临界值求取法则,有:
s u p μ { 1 − t n − 1 ( C − n ( μ 0 − μ ) s ) ∣ μ ∈ ( − ∞ , μ 0 ) } < = α \underset{\mu}{sup} \{1-t_{n-1}(C-\frac{\sqrt{n}(\mu_0-\mu)}{s})|\mu\in(-\infin,\mu_0)\} <= \alpha μsup{ 1tn1(Csn (μ0μ))μ(,μ0)}<=α
最后得到检验标准的临界值 C = t n − 1 ( α − 1 ) C=t_{n-1}(\alpha-1) C=tn1(α1)

回代入势函数,可得:
p ( μ ) = 1 − t n − 1 ( t t n − 1 ( α − 1 ) − n ( μ 0 − μ ) s ) p(\mu) = 1-t_{n-1}(t_{t_{n-1}(\alpha-1)}-\frac{\sqrt{n}(\mu_0-\mu)}{s}) p(μ)=1tn1(ttn1(α1)sn (μ0μ))
其中有两个重要的性质:

  1. 势函数是 n ( μ 0 − μ ) s \frac{\sqrt{n}(\mu_0-\mu)}{s} sn (μ0μ) 的函数,且是连续的、非减的。
  2. l i m μ → μ 0 t n − 1 ( t t n − 1 ( α − 1 ) − n ( μ 0 − μ ) s ) = α l i m μ → + ∞ t n − 1 ( t t n − 1 ( α − 1 ) − n ( μ 0 − μ ) s ) = 1 \underset{\mu\to\mu_0}{lim} t_{n-1}(t_{t_{n-1}(\alpha-1)}-\frac{\sqrt{n}(\mu_0-\mu)}{s})=\alpha\\ \underset{\mu\to+\infin}{lim} t_{n-1}(t_{t_{n-1}(\alpha-1)}-\frac{\sqrt{n}(\mu_0-\mu)}{s})=1 μμ0limtn1(ttn1(α1)sn (μ0μ))=αμ+limtn1(ttn1(α1)sn (μ0μ))=1

设无差别区域为 μ ∈ ( μ 0 , Δ ) \mu\in(\mu_0,\Delta) μ(μ0,Δ),则对于 [ Δ , + ∞ ] [\Delta,+\infin] [Δ,+],给定一个 β \beta β,使得 p ( μ ) ≥ 1 − β p(\mu)\geq1-\beta p(μ)1β。由于势函数是非减的,故问题转换为临界问题:
p ( μ ) = 1 − t n − 1 ( t t n − 1 ( α − 1 ) − n ( μ 0 − μ ) s ) = 1 − β t n − 1 ( t t n − 1 ( α − 1 ) − n ( μ 0 − μ ) s ) = β \begin{aligned} p(\mu) = 1- t_{n-1}(t_{t_{n-1}(\alpha-1)}-\frac{\sqrt{n}(\mu_0-\mu)}{s}) = 1-\beta \\ t_{n-1}(t_{t_{n-1}(\alpha-1)}-\frac{\sqrt{n}(\mu_0-\mu)}{s}) = \beta \end{aligned} p(μ)=1tn1(ttn1(α1)sn (μ0μ))=1βtn1(ttn1(α1)sn (μ0μ))=β
从而得出适当的 n , σ n, \sigma n,σ ,前者对应采样容量,后者是在测量问题上,可考虑提高测量精度。

其中, β \beta β 是当备选假设成立时,原假设被错误地接受的概率的临界值。

通过 β , α , Δ \beta,\alpha, \Delta β,α,Δ,即可知道我们进行试验设计,得出适当的 n n n

返回目录

双样本 t 检验

双样本 t 检验作为一种 t 检验,都是因为 σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 未知。

学生 t 检验

设总体 X , Y X,Y XY 服从正态分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2) N(μ1,σ12),N(μ2,σ22) μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 未知, σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2 未知。现从总体中抽出 n n n 个独立同分布的样品 X 1 , X 2 , ⋯   , X n 1 ; Y 1 , Y 2 , ⋯   , Y n 2 X_1,X_2,\cdots,X_{n1};Y_1,Y_2,\cdots,Y_{n_2} X1,X2,,Xn1Y1,Y2,,Yn2

验证假设
1 ∘ : H 0 : μ 1 − μ 2 = d 0      H 1 : μ 1 − μ 2 ≠ d 0 1^{\circ}:H_0:\mu_1-\mu_2=d_0~~~~H_1:\mu_1-\mu_2\neq d_0 1:H0:μ1μ2=d0    H1:μ1μ2=d0
2 ∘ : H 0 : μ 1 − μ 2 ≤ d 0      H 1 : μ 1 − μ 2 > d 0 2^{\circ}:H_0:\mu_1-\mu_2\leq d_0~~~~H_1:\mu_1-\mu_2>d_0 2:H0:μ1μ2d0    H1:μ1μ2>d0
3 ∘ : H 0 : μ 1 − μ 2 ≥ d 0      H 1 : μ 1 − μ 2 < d 0 3^{\circ}:H_0:\mu_1-\mu_2\geq d_0~~~~H_1:\mu_1-\mu_23:H0:μ1μ2d0    H1:μ1μ2<d0

学生 t 检验要求 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2,检验统计量为:
t = X ˉ − Y ˉ − d 0 s 1 n 1 + 1 n 2 t=\frac{\bar{X}-\bar{Y}-d_0}{s\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} t=sn11+n21 XˉYˉd0
其中:
s = ∑ ( X i − X ˉ ) 2 + ∑ ( Y i − Y ˉ ) 2 n 1 + n 2 − 2 s=\frac{\sum(X_i-\bar{X})^2+\sum(Y_i-\bar{Y})^2}{n_1+n_2-2} s=n1+n22(XiXˉ)2+(YiYˉ)2
n 1 , n 2 n_1,n_2 n1,n2 分别为总体 X , Y X,Y X,Y 的样本容量。

同样地,可证明检验标准的临界值,给定显著统计量 α \alpha α 下,由于 t ∼ t ( n − 1 ) t\sim t(n-1) tt(n1),可求的 1°、2°、3°(对 2°、3° 而言,需要求上确界)的拒绝域分别为:

  1. t ∈ ( − ∞ , t α / 2 ( n − 1 ) ) ∪ ( t 1 − α / 2 ( n − 1 ) , + ∞ ) t\in(-\infin,t_{\alpha/2}(n-1))\cup(t_{1-\alpha/2}(n-1),+\infin) t(,tα/2(n1))(t1α/2(n1),+)
  2. t ∈ ( t 1 − α ( n − 1 ) , + ∞ ) t\in(t_{1-\alpha}(n-1),+\infin) t(t1α(n1),+)
  3. t ∈ ( − ∞ , t α ( n − 1 ) ) t\in(-\infin,t_\alpha(n-1)) t(,tα(n1))

综上,要应用上述学生 t 检验,一般需要:

  1. 总体正态
  2. 样本 i . i . d i.i.d i.i.d
  3. σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2

n 1 = n 2 n_1=n_2 n1=n2 时,条件 3 不满足时,也可以使用学生 t 检验。

返回目录

Welch t 检验

设总体 X , Y X,Y XY 服从正态分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2) N(μ1,σ12),N(μ2,σ22) μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 未知, σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 未知。现从总体中抽出 n n n 个独立同分布的样品 X 1 , X 2 , ⋯   , X n 1 ; Y 1 , Y 2 , ⋯   , Y n 2 X_1,X_2,\cdots,X_{n1};Y_1,Y_2,\cdots,Y_{n_2} X1,X2,,Xn1Y1,Y2,,Yn2

验证假设
1 ∘ : H 0 : μ 1 − μ 2 = d 0      H 1 : μ 1 − μ 2 ≠ d 0 1^{\circ}:H_0:\mu_1-\mu_2=d_0~~~~H_1:\mu_1-\mu_2\neq d_0 1:H0:μ1μ2=d0    H1:μ1μ2=d0
2 ∘ : H 0 : μ 1 − μ 2 ≤ d 0      H 1 : μ 1 − μ 2 > d 0 2^{\circ}:H_0:\mu_1-\mu_2\leq d_0~~~~H_1:\mu_1-\mu_2>d_0 2:H0:μ1μ2d0    H1:μ1μ2>d0
3 ∘ : H 0 : μ 1 − μ 2 ≥ d 0      H 1 : μ 1 − μ 2 < d 0 3^{\circ}:H_0:\mu_1-\mu_2\geq d_0~~~~H_1:\mu_1-\mu_23:H0:μ1μ2d0    H1:μ1μ2<d0

学生 t 检验 要求 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2,检验统计量为:
t = X ˉ − Y ˉ − d 0 s 1 2 n 1 + s 2 2 n 2 t=\frac{\bar{X}-\bar{Y}-d_0}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}} t=n1s12+n2s22 XˉYˉd0
n 1 , n 2 n_1,n_2 n1,n2 分别为总体 X , Y X,Y X,Y 的样本容量, s 1 , s 2 s_1,s_2 s1,s2 分别是样本方差。

可以证明,t 渐进服从自由度为:
d.f. = ( s 1 2 n 1 + s 2 2 n 2 ) 2 ( s 1 2 / n 1 ) 2 n 1 − 1 + ( s 2 2 / n 2 ) 2 n 2 − 1 \textbf{d.f.}=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2} {\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}} d.f.=n11(s12/n1)2+n21(s22/n2)2(n1s12+n2s22)2
的 t 分布。

同样地,可证明检验标准的临界值,给定显著统计量 α \alpha α 下,由于 t ∼ t ( d.f. ) t\sim t(\textbf{d.f.}) tt(d.f.),可求的 1°、2°、3°(对 2°、3° 而言,需要求上确界)的拒绝域分别为:

  1. t ∈ ( − ∞ , t α / 2 ( d.f. ) ) ∪ ( t 1 − α / 2 ( d.f. ) , + ∞ ) t\in(-\infin,t_{\alpha/2}(\textbf{d.f.}))\cup(t_{1-\alpha/2}(\textbf{d.f.}),+\infin) t(,tα/2(d.f.))(t1α/2(d.f.),+)
  2. t ∈ ( t 1 − α ( d.f. ) , + ∞ ) t\in(t_{1-\alpha}(\textbf{d.f.}),+\infin) t(t1α(d.f.),+)
  3. t ∈ ( − ∞ , t α ( d.f. ) ) t\in(-\infin,t_\alpha(\textbf{d.f.})) t(,tα(d.f.))

由于此时 t ( d.f. ) t(\textbf{d.f.}) t(d.f.) 是估计分布,因此 α \alpha α 不是真实水平


综上,要应用上述学生 t 检验,一般需要:

  1. 总体正态
  2. 样本 i . i . d i.i.d i.i.d

返回目录

配对样本 t 检验

当验证某些假设时,设计的试验不可避免地带有噪声因素,如:

  1. 验证某降血糖的药物是否有效时,会因试验者的体质,影响药物的作用
  2. 验证某肥料是否对作物产量有作用时,会因土壤强度而不同。

以第一例来说,试验的设计断然不能是

在人群中取 n 个样品,一部分人不吃药,另一部分人吃药,再测血糖

原因是:人体质的不同,导致有些人不吃药,血糖可能都比吃了药的人还要低。也即,存在噪声因素。

因此,为了消除噪声因素,试验应:

在人群中取 n 个样品,对每一个样品,吃药前测一次血糖,吃完药再测一次血糖,以两者之差,作为样本点。

案例

为了比较安眠药的疗效,从人群中抽出 n n n 个样品,分别记服药前后的睡眠时长为 X 1 , X 2 X_1,X_2 X1,X2。令 X = X 1 − X 2 X=X_1-X_2 X=X1X2。由于 X 1 , X 2 X_1,X_2 X1,X2 不是来自同一总体的样本,且不独立(配对),所以 X X X 消除了不同个体的引起差异,使得 X X X 的各个观测值仅由两种安眠药的差异引起。假定 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2),其中 μ , σ \mu,\sigma μ,σ 均未知。

验证假设:
1 ∘ : H 0 : μ = μ 0      H 1 : μ ≠ μ 0 1^{\circ}:H_0:\mu=\mu_0~~~~H_1:\mu\neq\mu_0 1:H0:μ=μ0    H1:μ=μ0
2 ∘ : H 0 : μ ≤ μ 0      H 1 : μ > μ 0 2^{\circ}:H_0:\mu\leq\mu_0~~~~H_1:\mu>\mu_0 2:H0:μμ0    H1:μ>μ0
3 ∘ : H 0 : μ ≥ μ 0      H 1 : μ < μ 0 3^{\circ}:H_0:\mu\geq\mu_0~~~~H_1:\mu<\mu_0 3:H0:μμ0    H1:μ<μ0

由于 σ \sigma σ 未知,所以在得到 X X X 的一组观测值后,就可以使用 单样本 t 检验 的方法,判断安眠药的效果。

差异讨论

配对 t 检验和双样本 t 检验有何不同?

  • 配对 t 检验的样品的分布可以是未知的,如人的睡眠时间服从的分布可以不必知道
  • 配对 t 检验的每一对样品,可能都有不同的分布,如一个人的睡眠时长是一个随机变量,但服从的分布不一定相同。由于体制原因,服药后的睡眠时间,亦不相同
  • 配对是不独立的
  • 配对 t 检验是一种“曲线”求解,配对是为了消除噪声因素的影响
  • 配对 t 检验的配对,对配对本身来说,属于同一个统计单元,当配对之间,统计单元都不同。而双样本 t 检验的统计单元,对同一样本内,是相同的。
  • 配对 t 检验不是双样本 t 检验

配对 t 检验和单样本 t 检验的不同:

  • 配对 t 检验本质上是单样本 t 检验
  • 单样本 t 检验直接计算,得到检验统计量
  • 配对 t 检验的自由度等于配对数,而单样本 t 检验的自由度是样本数。

分区组试验

对于肥料对农作物产量的作用,的验证问题而言,土壤强度绝对是一个误差因素。但进行单个体,两测量的做法显然是不现实的,因为:

  1. 两次观察的间隔太久了
  2. 在完成一次观测后,下一次观测时,土壤强度等因素发生了变化

此时,就要分区组进行试验。假设试验的范围是某一个村,此时可以将土壤强度相近、试验条件相近的土地,划分为一个区组,并在区组内设置对照组、实验组,从而得到配对。

返回目录

Technical Note

概念 含义
统计单元 从收集数据的角度来谈,指某一数据的来源性质,如某一数据来自某一特定区域的人、如一个广州人;又或者是来自一个性别,如一个男人等;又如某土壤采集自土地 A。想这些,广州人、土地 A,就是统计单元。样本中的样品可以有不同的统计单元。
分区组 在设计试验时,为了消除噪声因素,常常进行分区组。如测试肥料的效果时,土壤的强度便成为一个噪声因素。为此,需要将土地分区,再在同一块土地上,进行对照试验。

返回目录

附录

假设检验一般步骤

  1. 制定原假设、备选假设
  2. 制定检验统计量
  3. 取显著水平 α \alpha α,得出接受域、拒绝域
  4. [取 β \beta β,根据势函数得出 n n n]
  5. 判断检验统计量的观察值,所处的域,决定是否接受原假设

  1. [取 α , β \alpha, \beta α,β,根据势函数得出 n n n]
  2. 根据检验统计量的观察值,求出其 p-值,并据此做出决策

详见博文:假设检验

返回目录

势函数

势函数是包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力。

详见博文:假设检验

返回目录

t 分布

X ∼ N ( 0 , 1 ) , S ∼ χ n 2 X\sim N(0,1), S\sim \chi_n^2 XN(0,1),Sχn2,则 Y = X / S / n Y=X/\sqrt{S/n} Y=X/S/n 的分布为:
t ( n ) = Γ ( ( n + 1 ) / 2 ) n π Γ ( n / 2 ) ( 1 + y 2 n ) − n + 1 2 t(n)=\frac{\Gamma((n+1)/2)}{\sqrt{n\pi}\Gamma(n/2)}(1+\frac{y^2}{n})^{-\frac{n+1}{2}} t(n)=nπ Γ(n/2)Γ((n+1)/2)(1+ny2)2n+1
即自由度为 n n n 的 t 分布。

返回目录

推荐书目

  • 上海市教育委员会,叶慈南,曹伟丽《应用数理统计》,机械工业出版社,2007年1月第一版,第二次印刷(P113~119)
  • 学生 t 检验——维基百科

返回目录

你可能感兴趣的:(传统统计学,统计学,t,检验,单样本,双样本,配对样本)