检验是检验统计量,服从 t 分布的假设检验方法
t 检验的检验统计量的一般形式如下:
t = Z s t=\frac{Z}{s} t=sZ
其中 Z Z Z 是一个对备选假设敏感的变量。何谓敏感?如备选假设为真时, Z Z Z 可以越大。 s s s 则是一个比例系数,用于将 t t t “拉近” t 分布。
例如,对单样本 t 检验,检验统计量为:
t = X ˉ − μ 0 s / n t=\frac{\bar{X}-\mu_0}{s/\sqrt{n}} t=s/nXˉ−μ0
其中 X ˉ \bar{X} Xˉ 为样本均值, μ 0 \mu_0 μ0 是通过假设确定的常量, s s s 是样本方差,即总体方差的无偏估计, n n n 为样本容量。
大家可以比较一下,上述的 t 对应的 Z、s。
返回目录
以单样本为例:
1. X ˉ ∼ N ( μ , σ 2 n ) , 其 中 E ( X ) = μ , V a r ( X ) = σ 2 2. s 2 ( n − 1 ) σ 2 ∼ χ 2 ( n − 1 ) 3. Z , s 相 互 独 立 , 即 X ˉ − μ 0 和 s / n 相 互 独 立 \begin{aligned} &1. \bar{X} \sim N(\mu,\frac{\sigma^2}{n}),其中E(X)=\mu,Var(X)=\sigma^2\\ \\ &2. \frac{s^2(n-1)}{\sigma^2}\sim \chi^2(n-1)\\ \\ &3. Z,s 相互独立,即\bar{X}-\mu_0和s/\sqrt{n}相互独立 \end{aligned} 1.Xˉ∼N(μ,nσ2),其中E(X)=μ,Var(X)=σ22.σ2s2(n−1)∼χ2(n−1)3.Z,s相互独立,即Xˉ−μ0和s/n相互独立
对于双样本,上述条件亦是成立的。此时只要将 X ˉ \bar{X} Xˉ 改为 X ˉ − Y ˉ \bar{X}-\bar{Y} Xˉ−Yˉ。其余参数亦略加修改,且要求 V a r ( X ) = V a r ( Y ) = σ Var(X)=Var(Y)=\sigma Var(X)=Var(Y)=σ 即可。
返回目录
以单样本为例:
(1)总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2) , 样本 X 1 , X 2 , ⋯ , X n i . i . d X_1,X_2,\cdots,X_n~i.i.d X1,X2,⋯,Xn i.i.d,且总体分布为正态分布。
很容易证明 X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu,\frac{\sigma^2}{n}) Xˉ∼N(μ,nσ2),由于 s = ∑ ( X i − X ˉ ) 2 n − 1 s=\frac{\sum(X_i-\bar{X})^2}{n-1} s=n−1∑(Xi−Xˉ)2 ,故:
s 2 ( n − 1 ) σ 2 = ∑ ( X i − X ˉ ) 2 σ 2 \frac{s^2(n-1)}{\sigma^2} = \frac{\sum(X_i-\bar{X})^2}{\sigma^2} σ2s2(n−1)=σ2∑(Xi−Xˉ)2
根据卡方分布的定义,可知 s 2 ( n − 1 ) σ 2 ∼ χ 2 ( n − 1 ) \frac{s^2(n-1)}{\sigma^2}\sim \chi^2(n-1) σ2s2(n−1)∼χ2(n−1)
(2)总体,样本可以不是正态分布,如:
总体正态,样本不 i . i . d i.i.d i.i.d,且不正态
总体不正态,样本当然也不正态
但满足上述三个条件,也可以用 t 检验。
返回目录
检验统计量 t t t 近似于 t 分布时,一般就可以用 t 检验了。
(1)
总体不需要是正态,样品不需要是正态:
(2)
总体、样品可以偏离正态(程度可以很 large),但在大样本下,根据中心极限定理,均值的比较问题既可以用 t 检验,也可以用 U检验。
同时,大样本条件下,t 检验是渐进于 U 检验的。
(3)
对双样本,若 σ 1 ≠ σ 2 \sigma_1\neq \sigma_2 σ1=σ2,但若 n 1 = n 2 n_1 = n_2 n1=n2,可以使用 t 检验。
对双样本,若 σ 1 ≠ σ 2 \sigma_1\neq \sigma_2 σ1=σ2,考虑使用 Welch t 检验。
返回目录
设总体 X 服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2), μ \mu μ 未知, σ \sigma σ 未知。现从总体中抽出 n n n 个 i . i . d i.i.d i.i.d 的样品 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn,共同的分布为总体分布。
验证假设:
1 ∘ : H 0 : μ = μ 0 H 1 : μ ≠ μ 0 1^{\circ}:H_0:\mu=\mu_0~~~~H_1:\mu\neq\mu_0 1∘:H0:μ=μ0 H1:μ=μ0
2 ∘ : H 0 : μ ≤ μ 0 H 1 : μ > μ 0 2^{\circ}:H_0:\mu\leq\mu_0~~~~H_1:\mu>\mu_0 2∘:H0:μ≤μ0 H1:μ>μ0
3 ∘ : H 0 : μ ≥ μ 0 H 1 : μ < μ 0 3^{\circ}:H_0:\mu\geq\mu_0~~~~H_1:\mu<\mu_0 3∘:H0:μ≥μ0 H1:μ<μ0
对于第一种假设,原假设取值为一个点,备选假设取值为两边,这类假设对应的检验,也叫双边检验。根据定义,检验统计量为:
t = n ( X ˉ − μ 0 ) s t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s} t=sn(Xˉ−μ0)
其中, s 2 s^2 s2 为方差 σ 2 \sigma^2 σ2 的无偏估计。
根据样本的性质,可知 X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu,\frac{\sigma^2}{n}) Xˉ∼N(μ,nσ2) ,于是 t ∼ t ( n − 1 ) t\sim t(n-1) t∼t(n−1)。
根据假设检验的一般步骤:
给 定 显 著 水 平 α , ∵ ∣ t ∣ ↑ , H 0 越 难 成 立 , ⇓ 令 : P { ∣ t = n ( X ˉ − μ 0 ) s ∣ > C ∣ H 0 } ≤ α 在 原 假 设 和 成 立 时 , X ˉ ∼ N ( μ 0 , σ 2 / n ) , t ∼ t ( 0 , 1 ) ⇓ C = t α / 2 ( n − 1 ) , t 1 − α / 2 ( n − 1 ) ⇓ 求 得 拒 绝 域 为 t ∈ ( − ∞ , t α / 2 ( n − 1 ) ) ∪ ( t 1 − α / 2 ( n − 1 ) , + ∞ ) 给定显著水平 \alpha,\because |t|\uarr ,H_0 越难成立,\\ \Darr \\ 令:P\{\vert t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s}\vert>C|H_0\}\leq \alpha \\ ~\\ 在原假设和成立时,\bar{X}\sim N(\mu_0,\sigma^2/n),t\sim t(0,1)\\ \Darr\\ C=t_{\alpha/2}(n-1),t_{1-\alpha/2}(n-1)\\ \Darr\\ 求得拒绝域为 t\in(-\infin,t_{\alpha/2}(n-1))\cup(t_{1-\alpha/2}(n-1),+\infin) 给定显著水平α,∵∣t∣↑,H0越难成立,⇓令:P{ ∣t=sn(Xˉ−μ0)∣>C∣H0}≤α 在原假设和成立时,Xˉ∼N(μ0,σ2/n),t∼t(0,1)⇓C=tα/2(n−1),t1−α/2(n−1)⇓求得拒绝域为t∈(−∞,tα/2(n−1))∪(t1−α/2(n−1),+∞)
故只要求出检验统计量的观察值,根据拒绝域做出判断即可。
注意,检验是否属于双边,不是由拒绝域是否双边决定的,而是由假设决定。
返回目录
根据定义,检验统计量为:
t = n ( X ˉ − μ 0 ) s t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s} t=sn(Xˉ−μ0)
根据假设检验的一般步骤
给 定 显 著 水 平 α , ∵ t ↑ , H 0 越 难 成 立 , ⇓ 令 : P { t = n ( X ˉ − μ 0 ) s > C ∣ H 0 } ≤ α P { n ( X ˉ − μ 0 ) s > C ∣ μ ≤ μ 0 } ≤ α ⇓ P { n ( X ˉ − μ ) s > C + n ( μ 0 − μ ) s ∣ μ ≤ μ 0 } ⇓ ∵ n ( μ 0 − μ ) s 随 着 μ ↑ 单 调 递 增 ∴ μ = μ 0 时 , P { n ( X ˉ − μ ) s > C + n ( μ 0 − μ ) s } 最 大 ⇓ 此 时 n ( X ˉ − μ ) s ∼ t ( n − 1 ) ⇓ C = t 1 − α ( n − 1 ) ⇓ 求 得 拒 绝 域 为 t ∈ ( t 1 − α ( n − 1 ) , + ∞ ) 给定显著水平 \alpha,\because t\uarr,H_0 越难成立,\\ \Darr \\ 令:P\{ t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s}>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\sqrt{n}(\bar{X}-\mu_0)}{s}>C|\mu\leq\mu_0\}\leq \alpha \\ \Darr \\ P\{\frac{\sqrt{n}(\bar{X}-\mu)}{s}>C+\frac{\sqrt{n}(\mu_0-\mu)}{s}|\mu\leq\mu_0\}\\ \Darr\\ \because\frac{\sqrt{n}(\mu_0-\mu)}{s}随着\mu\uarr 单调递增\\ ~\\ \therefore \mu=\mu_0时,P\{\frac{\sqrt{n}(\bar{X}-\mu)}{s}>C+\frac{\sqrt{n}(\mu_0-\mu)}{s}\}最大\\ \Darr\\ 此时\frac{\sqrt{n}(\bar{X}-\mu)}{s} \sim t(n-1)\\ \Darr\\ C=t_{1-\alpha}(n-1)\\ \Darr\\ 求得拒绝域为 t\in(t_{1-\alpha}(n-1),+\infin) 给定显著水平α,∵t↑,H0越难成立,⇓令:P{ t=sn(Xˉ−μ0)>C∣H0}≤α P{ sn(Xˉ−μ0)>C∣μ≤μ0}≤α⇓P{ sn(Xˉ−μ)>C+sn(μ0−μ)∣μ≤μ0}⇓∵sn(μ0−μ)随着μ↑单调递增 ∴μ=μ0时,P{ sn(Xˉ−μ)>C+sn(μ0−μ)}最大⇓此时sn(Xˉ−μ)∼t(n−1)⇓C=t1−α(n−1)⇓求得拒绝域为t∈(t1−α(n−1),+∞)
对于这类假设为单边,也称为单边(one-tailed)检验。单边检验的显著水平 α \alpha α,是对每个 μ \mu μ 都成立的上确界。而相反的,双边检验的原假设,往往对应一个值。
返回目录
根据定义,检验统计量为:
t = n ( X ˉ − μ 0 ) s t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s} t=sn(Xˉ−μ0)
根据假设检验的一般步骤
给 定 显 著 水 平 α , ∵ t ↓ , H 0 越 难 成 立 , ⇓ 令 : P { t = n ( X ˉ − μ 0 ) s < C ∣ H 0 } ≤ α P { n ( X ˉ − μ 0 ) s < C ∣ μ ≥ μ 0 } ≤ α ⇓ P { n ( X ˉ − μ ) s < C + n ( μ 0 − μ ) s ∣ μ ≤ μ 0 } ⇓ ∵ n ( μ 0 − μ ) t 随 着 μ ↑ 单 调 ↓ ∴ μ = μ 0 时 , P { n ( X ˉ − μ ) t < C + n ( μ 0 − μ ) t } 最 大 ⇓ 此 时 n ( X ˉ − μ ) t ∼ t ( n − 1 ) ⇓ C = t α ( n − 1 ) ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , t α ( n − 1 ) ) 给定显著水平 \alpha,\because t\darr,H_0 越难成立,\\ \Darr \\ 令:P\{ t=\frac{\sqrt{n}(\bar{X}-\mu_0)}{s}
返回目录
在进行采样时,通常需要事前确定 n n n。
以 2° 为例,给定显著水平 α \alpha α, ∵ t ↑ , H 0 \because t\uarr,H_0 ∵t↑,H0 越难成立, ∴ \therefore ∴ 设定检验标准(拒绝)为: t > C t>C t>C。
定义势函数为:
为了书写方便,这里将自由度,移到下标去啦,大家见谅哈。。总不能一大推符号做下标吧
p ( μ ) = P { t > C ∣ μ ∈ ( − ∞ , ∞ ) } = P { n ( X ˉ − μ ) s ≥ C + n ( μ 0 − μ ) s ∣ μ ∈ ( − ∞ , ∞ ) } ∵ n ( X ˉ − μ ) s ∼ t n − 1 = 1 − t n − 1 ( C − n ( μ 0 − μ ) s ) \begin{aligned} p(\mu)&=P\{ t > C| \mu\in(-\infin,\infin)\} \\ &= P\{ \frac{\sqrt{n}(\bar{X}-\mu)}{s} \geq C+\frac{\sqrt{n}(\mu_0-\mu)}{s}| \mu\in(-\infin,\infin)\} \\ \because ~~&\frac{\sqrt{n}(\bar{X}-\mu)}{s} \sim t_{n-1}\\ &=1-t_{n-1}(C-\frac{\sqrt{n}(\mu_0-\mu)}{s}) \end{aligned} p(μ)∵ =P{ t>C∣μ∈(−∞,∞)}=P{ sn(Xˉ−μ)≥C+sn(μ0−μ)∣μ∈(−∞,∞)}sn(Xˉ−μ)∼tn−1=1−tn−1(C−sn(μ0−μ))
取 α \alpha α,则根据检验标准的临界值求取法则,有:
s u p μ { 1 − t n − 1 ( C − n ( μ 0 − μ ) s ) ∣ μ ∈ ( − ∞ , μ 0 ) } < = α \underset{\mu}{sup} \{1-t_{n-1}(C-\frac{\sqrt{n}(\mu_0-\mu)}{s})|\mu\in(-\infin,\mu_0)\} <= \alpha μsup{ 1−tn−1(C−sn(μ0−μ))∣μ∈(−∞,μ0)}<=α
最后得到检验标准的临界值 C = t n − 1 ( α − 1 ) C=t_{n-1}(\alpha-1) C=tn−1(α−1)
回代入势函数,可得:
p ( μ ) = 1 − t n − 1 ( t t n − 1 ( α − 1 ) − n ( μ 0 − μ ) s ) p(\mu) = 1-t_{n-1}(t_{t_{n-1}(\alpha-1)}-\frac{\sqrt{n}(\mu_0-\mu)}{s}) p(μ)=1−tn−1(ttn−1(α−1)−sn(μ0−μ))
其中有两个重要的性质:
设无差别区域为 μ ∈ ( μ 0 , Δ ) \mu\in(\mu_0,\Delta) μ∈(μ0,Δ),则对于 [ Δ , + ∞ ] [\Delta,+\infin] [Δ,+∞],给定一个 β \beta β,使得 p ( μ ) ≥ 1 − β p(\mu)\geq1-\beta p(μ)≥1−β。由于势函数是非减的,故问题转换为临界问题:
p ( μ ) = 1 − t n − 1 ( t t n − 1 ( α − 1 ) − n ( μ 0 − μ ) s ) = 1 − β t n − 1 ( t t n − 1 ( α − 1 ) − n ( μ 0 − μ ) s ) = β \begin{aligned} p(\mu) = 1- t_{n-1}(t_{t_{n-1}(\alpha-1)}-\frac{\sqrt{n}(\mu_0-\mu)}{s}) = 1-\beta \\ t_{n-1}(t_{t_{n-1}(\alpha-1)}-\frac{\sqrt{n}(\mu_0-\mu)}{s}) = \beta \end{aligned} p(μ)=1−tn−1(ttn−1(α−1)−sn(μ0−μ))=1−βtn−1(ttn−1(α−1)−sn(μ0−μ))=β
从而得出适当的 n , σ n, \sigma n,σ ,前者对应采样容量,后者是在测量问题上,可考虑提高测量精度。
其中, β \beta β 是当备选假设成立时,原假设被错误地接受的概率的临界值。
通过 β , α , Δ \beta,\alpha, \Delta β,α,Δ,即可知道我们进行试验设计,得出适当的 n n n 。
返回目录
双样本 t 检验作为一种 t 检验,都是因为 σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 未知。
设总体 X , Y X,Y X,Y 服从正态分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2) N(μ1,σ12),N(μ2,σ22), μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 未知, σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2 未知。现从总体中抽出 n n n 个独立同分布的样品 X 1 , X 2 , ⋯ , X n 1 ; Y 1 , Y 2 , ⋯ , Y n 2 X_1,X_2,\cdots,X_{n1};Y_1,Y_2,\cdots,Y_{n_2} X1,X2,⋯,Xn1;Y1,Y2,⋯,Yn2。
验证假设:
1 ∘ : H 0 : μ 1 − μ 2 = d 0 H 1 : μ 1 − μ 2 ≠ d 0 1^{\circ}:H_0:\mu_1-\mu_2=d_0~~~~H_1:\mu_1-\mu_2\neq d_0 1∘:H0:μ1−μ2=d0 H1:μ1−μ2=d0
2 ∘ : H 0 : μ 1 − μ 2 ≤ d 0 H 1 : μ 1 − μ 2 > d 0 2^{\circ}:H_0:\mu_1-\mu_2\leq d_0~~~~H_1:\mu_1-\mu_2>d_0 2∘:H0:μ1−μ2≤d0 H1:μ1−μ2>d0
3 ∘ : H 0 : μ 1 − μ 2 ≥ d 0 H 1 : μ 1 − μ 2 < d 0 3^{\circ}:H_0:\mu_1-\mu_2\geq d_0~~~~H_1:\mu_1-\mu_23∘:H0:μ1−μ2≥d0 H1:μ1−μ2<d0
学生 t 检验要求 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2,检验统计量为:
t = X ˉ − Y ˉ − d 0 s 1 n 1 + 1 n 2 t=\frac{\bar{X}-\bar{Y}-d_0}{s\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} t=sn11+n21Xˉ−Yˉ−d0
其中:
s = ∑ ( X i − X ˉ ) 2 + ∑ ( Y i − Y ˉ ) 2 n 1 + n 2 − 2 s=\frac{\sum(X_i-\bar{X})^2+\sum(Y_i-\bar{Y})^2}{n_1+n_2-2} s=n1+n2−2∑(Xi−Xˉ)2+∑(Yi−Yˉ)2
n 1 , n 2 n_1,n_2 n1,n2 分别为总体 X , Y X,Y X,Y 的样本容量。
同样地,可证明检验标准的临界值,给定显著统计量 α \alpha α 下,由于 t ∼ t ( n − 1 ) t\sim t(n-1) t∼t(n−1),可求的 1°、2°、3°(对 2°、3° 而言,需要求上确界)的拒绝域分别为:
综上,要应用上述学生 t 检验,一般需要:
当 n 1 = n 2 n_1=n_2 n1=n2 时,条件 3 不满足时,也可以使用学生 t 检验。
返回目录
设总体 X , Y X,Y X,Y 服从正态分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2) N(μ1,σ12),N(μ2,σ22), μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 未知, σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 未知。现从总体中抽出 n n n 个独立同分布的样品 X 1 , X 2 , ⋯ , X n 1 ; Y 1 , Y 2 , ⋯ , Y n 2 X_1,X_2,\cdots,X_{n1};Y_1,Y_2,\cdots,Y_{n_2} X1,X2,⋯,Xn1;Y1,Y2,⋯,Yn2。
验证假设:
1 ∘ : H 0 : μ 1 − μ 2 = d 0 H 1 : μ 1 − μ 2 ≠ d 0 1^{\circ}:H_0:\mu_1-\mu_2=d_0~~~~H_1:\mu_1-\mu_2\neq d_0 1∘:H0:μ1−μ2=d0 H1:μ1−μ2=d0
2 ∘ : H 0 : μ 1 − μ 2 ≤ d 0 H 1 : μ 1 − μ 2 > d 0 2^{\circ}:H_0:\mu_1-\mu_2\leq d_0~~~~H_1:\mu_1-\mu_2>d_0 2∘:H0:μ1−μ2≤d0 H1:μ1−μ2>d0
3 ∘ : H 0 : μ 1 − μ 2 ≥ d 0 H 1 : μ 1 − μ 2 < d 0 3^{\circ}:H_0:\mu_1-\mu_2\geq d_0~~~~H_1:\mu_1-\mu_23∘:H0:μ1−μ2≥d0 H1:μ1−μ2<d0
学生 t 检验 不 要求 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2,检验统计量为:
t = X ˉ − Y ˉ − d 0 s 1 2 n 1 + s 2 2 n 2 t=\frac{\bar{X}-\bar{Y}-d_0}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}} t=n1s12+n2s22Xˉ−Yˉ−d0
n 1 , n 2 n_1,n_2 n1,n2 分别为总体 X , Y X,Y X,Y 的样本容量, s 1 , s 2 s_1,s_2 s1,s2 分别是样本方差。
可以证明,t 渐进服从自由度为:
d.f. = ( s 1 2 n 1 + s 2 2 n 2 ) 2 ( s 1 2 / n 1 ) 2 n 1 − 1 + ( s 2 2 / n 2 ) 2 n 2 − 1 \textbf{d.f.}=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2} {\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}} d.f.=n1−1(s12/n1)2+n2−1(s22/n2)2(n1s12+n2s22)2
的 t 分布。
同样地,可证明检验标准的临界值,给定显著统计量 α \alpha α 下,由于 t ∼ t ( d.f. ) t\sim t(\textbf{d.f.}) t∼t(d.f.),可求的 1°、2°、3°(对 2°、3° 而言,需要求上确界)的拒绝域分别为:
由于此时 t ( d.f. ) t(\textbf{d.f.}) t(d.f.) 是估计分布,因此 α \alpha α 不是真实水平
综上,要应用上述学生 t 检验,一般需要:
返回目录
当验证某些假设时,设计的试验不可避免地带有噪声因素,如:
以第一例来说,试验的设计断然不能是:
在人群中取 n 个样品,一部分人不吃药,另一部分人吃药,再测血糖
原因是:人体质的不同,导致有些人不吃药,血糖可能都比吃了药的人还要低。也即,存在噪声因素。
因此,为了消除噪声因素,试验应:
在人群中取 n 个样品,对每一个样品,吃药前测一次血糖,吃完药再测一次血糖,以两者之差,作为样本点。
为了比较安眠药的疗效,从人群中抽出 n n n 个样品,分别记服药前后的睡眠时长为 X 1 , X 2 X_1,X_2 X1,X2。令 X = X 1 − X 2 X=X_1-X_2 X=X1−X2。由于 X 1 , X 2 X_1,X_2 X1,X2 不是来自同一总体的样本,且不独立(配对),所以 X X X 消除了不同个体的引起差异,使得 X X X 的各个观测值仅由两种安眠药的差异引起。假定 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2),其中 μ , σ \mu,\sigma μ,σ 均未知。
验证假设:
1 ∘ : H 0 : μ = μ 0 H 1 : μ ≠ μ 0 1^{\circ}:H_0:\mu=\mu_0~~~~H_1:\mu\neq\mu_0 1∘:H0:μ=μ0 H1:μ=μ0
2 ∘ : H 0 : μ ≤ μ 0 H 1 : μ > μ 0 2^{\circ}:H_0:\mu\leq\mu_0~~~~H_1:\mu>\mu_0 2∘:H0:μ≤μ0 H1:μ>μ0
3 ∘ : H 0 : μ ≥ μ 0 H 1 : μ < μ 0 3^{\circ}:H_0:\mu\geq\mu_0~~~~H_1:\mu<\mu_0 3∘:H0:μ≥μ0 H1:μ<μ0
由于 σ \sigma σ 未知,所以在得到 X X X 的一组观测值后,就可以使用 单样本 t 检验 的方法,判断安眠药的效果。
配对 t 检验和双样本 t 检验有何不同?
配对 t 检验和单样本 t 检验的不同:
对于肥料对农作物产量的作用,的验证问题而言,土壤强度绝对是一个误差因素。但进行单个体,两测量的做法显然是不现实的,因为:
此时,就要分区组进行试验。假设试验的范围是某一个村,此时可以将土壤强度相近、试验条件相近的土地,划分为一个区组,并在区组内设置对照组、实验组,从而得到配对。
返回目录
概念 | 含义 |
---|---|
统计单元 | 从收集数据的角度来谈,指某一数据的来源性质,如某一数据来自某一特定区域的人、如一个广州人;又或者是来自一个性别,如一个男人等;又如某土壤采集自土地 A。想这些,广州人、土地 A,就是统计单元。样本中的样品可以有不同的统计单元。 |
分区组 | 在设计试验时,为了消除噪声因素,常常进行分区组。如测试肥料的效果时,土壤的强度便成为一个噪声因素。为此,需要将土地分区,再在同一块土地上,进行对照试验。 |
返回目录
详见博文:假设检验
返回目录
势函数是包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力。
详见博文:假设检验
返回目录
若 X ∼ N ( 0 , 1 ) , S ∼ χ n 2 X\sim N(0,1), S\sim \chi_n^2 X∼N(0,1),S∼χn2,则 Y = X / S / n Y=X/\sqrt{S/n} Y=X/S/n 的分布为:
t ( n ) = Γ ( ( n + 1 ) / 2 ) n π Γ ( n / 2 ) ( 1 + y 2 n ) − n + 1 2 t(n)=\frac{\Gamma((n+1)/2)}{\sqrt{n\pi}\Gamma(n/2)}(1+\frac{y^2}{n})^{-\frac{n+1}{2}} t(n)=nπΓ(n/2)Γ((n+1)/2)(1+ny2)−2n+1
即自由度为 n n n 的 t 分布。
返回目录
返回目录