04.第二章 抽样分布及若干预备知识(3)

第二章 抽样分布及若干预备知识(3)

1. Γ \Gamma Γ分布与 B \Beta B分布

在了解 Γ \Gamma Γ分布与 B \Beta B分布之前,要先知道 Γ \Gamma Γ函数和 B \Beta B函数。

Γ \Gamma Γ函数:定义为 Γ ( x ) = ∫ 0 ∞ t x − 1 e − t d t ⋅ I ( x > 0 ) \Gamma(x)=\int_0^\infty t^{x-1}e^{-t}dt \cdot I_{(x>0)} Γ(x)=0tx1etdtI(x>0)

  • 其主要取值为 Γ ( 1 ) = ∫ 0 ∞ e − t d t = 1 , Γ ( 1 2 ) = ∫ 0 ∞ t − 1 / 2 e − t d t = π \Gamma(1)=\int_0^\infty e^{-t}dt=1,\Gamma(\frac12)=\int_0^\infty t^{-1/2}e^{-t}dt=\sqrt \pi Γ(1)=0etdt=1,Γ(21)=0t1/2etdt=π
  • 余元公式:对于 0 < s < 1 00<s<1,有 Γ ( s ) Γ ( 1 − s ) = π sin ⁡ π s \Gamma(s)\Gamma(1-s)=\frac{\pi}{\sin{\pi s}} Γ(s)Γ(1s)=sinπsπ,利用此公式得到 Γ ( 1 2 ) \Gamma(\frac12) Γ(21)的值。
  • 递归公式: Γ ( x + 1 ) = x Γ ( x ) \Gamma(x+1)=x\Gamma(x) Γ(x+1)=xΓ(x),所以 Γ \Gamma Γ函数可以看成阶乘在实数域上的延拓。

B \Beta B函数:定义为 B ( a , b ) = ∫ 0 1 x a − 1 ( 1 − x ) b − 1 d x , a > 0 , b > 0 \Beta(a,b)=\int_0^1 x^{a-1}(1-x)^{b-1}dx,a>0,b>0 B(a,b)=01xa1(1x)b1dx,a>0,b>0

  • 可以证明 B ( a , b ) = B ( b , a ) \Beta(a,b)=\Beta(b,a) B(a,b)=B(b,a)
  • B ( a , b ) = Γ ( a ) Γ ( b ) Γ ( a + b ) \Beta(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)} B(a,b)=Γ(a+b)Γ(a)Γ(b),如果 a , b a,b a,b都是正整数,则有 B ( a , b ) = 1 C a + b − 2 a − 1 \Beta(a,b)=\frac{1}{C_{a+b-2}^{a-1}} B(a,b)=Ca+b2a11。由于已知 B \Beta B函数值总是落在0、1之间,所以 Γ ( a + b ) \Gamma(a+b) Γ(a+b)要在分母的位置。

现在可以给出 Γ \Gamma Γ分布与 B \Beta B分布。

Γ \Gamma Γ分布:概率密度为 Γ ( x ; α , λ ) = λ α Γ ( α ) x α − 1 e − λ x I ( x > 0 ) \Gamma(x;\alpha,\lambda)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x}I_{(x>0)} Γ(x;α,λ)=Γ(α)λαxα1eλxI(x>0),其决定式为 x α − 1 e − λ x x^{\alpha-1}e^{-\lambda x} xα1eλx

  • 利用 Γ \Gamma Γ函数可以给出其正则化因子。
    ∫ 0 ∞ x α − 1 e − λ x d x = 1 λ α − 1 ∫ 0 ∞ ( λ x ) α − 1 e − λ x d x = 1 λ α ∫ 0 ∞ ( λ x ) α − 1 e − λ x d ( λ x ) = Γ ( α ) λ α \begin{aligned} &\int_0^\infty x^{\alpha-1}e^{-\lambda x}dx\\ =&\frac1{\lambda^{\alpha-1}}\int_0^\infty (\lambda x)^{\alpha-1}e^{-\lambda x} dx\\ =&\frac1{\lambda^\alpha} \int_0^\infty(\lambda x)^{\alpha-1}e^{-\lambda x}d(\lambda x)\\ =&\frac{\Gamma(\alpha)}{\lambda^\alpha} \end{aligned} ===0xα1eλxdxλα110(λx)α1eλxdxλα10(λx)α1eλxd(λx)λαΓ(α)
    其正则化因子可以帮助我们很快地找到期望与方差。

  • 可以验证 Γ \Gamma Γ分布的可加性与可乘性,即 X 1 ∼ Γ ( α 1 , λ ) , X 2 ∼ Γ ( α 2 , λ ) X_1\sim \Gamma(\alpha_1,\lambda),X_2\sim \Gamma(\alpha_2,\lambda) X1Γ(α1,λ),X2Γ(α2,λ)且独立,则 X 1 + X 2 ∼ Γ ( α 1 + α 2 , λ ) X_1+X_2\sim \Gamma(\alpha_1+\alpha_2,\lambda) X1+X2Γ(α1+α2,λ);若 X ∼ Γ ( α , λ ) X\sim \Gamma(\alpha,\lambda) XΓ(α,λ),则 k X ∼ Γ ( α , λ / k ) kX\sim \Gamma(\alpha,\lambda/k) kXΓ(α,λ/k)

  • Γ \Gamma Γ分布的期望为 E X = α / λ EX=\alpha/\lambda EX=α/λ,方差为 α / λ 2 \alpha/\lambda^2 α/λ2

B \Beta B分布:概率密度为 B ( x ; a , b ) = 1 B ( a , b ) x a − 1 ( 1 − x ) b − 1 I ( 0 < x < 1 ) \Beta(x;a,b)=\frac1{\Beta(a,b)}x^{a-1}(1-x)^{b-1}I_{(0B(x;a,b)=B(a,b)1xa1(1x)b1I(0<x<1),其决定式为 x a − 1 ( 1 − x ) b − 1 x^{a-1}(1-x)^{b-1} xa1(1x)b1

  • B \Beta B分布的正则化因子是显然的。

  • 根据 B \Beta B函数与 Γ \Gamma Γ函数的关系,可以得到期望与方差,分别为
    X ∼ B ( a , b ) , E X = a a + b , D X = a b ( a + b ) 2 ( a + b + 1 ) X\sim \Beta(a,b),EX=\frac a {a+b},DX=\frac{ab}{(a+b)^2(a+b+1)} XB(a,b),EX=a+ba,DX=(a+b)2(a+b+1)ab

2. χ 2 \chi^2 χ2分布

χ 2 \chi^2 χ2分布:设 X 1 , X 2 , ⋯   , X n i.i.d. ∼ N ( 0 , 1 ) X_1,X_2,\cdots,X_n\text{i.i.d.}\sim N(0,1) X1,X2,,Xni.i.d.N(0,1),则 ξ = ∑ i = 1 n X i 2 \xi=\sum_{i=1}^n X_i^2 ξ=i=1nXi2被称为自由度为 n n n χ 2 \chi^2 χ2变量,其分布称为自由度为 n n n χ 2 \chi^2 χ2分布,记作 ξ ∼ χ n 2 \xi\sim \chi^2_n ξχn2。也就是说, n n n个独立的标准正态变量平方和构成自由度为 n n n χ 2 \chi^2 χ2变量。

χ 2 \chi^2 χ2分布的概率密度函数如下:
g n ( x ) = { 1 2 n / 2 Γ ( n / 2 ) x n / 2 − 1 e − x / 2 , x > 0 0 , x ≤ 0 g_n(x)=\left\{ \begin{array}{l} \frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2},&x>0\\0,&x\le0 \end{array} \right. gn(x)={2n/2Γ(n/2)1xn/21ex/2,0,x>0x0
去掉正则化因子,得到 χ 2 \chi^2 χ2分布的决定式为 g n ( x ) ∝ x n / 2 − 1 e − x / 2 I ( x > 0 ) g_n(x)\propto x^{n/2-1}e^{-x/2}I_{(x>0)} gn(x)xn/21ex/2I(x>0)。要证明其概率密度函数的形式需要用到球坐标变换。

Γ \Gamma Γ分布对比,可以发现实际上 χ n 2 \chi^2_n χn2的分布等同于 Γ ( n 2 , 1 2 ) \Gamma(\frac{n}2,\frac12) Γ(2n,21)。如果给定 X ∼ Γ ( α , λ ) X\sim \Gamma (\alpha, \lambda ) XΓ(α,λ),则 2 λ X ∼ Γ ( α , 1 / 2 ) = χ 2 α 2 2\lambda X\sim \Gamma(\alpha,1/2)= \chi^2_{2\alpha} 2λXΓ(α,1/2)=χ2α2,这就是 Γ \Gamma Γ分布与 χ 2 \chi^2 χ2分布的互相转化。

接下来求 χ 2 \chi^2 χ2变量的一些性质。

  • ξ ∼ χ n 2 \xi\sim \chi^2_n ξχn2,则其特征函数为 φ ( t ) = ( 1 − 2 i t ) − n / 2 \varphi(t)=(1-2it)^{-n/2} φ(t)=(12it)n/2。要证明这个结论,可以先找 Γ ( α , λ ) \Gamma(\alpha, \lambda) Γ(α,λ)的特征函数,设 X ∼ Γ ( α , λ ) X\sim \Gamma(\alpha, \lambda) XΓ(α,λ),则有
    E ( e i t X ) = λ α Γ ( α ) ∫ 0 ∞ x α − 1 e − λ x e i t x d x = ( λ λ − i t ) α E(e^{itX})=\frac{\lambda^\alpha}{\Gamma(\alpha)}\int_0^\infty x^{\alpha-1}e^{-\lambda x}e^{itx}dx=(\frac{\lambda}{\lambda-it})^\alpha E(eitX)=Γ(α)λα0xα1eλxeitxdx=(λitλ)α
    ξ ∼ χ n 2 = Γ ( n / 2 , 1 / 2 ) \xi\sim \chi^2_n=\Gamma(n/2,1/2) ξχn2=Γ(n/2,1/2),代入数据得
    φ ( t ) = ( 1 / 2 1 / 2 − i t ) n / 2 = ( 1 − 2 i t ) n / 2 \varphi(t)=(\frac{1/2}{1/2-it})^{n/2}=(1-2it)^{n/2} φ(t)=(1/2it1/2)n/2=(12it)n/2

  • ξ ∼ χ n 2 \xi\sim \chi^2_n ξχn2,则 E ξ = n , D ξ = 2 n E\xi=n,D\xi=2n Eξ=n,Dξ=2n。有了 Γ \Gamma Γ分布的期望与方差就可以代入求。

  • 可加性: Z 1 ∼ χ n 1 2 , Z 2 ∼ χ n 2 2 Z_1\sim \chi_{n_1}^2,Z_2\sim \chi_{n_2}^2 Z1χn12,Z2χn22,则 Z 1 + Z 2 ∼ χ n 1 + n 2 2 Z_1+Z_2\sim \chi^2_{n_1+n_2} Z1+Z2χn1+n22。这既可以用特征函数,也可以用 Γ \Gamma Γ分布的可加性,还可以用 χ 2 \chi^2 χ2变量的定义来证明。

3. t t t分布

t t t分布:设有两个相互独立的随机变量 X ∼ N ( 0 , 1 ) , Y ∼ χ n 2 X\sim N(0,1),Y\sim \chi^2_n XN(0,1),Yχn2,则 T = X Y / n T=\frac{X}{\sqrt{Y/n}} T=Y/n X称为自由度为 n n n t t t变量,其分布为自由度为 n n n t t t分布,记作 T ∼ t n T\sim t_n Ttn。形式上, t t t分布表现为正态分布除以归一化的卡方分布。

t t t分布的概率密度函数为 t n ( x ) = Γ ( n + 1 2 ) Γ ( n 2 ) n π ( 1 + x 2 n ) − ( n + 1 ) / 2 t_n(x)=\frac{\Gamma(\frac{n+1}{2})}{\Gamma(\frac n2)\sqrt{n\pi}}(1+\frac{x^2}{n})^{-(n+1)/2} tn(x)=Γ(2n)nπ Γ(2n+1)(1+nx2)(n+1)/2。其证明用到以下两个引理:

  • X X X是一维连续随机变量,概率密度为 f X ( x ) f_X(x) fX(x),则 Y = a X + b Y=aX+b Y=aX+b的概率密度为 f Y ( y ) = 1 ∣ a ∣ f X ( y − b a ) f_Y(y)=\frac{1}{|a|}f_X(\frac{y-b}{a}) fY(y)=a1fX(ayb)
  • ( X , Y ) (X,Y) (X,Y)是二维连续随机变量,概率密度为 f ( x , y ) f(x,y) f(x,y),则 Z = Y / X Z=Y/X Z=Y/X的概率密度为 f z ( z ) = ∫ − ∞ ∞ ∣ x ∣ f ( x , x z ) d x f_z(z)=\int_{-\infty}^\infty |x|f(x,xz)dx fz(z)=xf(x,xz)dx

首先计算 Y / n Y/n Y/n的概率密度,由引理1,可以得到
f Y / n ( x ) = n 2 n / 2 Γ ( n / 2 ) ( n x ) n / 2 − 1 e − n x / 2 I ( x > 0 ) = ( n / 2 ) n / 2 Γ ( n / 2 ) x n / 2 − 1 e − n x / 2 I ( x > 0 ) \begin{aligned} &f_{Y/n}(x)\\ =&\frac{n}{2^{n/2}\Gamma(n/2)}(nx)^{n/2-1}e^{-nx/2}I_{(x>0)}\\ =&\frac{(n/2)^{n/2}}{\Gamma(n/2)}x^{n/2-1}e^{-nx/2}I_{(x>0)} \end{aligned} ==fY/n(x)2n/2Γ(n/2)n(nx)n/21enx/2I(x>0)Γ(n/2)(n/2)n/2xn/21enx/2I(x>0)
接下来计算 Y / n \sqrt{Y/n} Y/n 的概率密度,首先有
F ( Y / n ) ( y ) = P { Y / n ≤ y } = P { Y / n ≤ y 2 } = F Y / n ( y 2 ) F_{\sqrt{(Y/n)}}(y)=P\{\sqrt{Y/n}\leq y\}=P\{Y/n\leq y^2\}=F_{Y/n}(y^2) F(Y/n) (y)=P{Y/n y}=P{Y/ny2}=FY/n(y2)
对等式两边同时求导,得
f ( Y / n ) ( y ) = 2 y f Y / n ( y 2 ) = 2 y ( n / 2 ) n / 2 Γ ( n / 2 ) ( y 2 ) n / 2 − 1 e − n y 2 / 2 I ( y > 0 ) = 2 ( n / 2 ) n / 2 Γ ( n / 2 ) y n − 1 e − n y 2 / 2 I ( y > 0 ) \begin{aligned} &f_{\sqrt{(Y/n)}}(y)=2yf_{Y/n}(y^2)\\ =&\frac{2y(n/2)^{n/2}}{\Gamma(n/2)}(y^2)^{n/2-1}e^{-ny^2/2}I_{(y>0)}\\ =&\frac{2(n/2)^{n/2}}{\Gamma(n/2)}y^{n-1}e^{-ny^2/2}I_{(y>0)} \end{aligned} ==f(Y/n) (y)=2yfY/n(y2)Γ(n/2)2y(n/2)n/2(y2)n/21eny2/2I(y>0)Γ(n/2)2(n/2)n/2yn1eny2/2I(y>0)
接下来求 X Y / n \frac{X}{\sqrt{Y/n}} Y/n X的分布,由于 X , Y X,Y X,Y独立,所以联合分布为边际分布之乘积,于是
f T ( z ) = ∫ − ∞ ∞ ∣ x ∣ f ( x , x z ) d x = ∫ − ∞ ∞ ∣ x ∣ 2 ( n / 2 ) n / 2 Γ ( n / 2 ) x n − 1 e − n x 2 / 2 I ( x > 0 ) 1 2 π exp { − ( x z ) 2 2 } d x = ∫ 0 ∞ 2 ( n / 2 ) n / 2 π Γ ( n / 2 ) x n e − x 2 2 ( n + z 2 ) d x \begin{aligned} f_T(z)=&\int_{-\infty}^\infty |x|f(x, xz)dx\\ =&\int_{-\infty}^\infty|x|\frac{2(n/2)^{n/2}}{\Gamma(n/2)}x^{n-1}e^{-nx^2/2}I_{(x>0)}\frac{1}{\sqrt{2\pi}}\text{exp}\left\{-\frac{(xz)^2}{2}\right\}dx\\ =&\int_0^\infty \frac{\sqrt2(n/2)^{n/2}}{\sqrt{\pi}\Gamma(n/2)}x^ne^{-\frac{x^2}{2}(n+z^2)}dx \end{aligned} fT(z)===xf(x,xz)dxxΓ(n/2)2(n/2)n/2xn1enx2/2I(x>0)2π 1exp{2(xz)2}dx0π Γ(n/2)2 (n/2)n/2xne2x2(n+z2)dx
整理成这个形式以后,要想办法向 Γ \Gamma Γ函数靠近,所以令 u = x 2 2 ( n + z 2 ) u=\frac{x^2}{2}(n+z^2) u=2x2(n+z2),就有 x = 2 u n + z 2 , d x = 1 2 u ( n + z 2 ) d u x=\sqrt{\frac{2u}{n+z^2}},dx=\frac{1}{\sqrt {2u(n+z^2)}}du x=n+z22u ,dx=2u(n+z2) 1du,代入可得
f T ( z ) = ∫ 0 ∞ 2 ( n / 2 ) n / 2 π Γ ( n / 2 ) 2 u n + z 2 n e − u 1 2 u ( n + z 2 ) d u = ∫ 0 ∞ 2 n ( n / 2 ) n / 2 π ( n + z 2 ) n + 1 Γ ( n / 2 ) u ( n − 1 ) / 2 e − u d u = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + z 2 n ) − n + 1 2 \begin{aligned} f_T(z)=&\int_0^\infty\frac{\sqrt 2(n/2)^{n/2}}{\sqrt \pi \Gamma(n/2)}\sqrt{\frac{2u}{n+z^2}}^ne^{-u}\frac{1}{\sqrt{2u(n+z^2)}}du\\ =&\int_0^\infty \frac{\sqrt{2^n}(n/2)^{n/2}}{\sqrt {\pi(n+z^2)^{n+1}\Gamma(n/2)}}u^{(n-1)/2}e^{-u}du\\ =&\frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}\left(1+\frac{z^2}{n}\right)^{-\frac{n+1}{2}} \end{aligned} fT(z)===0π Γ(n/2)2 (n/2)n/2n+z22u neu2u(n+z2) 1du0π(n+z2)n+1Γ(n/2) 2n (n/2)n/2u(n1)/2eudunπ Γ(2n)Γ(2n+1)(1+nz2)2n+1
这就得到 t t t分布的概率密度函数。总结以上过程,第一步先求得 Y / n Y/n Y/n的分布,然后求 Y / n \sqrt{Y/n} Y/n 的分布,最后求 X / Y / n X/\sqrt{Y/n} X/Y/n 的分布,过程中用到一些变换引理。

t t t分布的一些性质:

  • T ∼ t n T\sim t_n Ttn,则 E ( T r ) E(T^r) E(Tr)只有在 r < n ( n > 1 ) r1) r<n(n>1)时存在(严格小于),而 n ≥ 2 n\geq2 n2 E ( T ) = 0 E(T)=0 E(T)=0 n ≥ 3 n\geq3 n3 D ( T ) = n / ( n − 2 ) D(T)=n/(n-2) D(T)=n/(n2)
  • 自由度为1的 t t t分布就是柯西分布,柯西分布不存在均值。
  • n → ∞ n\to\infty n t t t变量的极限分布是正态分布。

4. F F F分布

F F F分布:对于两个独立的 χ 2 \chi^2 χ2变量 X ∼ X m 2 , Y ∼ X n 2 X\sim X_m^2,Y\sim X_n^2 XXm2,YXn2,称 F = X / m Y / n F=\frac{X/m}{Y/n} F=Y/nX/m是自由度为 m , n m,n m,n F F F变量,服从自由度为 m , n m,n m,n F F F分布,记作 F ∼ F m , n F\sim F_{m,n} FFm,n。注意分子的自由度在前。

F F F分布的密度函数为 f m , n ( x ) = Γ ( m + n 2 ) Γ ( n 2 ) Γ ( m 2 ) m m / 2 n n / 2 x m / 2 − 1 ( n + m x ) − ( m + n ) / 2 f_{m,n}(x)=\frac{\Gamma(\frac{m+n}{2})}{\Gamma(\frac n2)\Gamma(\frac m2)}m^{m/2}n^{n/2}x^{m/2-1}(n+mx)^{-(m+n)/2} fm,n(x)=Γ(2n)Γ(2m)Γ(2m+n)mm/2nn/2xm/21(n+mx)(m+n)/2

F F F分布的一些性质:

  • Z ∼ F m , n Z\sim F_{m,n} ZFm,n,则 1 / Z ∼ F n , m 1/Z\sim F_{n,m} 1/ZFn,m
  • T   ∼ t n T~\sim t_n T tn,则 T 2 ∼ F 1 , n T^2\sim F_{1,n} T2F1,n
  • Z ∼ F m , n Z\sim F_{m,n} ZFm,n,则 E Z = n / ( n − 2 ) , n > 2 ; D Z = 2 n 2 ( m + n − 2 ) / m ( n − 2 ) 2 ( n − 4 ) , n > 4 EZ=n/(n-2),n>2;DZ=2n^2(m+n-2)/m(n-2)^2(n-4),n>4 EZ=n/(n2),n>2;DZ=2n2(m+n2)/m(n2)2(n4),n>4
  • F m , n ( α ) F_{m,n}(\alpha) Fm,n(α)为其上 α \alpha α分位数。 F m , n ( 1 − α ) = 1 / F n , m ( α ) F_{m,n}(1-\alpha)=1/F_{n,m}(\alpha) Fm,n(1α)=1/Fn,m(α)。有了这个性质,我们可以对 α = 0.95 , 0.99 \alpha=0.95,0.99 α=0.95,0.99之类的值进行分位数求值。

关于三大分布,最主要的应用在于它们的定义式,以及用作区间估计、假设检验中查分位数表,均值、方差等数字特征并不常用,概率密度函数也并不很重要。

5.一些推论

对于一系列正态变量 X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn,其中 X i ∼ N ( a i , σ i 2 ) X_i\sim N(a_i,\sigma_i^2) XiN(ai,σi2),有
∑ i = 1 n ( X i − a i σ i ) 2 ∼ χ n 2 \sum_{i=1}^n\left(\frac{X_i-a_i}{\sigma_i}\right)^2\sim\chi_n^2 i=1n(σiXiai)2χn2
这是联系正态变量与卡方变量的直接方式。


X 1 , ⋯   , X n i.i.d ∼ N ( a , σ 2 ) X_1,\cdots,X_n\text{i.i.d}\sim N(a,\sigma^2) X1,,Xni.i.dN(a,σ2),则
T = n ( X ˉ − a ) S ∼ t n − 1 T=\frac{\sqrt n(\bar X-a)}{S}\sim t_{n-1} T=Sn (Xˉa)tn1
证明如下,因为 X ˉ ∼ N ( a , σ / n ) \bar X\sim N(a,\sigma/n) XˉN(a,σ/n),所以将其标准化后,有
N 1 = X ˉ − a σ / n ∼ N ( 0 , 1 ) N_1=\frac{\bar X-a}{\sigma/\sqrt n}\sim N(0,1) N1=σ/n XˉaN(0,1)
N 2 = ( n − 1 ) S 2 / σ 2 ∼ χ n − 1 2 N_2=(n-1)S^2/\sigma^2\sim \chi^2_{n-1} N2=(n1)S2/σ2χn12,所以
N 1 N 2 / ( n − 1 ) = n ( X ˉ − a ) σ ⋅ σ 2 S 2 = n ( X ˉ − a ) S ∼ t n − 1 \frac{N_1}{\sqrt{N_2/(n-1)}}=\frac{\sqrt{n}(\bar X-a)}{\sigma}\cdot \sqrt{\frac{\sigma^2}{S^2}}=\frac{\sqrt{n}(\bar X-a)}{S}\sim t_{n-1} N2/(n1) N1=σn (Xˉa)S2σ2 =Sn (Xˉa)tn1
这常用于一组样本在未知方差情形下的均值检验。


X 1 , ⋯   , X m i.i.d. ∼ N ( a 1 , σ 2 ) , Y 1 , ⋯   , Y n i.i.d. ∼ N ( a 2 , σ 2 ) X_1,\cdots,X_m\text{i.i.d.}\sim N(a_1,\sigma^2),Y_1,\cdots,Y_n\text{i.i.d.}\sim N(a_2,\sigma^2) X1,,Xmi.i.d.N(a1,σ2),Y1,,Yni.i.d.N(a2,σ2),且两组样本独立,则有
T = ( X ˉ − Y ˉ ) − ( a 1 − a 2 ) S w ⋅ m n m + n ∼ t m + n − 2 其 中 S w 2 = 1 m + n − 2 [ ∑ i = 1 m ( X i − X ˉ ) 2 + ∑ j = 1 n ( Y i − Y ˉ ) 2 ] T=\frac{(\bar X-\bar Y)-(a_1-a_2)}{S_w}\cdot\sqrt{\frac{mn}{m+n}}\sim t_{m+n-2}\\ 其中S_w^2=\frac{1}{m+n-2}[\sum_{i=1}^m(X_i-\bar X)^2+\sum_{j=1}^n(Y_i-\bar Y)^2] T=Sw(XˉYˉ)(a1a2)m+nmn tm+n2Sw2=m+n21[i=1m(XiXˉ)2+j=1n(YiYˉ)2]
证明如下,由于 X ˉ ∼ N ( a 1 , σ 2 / m ) , Y ˉ ∼ N ( a 2 , σ 2 / n ) \bar X\sim N(a_1,\sigma^2/m),\bar Y\sim N(a_2,\sigma^2/n) XˉN(a1,σ2/m),YˉN(a2,σ2/n),所以
X ˉ − Y ˉ ∼ N ( a 1 − a 2 , ( σ m + n m n ) 2 ) N 1 = ( X ˉ − Y ˉ ) − ( a 1 − a 2 ) σ m + n m n ∼ N ( 0 , 1 ) \bar X-\bar Y\sim N\left(a_1-a_2,\left(\sigma\sqrt{\frac{m+n}{mn}}\right)^2\right)\\ N_1=\frac{(\bar X-\bar Y)-(a_1-a_2)}{\sigma\sqrt{\frac{m+n}{mn}}}\sim N(0,1) XˉYˉNa1a2,(σmnm+n )2N1=σmnm+n (XˉYˉ)(a1a2)N(0,1)
( m + n − 2 ) S w 2 = ( m − 1 ) S X 2 + ( n − 1 ) S Y 2 (m+n-2)S_w^2=(m-1)S_X^2+(n-1)S_Y^2 (m+n2)Sw2=(m1)SX2+(n1)SY2,由于 χ 2 \chi^2 χ2分布的可加性,有
N 2 = ( m + n − 2 ) S w 2 σ 2 ∼ χ m + n − 2 2 N_2=\frac{(m+n-2)S_w^2}{\sigma^2}\sim \chi^2_{m+n-2} N2=σ2(m+n2)Sw2χm+n22
所以
N 1 N 2 / ( m + n − 2 ) = ( X ˉ − Y ˉ ) − ( a 1 − a 2 ) σ m + n m n ⋅ σ S w = T ∼ t m + n − 2 \frac{N_1}{\sqrt{N_2/(m+n-2)}}=\frac{(\bar X-\bar Y)-(a_1-a_2)}{\sigma\sqrt{\frac{m+n}{mn}}}\cdot \frac{\sigma}{S_w}=T\sim t_{m+n-2} N2/(m+n2) N1=σmnm+n (XˉYˉ)(a1a2)Swσ=Ttm+n2
这常用于两组样本在方差相等但未知的情况下估计均值差异。


X 1 , ⋯   , X m i.i.d. ∼ N ( a 1 , σ 1 2 ) , Y 1 , ⋯   , Y n i.i.d. ∼ N ( a 2 , σ 2 2 ) X_1,\cdots,X_m\text{i.i.d.}\sim N(a_1,\sigma^2_1),Y_1,\cdots,Y_n\text{i.i.d.}\sim N(a_2,\sigma^2_2) X1,,Xmi.i.d.N(a1,σ12),Y1,,Yni.i.d.N(a2,σ22),且两组样本相互独立,则
F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F m − 1 , n − 1 F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F_{m-1,n-1} F=S22/σ22S12/σ12Fm1,n1
适用于检验两个正态样本方差比值的检测。


X 1 , ⋯   , X n i.i.d. ∼ f ( x , λ ) = λ e λ x I ( 0 , ∞ ) ( x ) X_1,\cdots,X_n\text{i.i.d.}\sim f(x,\lambda )=\lambda e^{\lambda x}I_{(0,\infty)}(x) X1,,Xni.i.d.f(x,λ)=λeλxI(0,)(x),则有
2 λ n X ˉ = 2 λ ∑ i = 1 n ∼ χ 2 n 2 2\lambda n \bar X=2\lambda \sum_{i=1}^n\sim \chi^2_{2n} 2λnXˉ=2λi=1nχ2n2
只要注意到 Γ ( n , λ ) \Gamma(n,\lambda) Γ(n,λ) n n n个同分布指数分布 E ( λ ) E(\lambda) E(λ)的和即可,即 ∑ i = 1 n X i = ξ ∼ Γ ( n , λ ) \sum_{i=1}^n X_i=\xi\sim \Gamma(n,\lambda) i=1nXi=ξΓ(n,λ)即可。

你可能感兴趣的:(《数理统计》学习笔记,概率论)