对数理统计的一些基本概念有了了解后,我们来学习三个重要的抽样分布。
设 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 相互独立且均服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1) ,称 X 1 2 + X 2 2 + ⋯ + X n 2 X_1^2+X_2^2+\cdots+X_n^2 X12+X22+⋯+Xn2 服从 χ 2 ( n ) \chi^2(n) χ2(n) ,其中 n n n 称为自由度。设其概率密度为 f ( x ) f(x) f(x) ,则其函数图像为:
对任意的 0 < α < 1 0<\alpha<1 0<α<1 ,若 P { X > χ α 2 ( n ) } = α , P\{X>\chi_\alpha^2(n)\}=\alpha, P{X>χα2(n)}=α, 称 χ α 2 ( n ) \chi_\alpha^2(n) χα2(n) 为 χ 2 ( n ) \chi^2(n) χ2(n) 分布的右或上 α \alpha α 分位点。若有 P { X < χ 1 − α 2 ( n ) } = α , P\{X<\chi_{1-\alpha}^2(n)\}=\alpha, P{X<χ1−α2(n)}=α, 称 χ 1 − α 2 ( n ) \chi_{1-\alpha}^2(n) χ1−α2(n) 为 χ 2 ( n ) \chi^2(n) χ2(n) 分布的左或下 α \alpha α 分位点,如下图所示。
对性质 3 进行证明:
由 X ∼ χ 2 ( n ) X\sim \chi^2(n) X∼χ2(n) ,则 X = X 1 2 + X 2 2 + ⋯ + X n 2 X=X_1^2+X_2^2+\cdots+X_n^2 X=X12+X22+⋯+Xn2 ,其中 X i ∼ N ( 0 , 1 ) ( i = 1 , 2 , ⋯ , n ) X_i\sim N(0,1)(i=1,2,\cdots,n) Xi∼N(0,1)(i=1,2,⋯,n) ,有 E ( X i ) = 0 , D ( X i ) = 1 E(X_i)=0,D(X_i)=1 E(Xi)=0,D(Xi)=1 。根据方差的定义, E ( X i 2 ) = D ( X i ) + [ E ( X i ) ] 2 = 1 E(X_i^2)=D(X_i)+[E(X_i)]^2=1 E(Xi2)=D(Xi)+[E(Xi)]2=1 。计算 E ( X i 4 ) = ∫ − ∞ + ∞ x 4 1 2 π e − x 2 2 d x = 2 2 π ∫ 0 + ∞ x 4 e − x 2 2 d x . E(X_i^4)=\int_{-\infty}^{+\infty}x^4\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx=\frac{2}{\sqrt{2\pi}}\int_0^{+\infty}x^4e^{-\frac{x^2}{2}}dx. E(Xi4)=∫−∞+∞x42π1e−2x2dx=2π2∫0+∞x4e−2x2dx. 换元,令 t = x 2 / 2 t=x^2/2 t=x2/2 ,有 E ( X i 4 ) = 2 2 π ∫ 0 + ∞ 4 t 2 e − t ⋅ 1 2 t d t = 4 π ∫ 0 + ∞ t 3 2 e − t d t . E(X_i^4)=\frac{2}{\sqrt{2\pi}}\int_0^{+\infty}4t^2e^{-t}\cdot \frac{1}{\sqrt{2t}}dt=\frac{4}{\sqrt{\pi}}\int_0^{+\infty}t^{\frac{3}{2}}e^{-t}dt. E(Xi4)=2π2∫0+∞4t2e−t⋅2t1dt=π4∫0+∞t23e−tdt. 回忆一下,在反常积分,我们学过一个伽玛函数,即 Γ ( α ) = ∫ 0 + ∞ x α − 1 e − x d x ( α > 0 ) \Gamma(\alpha)=\int_0^{+\infty}x^{\alpha -1}e^{-x}dx (\alpha>0) Γ(α)=∫0+∞xα−1e−xdx(α>0) 主要有如下性质: Γ ( α + 1 ) = α Γ ( α ) , Γ ( n + 1 ) = n ! , Γ ( 1 2 ) = π . \Gamma(\alpha+1)=\alpha \Gamma(\alpha),\Gamma(n+1)=n!, \Gamma(\frac{1}{2})= \sqrt{\pi}. Γ(α+1)=αΓ(α),Γ(n+1)=n!,Γ(21)=π. 因此,我们可以得到 E ( X i 4 ) = 4 / π ⋅ Γ ( 5 / 2 ) = 4 / π ⋅ 3 / 2 ⋅ π / 2 = 3. E(X_i^4)=4/\sqrt{\pi}\cdot \Gamma(5/2)=4/\sqrt{\pi}\cdot 3/2 \cdot \sqrt{\pi}/2=3. E(Xi4)=4/π⋅Γ(5/2)=4/π⋅3/2⋅π/2=3. 于是我们可以得到: D ( X i 2 ) = E ( X i 4 ) − [ E ( X i 2 ) ] 2 = 3 − 1 = 2. D(X_i^2)=E(X_i^4)-[E(X_i^2)]^2=3-1=2. D(Xi2)=E(Xi4)−[E(Xi2)]2=3−1=2. 故 E ( X ) = ∑ E ( X i 2 ) = n , D ( X ) = ∑ D ( X i 2 ) = 2 n . E(X)=\sum E(X_i^2)=n,D(X)=\sum D(X_i^2)=2n. E(X)=∑E(Xi2)=n,D(X)=∑D(Xi2)=2n.
【例题】设总体 X ∼ N ( 0 , 2 ) X\sim N(0,2) X∼N(0,2), ( X 1 , X 2 , X 3 ) X_1,X_2,X_3) X1,X2,X3) 为总体 X X X 的简单随机样本,记 Z = X 1 2 + ( X 2 − X 3 ) 2 Z=X_1^2+(X_2-X_3)^2 Z=X12+(X2−X3)2,求 E ( Z ) , D ( Z ) E(Z),D(Z) E(Z),D(Z) 。
解: 要想利用 χ 2 \chi^2 χ2 分布,必须有标准正态分布,因此可将 X 1 X_1 X1 标准化,即 X 1 / 2 ∼ N ( 0 , 1 ) X_1/\sqrt{2} \sim N(0,1) X1/2∼N(0,1),于是有 X 1 2 / 2 ∼ χ 2 ( 1 ) X_1^2/2 \sim \chi^2(1) X12/2∼χ2(1) 。
X 2 − X 3 ∼ N ( 0 , 4 ) X_2-X_3 \sim N(0,4) X2−X3∼N(0,4) ,故 ( X 2 − X 3 ) / 2 ∼ N ( 0 , 1 ) (X_2-X_3)/2 \sim N(0,1) (X2−X3)/2∼N(0,1) ,从而有 ( X 2 − X 3 ) 2 / 4 ∼ χ 2 ( 1 ) (X_2-X_3)^2/4 \sim \chi^2(1) (X2−X3)2/4∼χ2(1) 。
于是有 E ( Z ) = E ( X 1 2 ) + E [ ( X 2 − X 3 ) 2 ] = 2 E ( X 1 2 / 2 ) + 4 E [ ( X 2 − X 3 ) 2 / 4 ] = 2 + 4 = 6 , D ( Z ) = 4 D ( X 1 2 / 2 ) + 16 D [ ( X 2 − X 3 ) 2 / 4 ] = 8 + 32 = 40. E(Z)=E(X_1^2)+E[(X_2-X_3)^2]=2E(X_1^2/2)+4E[(X_2-X_3)^2/4]=2+4=6,D(Z)=4D(X_1^2/2)+16D[(X_2-X_3)^2/4]=8+32=40. E(Z)=E(X12)+E[(X2−X3)2]=2E(X12/2)+4E[(X2−X3)2/4]=2+4=6,D(Z)=4D(X12/2)+16D[(X2−X3)2/4]=8+32=40.
设 X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X\sim N(0,1),Y\sim \chi^2(n) X∼N(0,1),Y∼χ2(n) ,且 X , Y X,Y X,Y 相互独立,称 X Y n \frac{X}{\sqrt{\frac{Y}{n}}} nYX 服务自由度为 n n n 的 t t t 分布,记为 X / Y / n ∼ t ( n ) X/\sqrt{Y/n} \sim t(n) X/Y/n∼t(n) 。
设 X ∼ t ( n ) X\sim t(n) X∼t(n) ,其概率密度函数为 f ( x ) f(x) f(x) ,对任意的 0 < α < 1 0<\alpha<1 0<α<1 ,若 P { X > t α ( n ) } = α , P\{X>t_\alpha(n)\}=\alpha, P{X>tα(n)}=α, 称 t α ( n ) t_\alpha(n) tα(n) 为 t ( n ) t(n) t(n) 分布的右或上 α \alpha α 分位点。
若有 P { X < t 1 − α ( n ) } = α , P\{X
设 X ∼ χ 2 ( m ) , Y ∼ χ 2 ( n ) X\sim\chi^2(m),Y\sim\chi^2(n) X∼χ2(m),Y∼χ2(n) ,且 X , Y X,Y X,Y 独立,则称 X / m Y / n {X/m}\over{Y/n} Y/nX/m 服从自由度为 m , n m,n m,n 的 F F F 分布,记为 ( X / m ) / ( Y / n ) ∼ F ( m , n ) (X/m)/(Y/n)\sim F(m,n) (X/m)/(Y/n)∼F(m,n) 。
设 X ∼ F ( m , n ) X\sim F(m,n) X∼F(m,n) ,其概率密度函数为 f ( x ) f(x) f(x) ,对任意的 0 < α < 1 0<\alpha<1 0<α<1 ,若 P { X > F α ( m , n ) } = α , P\{X>F_\alpha(m,n)\}=\alpha, P{X>Fα(m,n)}=α, 称 F α ( m , n ) F_\alpha(m,n) Fα(m,n) 为 F ( m , n ) F(m,n) F(m,n) 分布的右或上 α \alpha α 分位点。如下图所示。
若有 P { X < F 1 − α ( m , n ) } = α , P\{X
这三个分布彼此之间都是有一定联系的,同时也都跟标准正态有关,把握住他们的联系,应该就能应付考试了。