F分布概率密度函数的推导

推导过程整理自https://www.bilibili.com/video/BV1qf4y1R7FA。

文章目录

    • 预备知识
      • Γ \Gamma Γ函数(伽马函数)
      • 标准正态分布
      • 卡方分布
    • 推导目标
    • 引理:连续型随机变量商的分布
    • 推导过程
      • 先计算 X = U / n 1 X=U/n_1 X=U/n1 Y = V / n 2 Y=V/n_2 Y=V/n2的概率密度函数
      • 再计算 F = X Y F=\frac{X}{Y} F=YX概率密度函数 p F ( t ) p_{F}(t) pF(t)

预备知识

Γ \Gamma Γ函数(伽马函数)

  • 定义: Γ ( s ) = ∫ 0 + ∞ e − t t s − 1 d t \Gamma(s)=\int_{0}^{+\infty}e^{-t}t^{s-1}\text{d}t Γ(s)=0+etts1dt
  • 递推公式: Γ ( s + 1 ) = s Γ ( s ) ,   ( s > 0 ) \Gamma(s+1)=s\Gamma(s),\space(s>0) Γ(s+1)=sΓ(s), (s>0)
  • 几个重要的值: Γ ( 1 ) = 1 \Gamma(1)=1 Γ(1)=1 Γ ( 1 2 ) = π \Gamma(\frac{1}{2})=\sqrt{\pi} Γ(21)=π

标准正态分布

  • 概率密度函数: φ ( x ) = 1 2 π e − x 2 2 \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} φ(x)=2π 1e2x2
  • 分布函数: ϕ ( x ) = ∫ − ∞ x 1 2 π e − t 2 2 d t \phi(x)=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}\text{d}t ϕ(x)=x2π 1e2t2dt

卡方分布

  • 概率密度函数: p ( x ) = { 1 2 n / 2 Γ ( n / 2 ) e − x 2 x n 2 − 1 , x > 0 0 , x ⩽ 0 p(x)=\left\{\begin{array}{cc} \frac{1}{2^{n/2}\Gamma(n/2)}e^{-\frac{x}{2}}x^{\frac{n}{2}-1}, & x>0 \\ 0, & x\leqslant 0 \end{array}\right. p(x)={2n/2Γ(n/2)1e2xx2n1,0,x>0x0

推导目标

已知 U U U服从卡方分布 χ 2 ( n 1 ) \chi^2(n_1) χ2(n1) V V V服从卡方分布 χ 2 ( n 2 ) \chi^2(n_2) χ2(n2),且 U U U V V V相互独立。

F = U / n 1 V / n 2 F=\frac{U/n_1}{V/n_2} F=V/n2U/n1的概率密度函数。

引理:连续型随机变量商的分布

( X , Y ) (X,Y) (X,Y)为二维随机变量,其联合密度函数为 p ( x , y ) p(x,y) p(x,y),则 Z = X / Y Z=X/Y Z=X/Y的密度函数 p Z ( z ) p_{Z}(z) pZ(z)满足
p Z ( z ) = ∫ − ∞ + ∞ p ( z y , y ) ∣ y ∣ d y   。 p_{Z}(z) = \int_{-\infty}^{+\infty}p(zy, y)|y|\text{d}y \thinspace。 pZ(z)=+p(zy,y)ydy
证明

使用分布函数法,先求 Z Z Z的分布函数,再对分布函数求导得到 p Z ( z ) p_{Z}(z) pZ(z)

z z z的正负性进行讨论,得到积分区域如下图中阴影部分所示。

F分布概率密度函数的推导_第1张图片
F分布概率密度函数的推导_第2张图片

我们发现这两种情况可以合并,积分区域均为 { ( y , x )   ∣   y < 0   ∧   x ⩾ z y } \{(y,x) \space|\space y<0 \space\wedge\space x\geqslant zy\} {(y,x)  y<0  xzy}   ∪   \space\cup\space    { ( y , x )   ∣   y > 0   ∧   x ⩽ z y } \{(y,x) \space|\space y>0 \space\wedge\space x\leqslant zy\} {(y,x)  y>0  xzy}。于是有
F Z ( z )    =    P ( Z < z )    =    P ( X Y < z )    =    ∫ − ∞ 0 d y ∫ y z + ∞ p ( x , y ) d x + ∫ 0 + ∞ d y ∫ − ∞ y z p ( x , y ) d x = x = u y ∫ − ∞ 0 d y ∫ z + ∞ p ( u y , y ) y d u + ∫ 0 + ∞ d y ∫ − ∞ z p ( u y , y ) y d u    =    ∫ z + ∞ d u ∫ − ∞ 0 p ( u y , y ) y d y + ∫ − ∞ z d u ∫ 0 + ∞ p ( u y , y ) y d y   。 \begin{aligned} F_{Z}(z) &\space\space=\space\space P(ZFZ(z)  =  P(Z<z)  =  P(YX<z)  =  0dyyz+p(x,y)dx+0+dyyzp(x,y)dx=x=uy0dyz+p(uy,y)ydu+0+dyzp(uy,y)ydu  =  z+du0p(uy,y)ydy+zdu0+p(uy,y)ydy因此
p Z ( z ) = F Z ′ ( z ) = − ∫ − ∞ 0 p ( z y , y ) y d y + ∫ 0 + ∞ p ( z y , y ) y d y = ∫ − ∞ + ∞ p ( z y , y ) ∣ y ∣ d y   。 \begin{aligned} p_{Z}(z) &= F_{Z}'(z) \\ &= -\int_{-\infty}^{0}p(zy,y)y\text{d}y + \int_{0}^{+\infty}p(zy,y)y\text{d}y \\ &= \int_{-\infty}^{+\infty}p(zy,y)|y|\text{d}y \thinspace。 \end{aligned} pZ(z)=FZ(z)=0p(zy,y)ydy+0+p(zy,y)ydy=+p(zy,y)ydy

推导过程

先计算 X = U / n 1 X=U/n_1 X=U/n1 Y = V / n 2 Y=V/n_2 Y=V/n2的概率密度函数

注意到 X = U / n 1 X=U/n_1 X=U/n1 Y = V / n 2 Y=V/n_2 Y=V/n2具有相似的结构。我们只要计算出 X X X的概率密度函数,就可以用同样的方法得到 Y Y Y的概率密度函数。

设有 n n n个独立同分布的随机变量 Z 1 , Z 2 , ⋯   , Z n Z_1,Z_2,\cdots,Z_n Z1,Z2,,Zn,它们均服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),则 Z = ∑ i = 1 n Z i 2 Z=\sum\limits_{i=1}^{n}Z_i^2 Z=i=1nZi2服从卡方分布 χ 2 ( n ) \chi^2(n) χ2(n)。我们接下来使用分布函数法计算 W = Z / n W=Z/n W=Z/n的概率密度函数 p W ( w ) p_{W}(w) pW(w)

w ⩽ 0 w\leqslant 0 w0时,因为 W = Z / n = ( ∑ i = 1 n Z i 2 ) / n W=Z/n=(\sum\limits_{i=1}^{n}Z_i^2)/n W=Z/n=(i=1nZi2)/n恒为非负,所以 P ( W < w ) = 0 P(WP(W<w)=0,从而 p W ( w ) = 0 p_{W}(w)=0 pW(w)=0。下面针对 w > 0 w>0 w>0的情况进行计算。
F W ( w ) = P ( W < w ) = P ( Z < n w ) = ∫ 0 n w 1 2 n / 2 Γ ( n / 2 ) e − x 2 x n 2 − 1 d x   。 \begin{aligned} F_{W}(w) &= P(WFW(w)=P(W<w)=P(Z<nw)=0nw2n/2Γ(n/2)1e2xx2n1dx求导得
p W ( w ) = F W ′ ( w ) = 1 2 n / 2 Γ ( n / 2 ) e − n w 2 ( n w ) n 2 − 1 ⋅ n = 1 2 n / 2 Γ ( n / 2 ) n n 2 e − n w 2 w n 2 − 1   。 \begin{aligned} p_{W}(w) &= F_{W}'(w) \\ &= \frac{1}{2^{n/2}\Gamma(n/2)}e^{-\frac{nw}{2}}(nw)^{\frac{n}{2}-1}\cdot n \\ &= \frac{1}{2^{n/2}\Gamma(n/2)}n^{\frac{n}{2}} e^{-\frac{nw}{2}}w^{\frac{n}{2}-1} \thinspace。 \end{aligned} pW(w)=FW(w)=2n/2Γ(n/2)1e2nw(nw)2n1n=2n/2Γ(n/2)1n2ne2nww2n1
综上,有
p W ( w ) = { 1 2 n / 2 Γ ( n / 2 ) n n 2 e − n w 2 w n 2 − 1 , w > 0 0 , w ⩽ 0   。 p_{W}(w) = \left\{\begin{array}{cc} \frac{1}{2^{n/2}\Gamma(n/2)}n^{\frac{n}{2}} e^{-\frac{nw}{2}}w^{\frac{n}{2}-1}, & w>0 \\ 0, & w\leqslant 0 \end{array}\right. \thinspace。 pW(w)={2n/2Γ(n/2)1n2ne2nww2n1,0,w>0w0

因此
p X ( x ) = { 1 2 n 1 / 2 Γ ( n 1 / 2 ) n 1 n 1 2 e − n 1 x 2 x n 1 2 − 1 , x > 0 0 , x ⩽ 0   , p_{X}(x) = \left\{\begin{array}{cc} \frac{1}{2^{n_1/2}\Gamma(n_1/2)}n_1^{\frac{n_1}{2}} e^{-\frac{n_1x}{2}}x^{\frac{n_1}{2}-1}, & x>0 \\ 0, & x\leqslant 0 \end{array}\right. \thinspace, pX(x)={2n1/2Γ(n1/2)1n12n1e2n1xx2n11,0,x>0x0

p Y ( y ) = { 1 2 n 2 / 2 Γ ( n 2 / 2 ) n 2 n 2 2 e − n 2 y 2 y n 2 2 − 1 , y > 0 0 , y ⩽ 0   。 p_{Y}(y) = \left\{\begin{array}{cc} \frac{1}{2^{n_2/2}\Gamma(n_2/2)}n_2^{\frac{n_2}{2}} e^{-\frac{n_2y}{2}}y^{\frac{n_2}{2}-1}, & y>0 \\ 0, & y\leqslant 0 \end{array}\right. \thinspace。 pY(y)={2n2/2Γ(n2/2)1n22n2e2n2yy2n21,0,y>0y0

再计算 F = X Y F=\frac{X}{Y} F=YX概率密度函数 p F ( t ) p_{F}(t) pF(t)

t ⩽ 0 t\leqslant 0 t0时,因为 X = U / n 1 X=U/n_1 X=U/n1 Y = V / n 2 Y=V/n_2 Y=V/n2恒为非负,所以 P ( F < t ) = P ( X Y < t ) = 0 P(FP(F<t)=P(YX<t)=0,从而 p F ( t ) = 0 p_{F}(t)=0 pF(t)=0。下面针对 t > 0 t>0 t>0的情况进行计算。

因为 U U U V V V相互独立,所以 X = U / n 1 X=U/n_1 X=U/n1 Y = V / n 2 Y=V/n_2 Y=V/n2也相互独立,于是 ( X , Y ) (X,Y) (X,Y)的联合概率密度函数 p ( x , y ) p(x,y) p(x,y)满足
p ( x , y ) = p X ( x ) p Y ( y )   。 p(x,y) = p_{X}(x)p_{Y}(y) \thinspace。 p(x,y)=pX(x)pY(y)再根据引理,我们有
p F ( t )   =   ∫ − ∞ + ∞ p ( t y , y ) ∣ y ∣ d y   =   ∫ − ∞ + ∞ p X ( t y ) p Y ( y ) ∣ y ∣ d y   =   ∫ 0 + ∞ p X ( t y ) p Y ( y ) y d y   =   ∫ 0 + ∞ 1 2 n 1 / 2 Γ ( n 1 / 2 ) n 1 n 1 2 e − n 1 t y 2 ( t y ) n 1 2 − 1 ⋅ 1 2 n 2 / 2 Γ ( n 2 / 2 ) n 2 n 2 2 e − n 2 y 2 y n 2 2 − 1 ⋅ y d y   =   1 2 ( n 1 + n 2 ) / 2 Γ ( n 1 / 2 ) Γ ( n 2 / 2 ) n 1 n 1 2 n 2 n 2 2 t n 1 2 − 1 ∫ 0 + ∞ e − n 1 t + n 2 2 y y n 1 + n 2 2 − 1 d y = y = 2 z n 1 t + n 2 1 2 ( n 1 + n 2 ) / 2 Γ ( n 1 / 2 ) Γ ( n 2 / 2 ) n 1 n 1 2 n 2 n 2 2 t n 1 2 − 1 ⋅ ( 2 n 1 t + n 2 ) n 1 + n 2 2 ∫ 0 + ∞ e − z z n 1 + n 2 2 − 1 d z   =   Γ [ ( n 1 + n 2 ) / 2 ] Γ ( n 1 / 2 ) Γ ( n 2 / 2 ) n 1 n 1 2 n 2 n 2 2 t n 1 2 − 1 ( n 1 t + n 2 ) − n 1 + n 2 2   =   Γ [ ( n 1 + n 2 ) / 2 ] Γ ( n 1 / 2 ) Γ ( n 2 / 2 ) ( n 1 n 2 ) n 1 2 t n 1 2 − 1 ( 1 + n 1 n 2 t ) − n 1 + n 2 2   。 \begin{aligned} p_{F}(t) &\quad\,=\quad\, \int_{-\infty}^{+\infty}p(ty, y)|y|\text{d}y \\ &\quad\,=\quad\, \int_{-\infty}^{+\infty}p_{X}(ty)p_{Y}(y)|y|\text{d}y \\ &\quad\,=\quad\, \int_{0}^{+\infty}p_{X}(ty)p_{Y}(y)y\text{d}y \\ &\quad\,=\quad\, \int_{0}^{+\infty}\frac{1}{2^{n_1/2}\Gamma(n_1/2)}n_1^{\frac{n_1}{2}} e^{-\frac{n_1ty}{2}}(ty)^{\frac{n_1}{2}-1}\cdot \frac{1}{2^{n_2/2}\Gamma(n_2/2)}n_2^{\frac{n_2}{2}} e^{-\frac{n_2y}{2}}y^{\frac{n_2}{2}-1}\cdot y\text{d}y \\ &\quad\,=\quad\, \frac{1}{2^{(n_1+n_2)/2}\Gamma(n_1/2)\Gamma(n_2/2)}n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}}t^{\frac{n_1}{2}-1} \int_{0}^{+\infty}e^{-\frac{n_1t+n_2}{2}y}y^{\frac{n_1+n_2}{2}-1}\text{d}y \\ &\overset{y=\frac{2z}{n_1t+n_2}}{=} \frac{1}{2^{(n_1+n_2)/2}\Gamma(n_1/2)\Gamma(n_2/2)} n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}} t^{\frac{n_1}{2}-1}\cdot (\frac{2}{n_1t+n_2})^{\frac{n_1+n_2}{2}} \int_{0}^{+\infty}e^{-z}z^{\frac{n_1+n_2}{2}-1}\text{d}z \\ &\quad\,=\quad\, \frac{\Gamma[(n_1+n_2)/2]}{\Gamma(n_1/2)\Gamma(n_2/2)}n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}} t^{\frac{n_1}{2}-1} (n_1t+n_2)^{-\frac{n_1+n_2}{2}} \\ &\quad\,=\quad\, \frac{\Gamma[(n_1+n_2)/2]}{\Gamma(n_1/2)\Gamma(n_2/2)}(\frac{n_1}{n_2})^{\frac{n_1}{2}} t^{\frac{n_1}{2}-1} (1+\frac{n_1}{n_2}t)^{-\frac{n_1+n_2}{2}} \thinspace。 \end{aligned} pF(t)=+p(ty,y)ydy=+pX(ty)pY(y)ydy=0+pX(ty)pY(y)ydy=0+2n1/2Γ(n1/2)1n12n1e2n1ty(ty)2n112n2/2Γ(n2/2)1n22n2e2n2yy2n21ydy=2(n1+n2)/2Γ(n1/2)Γ(n2/2)1n12n1n22n2t2n110+e2n1t+n2yy2n1+n21dy=y=n1t+n22z2(n1+n2)/2Γ(n1/2)Γ(n2/2)1n12n1n22n2t2n11(n1t+n22)2n1+n20+ezz2n1+n21dz=Γ(n1/2)Γ(n2/2)Γ[(n1+n2)/2]n12n1n22n2t2n11(n1t+n2)2n1+n2=Γ(n1/2)Γ(n2/2)Γ[(n1+n2)/2](n2n1)2n1t2n11(1+n2n1t)2n1+n2综上,我们得到
p F ( t ) = { Γ [ ( n 1 + n 2 ) / 2 ] Γ ( n 1 / 2 ) Γ ( n 2 / 2 ) ( n 1 n 2 ) n 1 2 t n 1 2 − 1 ( 1 + n 1 n 2 t ) − n 1 + n 2 2 , t > 0 0 , t ⩽ 0   。 p_{F}(t) = \left\{\begin{array}{cc} \frac{\Gamma[(n_1+n_2)/2]}{\Gamma(n_1/2)\Gamma(n_2/2)}(\frac{n_1}{n_2})^{\frac{n_1}{2}} t^{\frac{n_1}{2}-1} (1+\frac{n_1}{n_2}t)^{-\frac{n_1+n_2}{2}}, & t>0 \\ 0, & t\leqslant 0 \end{array}\right. \thinspace。 pF(t)={Γ(n1/2)Γ(n2/2)Γ[(n1+n2)/2](n2n1)2n1t2n11(1+n2n1t)2n1+n2,0,t>0t0

你可能感兴趣的:(数学笔记,概率论)