AI笔记: 数学基础之连续型与均匀分布、指数分布、正态分布等

连续型随机变量及其概率密度

1 ) 连续型随机变量的概念与性质

  • 如果对于随机变量X的分布函数F(x),存在非函数f(x), 使得对于任意实数x, 有 F ( x ) = ∫ − ∞ x f ( t ) d t F(x) = \int_{-\infty}^x f(t)dt F(x)=xf(t)dt,
  • 则称X为连续型随机变量, 其中函数f(x)称为X的概率密度函数,简称概率密度

2 ) 关于不定积分的补充

  • f(x) 在区间I上的原函数全体称为f(x)在I上的不定积分, 记为: ∫ f ( x ) d x \int f(x) dx f(x)dx, 其中
    • ∫ \int 是积分号
    • f(x) 被积函数
    • x 积分变量
    • f(x)dx 被积表达式
  • F ′ ( x ) = f ( x ) F'(x) = f(x) F(x)=f(x), 则 ∫ f ( x ) d x = F ( x ) + C \int f(x)dx = F(x) + C f(x)dx=F(x)+C (C为任意常数,C称为积分常数,不可丢!)
    • ∫ e x d x = e x + C \int e^x dx = e^x + C exdx=ex+C
    • ∫ x 2 d x = 1 3 x 3 + C \int x^2 dx = \frac{1}{3}x^3 + C x2dx=31x3+C
    • ∫ s i n x d x = − c o s x + C \int sin x dx = -cos x + C sinxdx=cosx+C

不定积分的性质

  • (1)设函数f(x)以及g(x)的原函数存在, 则 ∫ [ f ( x ) ± g ( x ) ] d x = ∫ f ( x ) d x ± ∫ g ( x ) d x \int [f(x) \pm g(x)] dx = \int f(x)dx \pm \int g(x)dx [f(x)±g(x)]dx=f(x)dx±g(x)dx
  • (2)设函数f(x)原函数存在,k为非零常数, 则 ∫ k f ( x ) d x = k ∫ f ( x ) d x     ( k ≠ 0 ) \int kf(x)dx = k \int f(x) dx \ \ \ (k \neq 0) kf(x)dx=kf(x)dx   (k=0)
  • 推论:若 f ( x ) = ∑ i = 1 n k i f i ( x ) f(x) = \sum_{i=1}^n k_i f_i(x) f(x)=i=1nkifi(x), 则 ∫ f ( x ) d x = ∑ i = 1 n k i ∫ f i ( x ) d x \int f(x)dx = \sum_{i=1}^n k_i \int f_i(x)dx f(x)dx=i=1nkifi(x)dx
  • 从不定积分定义可知:
    • d d x [ ∫ f ( x ) d x ] = f ( x ) \frac{d}{dx}[\int f(x)dx] = f(x) dxd[f(x)dx]=f(x) d [ ∫ f ( x ) d x ] = f ( x ) d x d[\int f(x)dx] = f(x)dx d[f(x)dx]=f(x)dx
    • ∫ F ′ ( x ) d x = F ( x ) + C \int F'(x)dx = F(x) + C F(x)dx=F(x)+C ∫ d F ( x ) = F ( x ) + C \int dF(x) = F(x) + C dF(x)=F(x)+C
  • 基本积分表
    • ∫ k d x = k x + C \int kdx = kx + C kdx=kx+C (k为常数)
    • ∫ x μ d x = 1 μ + 1 x μ + 1 + C \int x^\mu dx = \frac{1}{\mu + 1}x^{\mu + 1} + C xμdx=μ+11xμ+1+C ( μ ≠ − 1 \mu \neq -1 μ=1)
    • ∫ d x x = l n ∣ x ∣ + C \int \frac{dx}{x} = ln|x| + C xdx=lnx+C 其中, ( l n ∣ x ∣ ) ′ = 1 x (ln|x|)' = \frac{1}{x} (lnx)=x1
    • ∫ d x 1 + x 2 = a r c t a n x + C \int \frac{dx}{1+x^2} = arctanx + C 1+x2dx=arctanx+C − a r c c o t x + C -arccot x + C arccotx+C
    • ∫ d x 1 − x 2 = a r c s i n x + C \int \frac{dx}{\sqrt{1-x^2}} = arcsin x + C 1x2 dx=arcsinx+C − a r c c o s x + C -arccosx + C arccosx+C
    • ∫ c o s x d x = s i n x + C \int cosxdx = sinx + C cosxdx=sinx+C
    • ∫ s i n x d x = − c o s x + C \int sinxdx = -cosx + C sinxdx=cosx+C
    • ∫ d x c o s 2 x = ∫ s e c 2 x d x = t a n x + C \int \frac{dx}{cos^2x} = \int sec^2xdx = tanx + C cos2xdx=sec2xdx=tanx+C
    • ∫ d x s i n 2 x = ∫ c s c 2 x d x = − c o t x + C \int \frac{dx}{sin^2 x} = \int csc^2 xdx = -cotx + C sin2xdx=csc2xdx=cotx+C
    • ∫ s e c x t a n x d x = s e c x + C \int secxtanxdx = secx + C secxtanxdx=secx+C
    • ∫ c s c x c o t x d x = − c s c x + C \int cscxcotxdx = -cscx + C cscxcotxdx=cscx+C
    • ∫ e x d x = e x + C \int e^xdx = e^x + C exdx=ex+C
    • ∫ a x d x = a x l n a + C \int a^xdx = \frac{a^x}{ln a} + C axdx=lnaax+C
    • ∫ 1 x 2 d x = − 1 x + C \int \frac{1}{x^2}dx = - \frac{1}{x} + C x21dx=x1+C
    • ∫ 1 x d x = 2 x + C \int \frac{1}{\sqrt{x}}dx = 2\sqrt{x} + C x 1dx=2x +C

关于定积分

参考原来的文章章节

牛顿-莱布尼茨公式

  • 定理:设F(x)是连续函数f(x)在[a,b]上的一个原函数,则 ∫ a b f ( x ) d x = F ( b ) − F ( a ) \int_a^b f(x)dx = F(b) - F(a) abf(x)dx=F(b)F(a)

例1

  • ∫ − 2 − 1 1 x d x \int_{-2}^{-1} \frac{1}{x} dx 21x1dx
  • 分析
    • 当 x < 0 时, 1 x \frac{1}{x} x1的一个原函数是 l n ∣ x ∣ ln |x| lnx, ∫ − 2 − 1 1 x d x = [ l n ∣ x ∣ ] − 2 − 1 = l n 1 − l n 2 = − l n 2 \int_{-2}^{-1} \frac{1}{x} dx = [ln |x|]_{-2}^{-1} = ln 1 - ln 2 = -ln 2 21x1dx=[lnx]21=ln1ln2=ln2

例2

  • ∫ 0 π 2 ( 2 c o s x + s i n x − 1 ) d x \int_0^{\frac{\pi}{2}} (2cos x + sin x -1)dx 02π(2cosx+sinx1)dx
  • 分析
    • 原式: = [ 2 s i n x − c o s x − x ] 0 π 0 = 3 − π 2 =[2sinx - cosx - x]_0^{\frac{\pi}{0}} = 3 - \frac{\pi}{2} =[2sinxcosxx]00π=32π
    • 由定义可知,概率密度f(x)具有以下性质:
      • f ( x ) ≥ 0 f(x) \geq 0 f(x)0
      • ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^\infty f(x)dx = 1 f(x)dx=1
      • P { x 1 ≤ X ≤ x 2 } = F ( x 2 ) − F ( x 1 ) = ∫ x 1 x 2 f ( x ) d x . ( x 1 ≤ x 2 ) P\{ x_1 \leq X \leq x_2 \} = F(x_2) - F(x_1) = \int_{x_1}^{x_2} f(x)dx. (x_1 \leq x_2) P{x1Xx2}=F(x2)F(x1)=x1x2f(x)dx.(x1x2)
      • 若f(x)在点x处连续,则有 F ′ ( x ) = f ( x ) .     F ( x ) = ∫ − ∞ x f ( t ) d t F'(x) = f(x). \ \ \ F(x) = \int_{-\infty}^x f(t)dt F(x)=f(x).   F(x)=xf(t)dt
      • 即: f ( x ) = lim ⁡ △ x → 0 + F ( x + △ x ) − F ( x ) △ x = lim ⁡ △ x → 0 + P { x < X ≤ x + △ x } △ x f(x) = \lim_{\triangle x \to 0^+} \frac{F(x + \triangle x) - F(x)}{\triangle x} = \lim_{\triangle x \to 0^+} \frac{P\{ x < X \leq x + \triangle x \}}{\triangle x} f(x)=limx0+xF(x+x)F(x)=limx0+xP{x<Xx+x}
      • 若不计高阶无穷小,则有: P { x < X ≤ x + △ x } ≈ f ( x ) △ x P\{ x < X \leq x + \triangle x \} \approx f(x)\triangle x P{x<Xx+x}f(x)x

备注:图片托管于github,请确保网络的可访问性

注意

  • 连续型随机变量密度函数的性质与离散型随机变量分布律的性质非常相似,但是,密度函数不是概率!
  • 我们不能认为: P { X = a } = f ( a ) P\{X = a\} = f(a) P{X=a}=f(a)
  • 连续型随机变量的一个重要特点
    • 设X是连续型随机变量,则对任意的实数a, 有 P { X = a } = 0 P\{ X = a \} = 0 P{X=a}=0

说明

  • 由上述性质可知,对于连续型随机变量,我们关心它在某一点取值的问题没有太大的意义,我们所关心的是它在某一区间内取值的问题
  • 若已知连续型随机变量X的密度函数为f(x),则X在任意区间G(G可以是开区间,也可以是闭区间,或半开半闭区间,可以是有限区间,也可以是无穷区间)上取值的概率为:
    • P { X ∈ G } = ∫ G f ( x ) d x P\{ X \in G \} = \int_G f(x)dx P{XG}=Gf(x)dx

例3

  • 设X是连续型随机变量,其密度函数为: f ( x ) = { c ( 4 x − 2 x 2 ) 0 < x < 2 0 其他 f(x) =\left \{ \begin{array}{cccc}c(4x-2x^2) & 0 < x < 2 \\0 & \text{其他}\end{array} \right. f(x)={c(4x2x2)00<x<2其他
  • 求:
    • (1) 常数c
    • (2) P { X > 1 } P\{ X > 1 \} P{X>1}
  • 分析
    • (1)由密度函数的性质 ∫ − ∞ + ∞ f ( x ) d x = 1 \int_{-\infty}^{+\infty} f(x)dx = 1 +f(x)dx=1
    • 1 = ∫ − ∞ + ∞ f ( x ) d x = ∫ 0 2 c ( 4 x − 2 x 2 ) d x = c ( 2 x 2 − 2 3 x 3 ) ∣ 0 2 = 8 3 c 1=\int_{-\infty}^{+\infty}f(x)dx = \int_0^2 c(4x - 2x^2)dx = c(2x^2 - \frac{2}{3}x^3)|_0^2 = \frac{8}{3}c 1=+f(x)dx=02c(4x2x2)dx=c(2x232x3)02=38c
    • 所以 c = 3 8 c=\frac{3}{8} c=83
    • (2) P { X ∈ G } = ∫ G f ( x ) d x P\{ X \in G \} = \int_G f(x)dx P{XG}=Gf(x)dx
    • P { X > 1 } = ∫ 1 + ∞ f ( x ) d x = ∫ 1 2 3 8 ( 4 x − 2 x 2 ) d x = 3 8 ( 2 x 2 − 2 3 x 3 ) ∣ 1 2 = 1 2 P\{X > 1\} = \int_1^{+\infty} f(x)dx = \int_1^2 \frac{3}{8}(4x - 2x^2)dx = \frac{3}{8}(2x^2 - \frac{2}{3}x^3)|_1^2 = \frac{1}{2} P{X>1}=1+f(x)dx=1283(4x2x2)dx=83(2x232x3)12=21

一些常见的连续型随机变量

1 ) 均匀分布

  • 若随机变量X的密度函数为 f ( x ) = { 1 b − a a ≤ x ≤ b 0 其他 f(x) = \left \{ \begin{array}{cccc} \frac{1}{b-a} & a \leq x \leq b \\ 0 & \text{其他} \end{array} \right. f(x)={ba10axb其他 则称随机变量X服从区间[a,b]上的均匀分布,记为: X ∼ U [ a , b ] X \sim U[a, b] XU[a,b]

均匀分布的概率背景

  • 若随机变量X服从区间[a,b]上的均匀分布,则随机变量X在区间[a,b]上的任意一个子区间上取值的概率与该子区间的长度成正比, 而与该子区间的位置无关
  • 这时,可以认为随机变量X在区间[a,b]上取值是等可能的. P { c < X ≤ c + l } = ∫ c c + l f ( x ) d x = ∫ c c + l 1 b − a d x = l b − a P\{ c < X \leq c + l \} = \int_c^{c+l} f(x)dx = \int_c^{c+l} \frac{1}{b-a} dx = \frac{l}{b - a} P{c<Xc+l}=cc+lf(x)dx=cc+lba1dx=bal
AI笔记: 数学基础之连续型与均匀分布、指数分布、正态分布等_第1张图片
备注:图片托管于github,请确保网络的可访问性

均匀分布的分布函数

  • 若随机变量X服从区间[a,b]上的均匀分布, 则X的分布函数为: F ( x ) = { 0 x < a x − a b − a a ≤ x ≤ b 1 b < x F(x) =\left \{ \begin{array}{cccc}0 & x < a \\\frac{x-a}{b - a} & a \leq x \leq b \\1 & b < x\end{array} \right. F(x)=0baxa1x<aaxbb<x

备注:图片托管于github,请确保网络的可访问性

例1

  • 设公交汽车站从上午7时起每隔15分钟来一班车,如果某乘客到达此站的时间是7:00~7:30之间的均匀随机变量.试求该乘客候车时间不超过5分钟的概率
  • 分析
    • 设该乘客7时X分到达此站, 则X服从区间[0,30]上的均匀分布. 其密度函数为:
    • f ( x ) = { 1 30 0 ≤ x ≤ 30 0 其它 f(x) =\left \{\begin{array}{cccc}\frac{1}{30} & 0 \leq x \leq 30 \\0 & \text{其它}\end{array} \right. f(x)={30100x30其它
    • 令:B={候车时间不超过5分钟},则
    • P ( B ) = P { 10 ≤ X ≤ 15 } + P { 25 ≤ X ≤ 30 } P(B) = P\{ 10 \leq X \leq 15 \} + P\{ 25 \leq X \leq 30 \} P(B)=P{10X15}+P{25X30}
    • = ∫ 10 15 1 30 d x + ∫ 25 30 1 30 d x = 1 3 = \int_{10}^{15} \frac{1}{30}dx + \int_{25}^{30} \frac{1}{30} dx = \frac{1}{3} =1015301dx+2530301dx=31

2 ) 指数分布

  • 如果随机变量X的密度函数为: f ( x ) = { λ e − λ x x > 0 0 x ≤ 0 f(x) =\left \{\begin{array}{cccc}\lambda e^{-\lambda x} & x > 0 \\0 & x \leq 0\end{array} \right. f(x)={λeλx0x>0x0
  • 其中 λ > 0 \lambda > 0 λ>0为常数, 则称随机变量服从参数为 λ \lambda λ的指数分布.

指数分布的分布函数

  • 若随机变量X服从参数 λ \lambda λ指数分布,则X的分布函数为: F ( x ) = { 0 x ≤ 0 1 − e − λ x x > 0 F(x) = \left \{ \begin{array}{cccc} 0 & x \leq 0 \\ 1 - e^{-\lambda x} & x > 0 \end{array} \right. F(x)={01eλxx0x>0

例1

  • 设打一次电话所用时间X(单位:分钟) 是以 λ = 1 10 \lambda = \frac{1}{10} λ=101为参数的指数随机变量.如果某人刚好在你前面走进公用电话间, 求你需等待10分钟到20分钟之间的概率
  • 分析
    • X的密度函数为: f ( x ) = { 1 10 e − x 10 x > 0 0 x ≤ 0 f(x) = \left \{ \begin{array}{cccc}\frac{1}{10} e^{-\frac{x}{10}} & x > 0 \\0 & x \leq 0\end{array} \right. f(x)={101e10x0x>0x0
    • 令:B={等待时间为10~20分钟}
    • P ( B ) = P { 10 ≤ X ≤ 20 } P(B) = P\{ 10 \leq X \leq 20 \} P(B)=P{10X20}
    • = ∫ 10 20 1 10 e − x 10 d x = \int_{10}^{20} \frac{1}{10} e^{-\frac{x}{10}} dx =1020101e10xdx
    • = − e − x 10 ∣ 10 20 = -e^{-\frac{x}{10}}|_{10}^{20} =e10x1020
    • = e − 1 − e − 2 = 0.2325 =e^{-1} - e^{-2} = 0.2325 =e1e2=0.2325

3 ) 正态分布

  • 如果连续型随机变量X的密度函数为: f ( x ) = 1 2 π σ e − ( x − u ) 2 2 σ 2     ( − ∞ < x < − ∞ ) f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-u)^2}{2\sigma^2}} \ \ \ (-\infty < x < -\infty) f(x)=2π σ1e2σ2(xu)2   (<x<) , 其中 − ∞ < μ < + ∞ , σ > 0 -\infty < \mu < +\infty, \sigma > 0 <μ<+,σ>0 为参数,则称随机变量X服从参数为: ( μ , σ 2 ) (\mu, \sigma^2) (μ,σ2)的正态分布. 记为: X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) XN(μ,σ2)
AI笔记: 数学基础之连续型与均匀分布、指数分布、正态分布等_第2张图片
备注:图片托管于github,请确保网络的可访问性

标准正态分布

  • μ = 0 , σ = 1 \mu = 0, \sigma = 1 μ=0,σ=1, 我们称N(0,1)为标准正态分布. 标准正态分布的密度函数为: φ ( x ) = 1 2 π e − x 2 2     ( − ∞ < x < + ∞ ) \varphi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \ \ \ (-\infty < x < + \infty) φ(x)=2π 1e2x2   (<x<+)

整条分布密度函数的图形性质

  • 对于正态分布的密度函数, f ( x ) = 1 2 π σ e ( x − u ) 2 2 σ 2     ( − ∞ < x < + ∞ ) f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{\frac{(x-u)^2}{2\sigma^2}} \ \ \ (-\infty < x < + \infty) f(x)=2π σ1e2σ2(xu)2   (<x<+)
  • 该曲线关于直线 x = μ x = \mu x=μ 对称, 这表明:对于任意的h>0, 有 P { u − h < X ≤ μ } = P { μ < X ≤ μ + h } P\{ u-h < X \leq \mu \} = P\{ \mu < X \leq \mu + h \} P{uh<Xμ}=P{μ<Xμ+h}

备注:图片托管于github,请确保网络的可访问性

  • x = μ x=\mu x=μ时,f(x)取到最大值 f ( μ ) = 1 2 π σ f(\mu) = \frac{1}{\sqrt{2\pi} \sigma} f(μ)=2π σ1, x离 μ \mu μ越远, f(x)的值越小. 这表明, 对于同样长度区间, 当区间离 μ \mu μ越远时,随机变量X落在该区间中的概率就越小.

备注:图片托管于github,请确保网络的可访问性

  • 曲线y=f(x)在 x = μ ± σ x = \mu \pm \sigma x=μ±σ处有拐点,曲线y=f(x)以Ox轴为渐近线.
  • σ \sigma σ固定, 而改变 μ \mu μ的值, 则f(x)的图形沿x轴平行移动,但不改变其形状,因此y=f(x)图形的位置完全由参数 μ \mu μ所确定

备注:图片托管于github,请确保网络的可访问性

  • μ \mu μ固定,而改变 σ \sigma σ的值,由于f(x)的最大值为: f ( μ ) = 1 2 π σ f(\mu) = \frac{1}{\sqrt{2\pi} \sigma} f(μ)=2π σ1, 可知,当 σ \sigma σ越小时,y=f(x)图形越陡, 因而X落在 μ \mu μ附近的概率越大,反之,当 σ \sigma σ越大时,y=f(x)的图形越平坦,这表明X的取值越分散.

备注:图片托管于github,请确保网络的可访问性

正态分布的重要性

  • 正态分布是概率论中最重要的分布,这可以由一下情形加以说明
    • 正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都服从或近似服从正态分布,可以证明,如果一个随机指标收到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布.可以证明,如果一个随机指标受诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布
    • 正态分布有许多良好的性质,这些性质是其他许多分布所不具备的
    • 正态分布可以作为许多分布的近似分布

标准正态分布的计算

  • 如果随机变量 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1), 则其密度函数为: φ ( x ) = 1 2 π e − x 2 2     ( − ∞ , + ∞ ) \varphi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \ \ \ (-\infty, +\infty) φ(x)=2π 1e2x2   (,+)
  • 其分布函数为: Φ ( x ) = ∫ − ∞ x φ ( t ) d t = 1 2 π ∫ − ∞ x e − t 2 2 d t ( − ∞ < x < + ∞ ) \Phi(x) = \int_{-\infty}^x \varphi(t)dt = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x e^{-\frac{t^2}{2}}dt (-\infty < x < +\infty) Φ(x)=xφ(t)dt=2π 1xe2t2dt(<x<+)
  • 查阅相关标准正态分布表, 可得 Φ ( x ) \Phi(x) Φ(x)
  • 对于 x ≥ 0 x \geq 0 x0,我们可直接查表求出 Φ ( x ) = P { X ≤ x } \Phi(x) = P\{ X \leq x \} Φ(x)=P{Xx}, 如果 x < 0, 我们可由公式 Φ ( − x ) = ∫ − ∞ − x φ ( t ) d t = 1 2 π ∫ − ∞ − x e − t 2 2 d t \Phi(-x) = \int_{-\infty}^{-x} \varphi(t)dt = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{-x} e^{-\frac{t^2}{2}}dt Φ(x)=xφ(t)dt=2π 1xe2t2dt 作变换t=-u, dt=-du, 得 Φ ( − x ) = − 1 2 π ∫ + ∞ x e − u 2 2 d u = 1 2 π ∫ x + ∞ e − u 2 2 d u = 1 − 1 2 π ∫ − ∞ x e − u 2 2 d u = 1 − Φ ( x ) \Phi(-x) = -\frac{1}{\sqrt{2\pi}} \int_{+\infty}^x e^{-\frac{u^2}{2}} du = \frac{1}{\sqrt{2\pi}} \int_x^{+\infty} e^{-\frac{u^2}{2}} du = 1 - \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x e^{-\frac{u^2}{2}}du = 1 - \Phi(x) Φ(x)=2π 1+xe2u2du=2π 1x+e2u2du=12π 1xe2u2du=1Φ(x)

备注:图片托管于github,请确保网络的可访问性

一般正态分布的计算

  • X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) XN(μ,σ2),则 Y = X − μ σ ∼ N ( 0 , 1 ) Y = \frac{X - \mu}{\sigma} \sim N(0,1) Y=σXμN(0,1), F Y ( y ) = P { Y ≤ y } = P { X − μ σ ≤ y } = P { X ≤ μ + σ y } = 1 2 π σ ∫ − ∞ μ + σ y e − ( t − μ ) 2 2 σ 2 d t F_Y(y) = P\{ Y \leq y \} = P\{ \frac{X - \mu}{\sigma} \leq y \} = P\{ X \leq \mu + \sigma y \} = \frac{1}{\sqrt{2\pi} \sigma} \int_{-\infty}^{\mu + \sigma y} e^{-\frac{(t - \mu)^2}{2\sigma^2}}dt FY(y)=P{Yy}=P{σXμy}=P{Xμ+σy}=2π σ1μ+σye2σ2(tμ)2dt
  • 作变换 u = t − μ σ u = \frac{t - \mu}{\sigma} u=σtμ, 则 d u = d t σ du = \frac{dt}{\sigma} du=σdt, 代入上式,得 F Y ( y ) = 1 2 π ∫ − ∞ y e − u 2 2 d u = Φ ( y ) F_Y(y) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^y e^{-\frac{u^2}{2}} du = \Phi(y) FY(y)=2π 1ye2u2du=Φ(y)
  • 所以, F X ( x ) = P { X ≤ x } = P { X − μ σ ≤ x − μ σ } = Φ ( x − μ σ ) F_X(x) = P\{ X \leq x \} = P\{ \frac{X - \mu}{\sigma} \leq \frac{x - \mu}{\sigma} \} = \Phi(\frac{x - \mu}{\sigma}) FX(x)=P{Xx}=P{σXμσxμ}=Φ(σxμ)
  • 其中, Φ ( x ) \Phi(x) Φ(x)是标准正态分布的
  • 所以, F X ( x ) = Φ ( x − μ σ F_X(x) = \Phi(\frac{x - \mu}{\sigma} FX(x)=Φ(σxμ
  • 故对任意的a < b, 有 P { a < X < b } = Φ ( b − μ σ ) − Φ ( a − μ σ ) P\{ a < X < b \} = \Phi(\frac{b-\mu}{\sigma}) - \Phi(\frac{a-\mu}{\sigma}) P{a<X<b}=Φ(σbμ)Φ(σaμ)

例1

  • 设随机变量 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1), 试求:
    • (1) P { 1 ≤ X < 2 } P\{ 1 \leq X < 2 \} P{1X<2}
    • (2) P { − 1 < X < 2 } P\{ -1 < X < 2 \} P{1<X<2}
  • 分析
    • (1) P { 1 ≤ X < 2 } = Φ ( 2 ) − Φ ( 1 ) = 0.97725 − 0.84134 = 0.13591 P\{ 1 \leq X < 2 \} = \Phi(2) - \Phi(1) = 0.97725 - 0.84134 = 0.13591 P{1X<2}=Φ(2)Φ(1)=0.977250.84134=0.13591
    • (2) P { − 1 ≤ X < 2 } = Φ ( 2 ) − Φ ( − 1 ) = Φ ( 2 ) − [ 1 − Φ ( 1 ) ] = 0.97725 − 1 + 0.84134 = 0.81859 P\{ -1 \leq X < 2 \} = \Phi(2) - \Phi(-1) = \Phi(2) - [1 - \Phi(1)] = 0.97725 -1 + 0.84134 = 0.81859 P{1X<2}=Φ(2)Φ(1)=Φ(2)[1Φ(1)]=0.977251+0.84134=0.81859

4 ) Γ − \Gamma - Γ 分布

  • 如果连续型随机变量X的密度函数为: f ( x ) = { λ r Γ ( r ) x r − 1 e − λ x x > 0 0 x ≤ 0 f(x) = \left \{ \begin{array}{cccc}\frac{\lambda^r}{\Gamma(r)} x^{r-1}e^{-\lambda x} & x > 0 \\0 & x \leq 0\end{array} \right. f(x)={Γ(r)λrxr1eλx0x>0x0 其中 r > 0 , λ > 0 r > 0, \lambda > 0 r>0,λ>0 为参数
  • 则称随机变量X服从参数为 r , λ r, \lambda r,λ Γ − \Gamma - Γ分布, 记为: X ∼ Γ ( r , λ ) X \sim \Gamma(r, \lambda) XΓ(r,λ)

Γ − \Gamma - Γ函数

  • Γ − \Gamma - Γ函数的定义: Γ ( r ) = ∫ 0 + ∞ x r − 1 e − x d x \Gamma(r) = \int_0^{+\infty} x^{r-1} e^{-x}dx Γ(r)=0+xr1exdx
  • Γ − \Gamma - Γ函数的定义域: ( 0 , + ∞ ) (0, +\infty) (0,+)
  • Γ − \Gamma - Γ函数的性质:
    • Γ ( r + 1 ) = r Γ ( r ) \Gamma(r+1) = r\Gamma(r) Γ(r+1)=rΓ(r)
    • Γ ( 1 ) = 1 \Gamma(1) = 1 Γ(1)=1
    • Γ ( 1 2 ) = π \Gamma(\frac{1}{2}) = \sqrt{\pi} Γ(21)=π
    • 如果n是自然数,则 Γ ( n ) = ( n − 1 ) ! \Gamma(n) = (n-1)! Γ(n)=(n1)!
  • 说明
    • 如果r=1,则由 Γ ( 1 ) = 1 \Gamma(1) = 1 Γ(1)=1, 得 f ( x ) = { λ e − λ x x > 0 0 x ≤ 0 f(x) =\left \{ \begin{array}{cccc} \lambda e^{-\lambda x} & x > 0 \\ 0 & x \leq 0 \end{array} \right. f(x)={λeλx0x>0x0
    • 这正是参数为 λ \lambda λ的指数分布
    • 这说明指数分布是 Γ − \Gamma - Γ分布的一个特例
    • 如果r = n, 由 Γ ( n ) = ( n − 1 ) ! \Gamma(n) = (n-1)! Γ(n)=(n1)!, 得
    • f ( x ) = { λ n ( n − 1 ) ! x n − 1 e − λ x x > 0 0 x ≤ 0 f(x) = \left \{ \begin{array}{cccc}\frac{\lambda^n}{(n-1)!} x^{n-1} e^{-\lambda x} & x > 0 \\0 & x \leq 0\end{array} \right. f(x)={(n1)!λnxn1eλx0x>0x0
    • 我们称此分布为Erlang分布,它是排队论中重要的分布之一
    • 如果 r = n 2 , λ = 1 2 r = \frac{n}{2}, \lambda = \frac{1}{2} r=2n,λ=21, 其中n为自然数,则有 f ( x ) = { 1 2 n 2 Γ ( n 2 ) x n 2 − 1 e − x 2 x > 0 0 x ≤ 0 f(x) = \left \{ \begin{array}{cccc} \frac{1}{2^{\frac{n}{2}} \Gamma(\frac{n}{2})} x^{\frac{n}{2} - 1} e^{-\frac{x}{2}} & x > 0 \\ 0 & x \leq 0 \end{array} \right. f(x)={22nΓ(2n)1x2n1e2x0x>0x0 我们称此分布为自由度为n的 χ 2 − \chi^2 - χ2分布,记为: χ ( n ) \chi^(n) χ(n). 它是数理统计学中重要的分布之一.

你可能感兴趣的:(AI,Mathematics,AI,数学,连续型,分布)