PT_常见的连续型分布/均匀分布/指数分布/柯西分布/正态分布

文章目录

  • 常见的连续型分布/均匀分布/指数分布/柯西分布/正态分布
    • 均匀分布
      • 性质
    • 指数分布
      • 无记忆性
    • 柯西分布
    • 正态分布
      • 标准正态分布
        • 3 σ 原则 3\sigma原则 3σ原则
        • 一般正态分布标准化

常见的连续型分布/均匀分布/指数分布/柯西分布/正态分布

  • 从概率密度函数很分布函数的角度描述
    • 这一点和离散型随机变量的分布用分布律描述有所区别

均匀分布

性质

  • 等可能性:
    • 对于任意一个区间 [ c , c + l ] ⊂ [ a , b ] [c,c+l]\sub [a,b] [c,c+l][a,b]
      • P ( c ⩽ X ⩽ c + l ) = ∫ c c + l f ( x ) d x = 1 b − a ( x − a ) ∣ c c + l = l b − a P(c\leqslant X\leqslant c+l)=\int_{c}^{c+l}f(x)dx=\frac{1}{b-a}{(x-a)}|_{c}^{c+l}=\frac{l}{b-a} P(cXc+l)=cc+lf(x)dx=ba1(xa)cc+l=bal
      • 发现,这是一个和区间长度有关,而与区间的起点和终点无关(只要区间位是[a,b]的子区间)

  • 已知X服从[0,5]上的均匀分布

    • 即 X ∼ U ( 0 , 5 ) 即X\sim U(0,5) XU(0,5)

      • 如果待求区间概率有落在[0,5]之外的部分,那么这些区间的概率为0
      • 实际计算中,只要把被求区间和[0,5]取交,非空的部分分别相加,其余按0计
    • 计算 P ( X ⩽ − 1 ∪ X ⩾ 2 ) = P ( X ⩽ − 1 ) + P ( X ⩾ 2 ) 计算P(X\leqslant -1 \cup X\geqslant 2)=P(X\leqslant -1)+P(X\geqslant 2) 计算P(X1X2)=P(X1)+P(X2)

      • 其中 , 和 [ 0 , 5 ] 的交集非空的部分是 [ 2 , 5 ] 其中,和[0,5]的交集非空的部分是[2,5] 其中,[0,5]的交集非空的部分是[2,5]

      • P ( X ⩽ − 1 ∪ X ⩾ 2 ) = P ( 2 ⩽ X ⩽ 5 ) = 1 5 − 0 ( ( 5 − 0 ) − ( 2 − 0 ) ) = 3 5 P(X\leqslant -1 \cup X\geqslant 2) =P(2\leqslant X\leqslant 5) \\=\frac{1}{5-0}((5-0)-(2-0)) =\frac{3}{5} P(X1X2)=P(2X5)=501((50)(20))=53

指数分布

  • f ( x ) = { λ e − λ x , x ⩾ 0 0 , x < 0 f(x)= \begin{cases} \lambda e^{-\lambda x},&x\geqslant0 \\0, & x<0 \end{cases} f(x)={λeλx,0,x0x<0

    • ∫ 0 x λ e − λ x d x = λ ∫ 0 x ( e − λ ) x d x = λ e − λ x ( ln ⁡ e − λ ) − 1 ∣ 0 x = λ e − λ x 1 − λ ∣ 0 x = − e − λ x ∣ 0 x = − ( e − λ x − 1 ) = 1 − e − λ x \int_{0}^{x}\lambda e^{-\lambda x}dx =\lambda \int_{0}^{x}(e^{-\lambda})^{x}dx =\lambda e^{-\lambda x}(\ln e^{-\lambda })^{-1}|_{0}^{x} \\=\lambda e^{-\lambda x}\frac{1}{-\lambda}|_{0}^{x} = -e^{-\lambda x}|_{0}^{x} =-(e^{-\lambda x}-1) =1-e^{-\lambda x} 0xλeλxdx=λ0x(eλ)xdx=λeλx(lneλ)10x=λeλxλ10x=eλx0x=(eλx1)=1eλx

    F ( x ) = { 1 − e − λ x , x ⩾ 0 0 , x < 0 F(x)= \begin{cases} 1-e^{-\lambda x},&x\geqslant 0 \\0,&x<0 \end{cases} F(x)={1eλx,0,x0x<0

  • X服从参数为 λ \lambda λ的指数分布

    • 记为 X ∼ E ( λ ) 记为 X\sim E(\lambda) 记为XE(λ)

无记忆性

  • 和离散型分布中的几何分布类似的性质,即无记忆性

    • 指数分布是连续型分布中唯一具有无记忆性特点
  • 推导:

    • 如果 X ∼ E ( λ ) X\sim E(\lambda) XE(λ)

    • 对于任意 t > 0 , s > 0 t>0,s>0 t>0,s>0

      • {   X > t + s   } ⊂ {   X > s   } , 所以 P ( X > t + s ∣ X > s ) = P ( {   X > t + s   } ∪ {   X > s   } ) P ( X > s ) = P ( X > s + t ) P ( X > s ) = 1 − P ( X ⩽ s + t ) 1 − P ( X ⩽ s ) = F ( x ) = P ( X ⩽ x ) = 1 − ( 1 − e − λ ( s + t ) ) 1 − ( 1 − e − λ s ) = e − λ ( s + t ) e − λ s = e − λ t \set{X>t+s}\sub\set{X>s},所以 \\ P(X>t+s|X>s)= \frac{P(\set{X>t+s}\cup \set{X>s})}{P(X>s)} =\frac{P(X>s+t)}{P(X>s)} \\=\frac{1-P(X\leqslant s+t)}{1-P(X\leqslant s)} \\\xlongequal{F(x)=P(X\leqslant x)} =\frac{1-(1-e^{-\lambda (s+t)})}{1-(1-e^{-\lambda s})} =\frac{e^{-\lambda (s+t)}}{e^{-\lambda s}} =e^{-\lambda t} {X>t+s}{X>s},所以P(X>t+sX>s)=P(X>s)P({X>t+s}{X>s})=P(X>s)P(X>s+t)=1P(Xs)1P(Xs+t)F(x)=P(Xx) =1(1eλs)1(1eλ(s+t))=eλseλ(s+t)=eλt

      • 如果某个元件的使用寿命服X服从指数分布:

        • 那么该元件已经工作s小时的条件下,还能够再继续工作(剩余)t个小时的概率于s无关
        • 但是实际情况元件的剩余寿命往往是和已工作的s小时是有关系的

  • N ( t ) ∼ P ( λ t ) N(t)\sim P(\lambda t) N(t)P(λt)

    • t 表示时间段长度 t表示时间段长度 t表示时间段长度
    • N ( t ) 表示长度为 t 时间段内发生故障的次数 , 它满足 P o s s i o n 分布 P ( λ t ) N(t)表示长度为t时间段内发生故障的次数,它满足Possion分布P(\lambda t) N(t)表示长度为t时间段内发生故障的次数,它满足Possion分布P(λt)
      • P ( N ( t ) = k ) = ( λ t ) k e − ( λ t ) k ! P(N(t)=k)=\frac{(\lambda t)^ke^{-(\lambda t)}}{k!} P(N(t)=k)=k!(λt)ke(λt)
        • k = 0 时 , P ( N ( t ) = 0 ) = e − ( λ t ) k=0时,P(N(t)=0)=e^{-(\lambda t)} k=0,P(N(t)=0)=e(λt)
    • T 表示相继 2 次故障之间的时间间隔 T表示相继2次故障之间的时间间隔 T表示相继2次故障之间的时间间隔
  • 分析:

    • 时间段 t 内出现的故障次数 N ( t ) 如果是 0 次 , 那么可以说明 , 故障间隔 T 一定超过 t ( T > t ) 时间段t内出现的故障次数N(t)如果是0次,那么可以说明,故障间隔T一定超过t(T>t) 时间段t内出现的故障次数N(t)如果是0,那么可以说明,故障间隔T一定超过t(T>t)
  • 讨论:

    • 求:随机变量T的分布函数F

      • 本例中使用分布函数的定义 : F ( x ) = P ( X ⩽ x ) 本例中使用分布函数的定义:F(x)=P(X\leqslant x) 本例中使用分布函数的定义:F(x)=P(Xx)的方式来求
      • 本例中 , 分布函数 F 的自变量为时间段长度 t 本例中,分布函数F的自变量为时间段长度t 本例中,分布函数F的自变量为时间段长度t
      • 时间轴 t 轴就相当于 x 轴 时间轴t轴就相当于x轴 时间轴t轴就相当于x
      • 随机变量T的取值落在t轴的哪个地方
    • 一般的,分布函数的定义域为( − ∞ , + ∞ -\infin,+\infin ,+)

      • 即使我们知道随机变量T只可能落在>0的正区间上,也需要分别讨论一下
    • 考虑 t ⩽ 0 考虑t\leqslant0 考虑t0:

      • 由于 t 时间长度 ( ⩾ 0 ) , 所以 t ⩽ 0 的区间内 , 由于t时间长度(\geqslant0),所以t\leqslant0的区间内, 由于t时间长度(0),所以t0的区间内,
        • 事件 {   T ⩽ t   } 是不可能发生的 事件\set{T\leqslant t}是不可能发生的 事件{Tt}是不可能发生的
      • F ( t ) = P ( T ⩽ t ) = 0 F(t)=P(T\leqslant t)=0 F(t)=P(Tt)=0
    • t ⩾ 0 t\geqslant 0 t0

      • F ( t ) = P ( T ⩽ t ) = 1 − P ( T > t ) = 1 − P ( N ( t ) = 0 ) = 1 − e − λ t F(t)=P(T\leqslant t)=1-P(T>t)=1-P(N(t)=0)=1-e^{-\lambda t} F(t)=P(Tt)=1P(T>t)=1P(N(t)=0)=1eλt

      • F ( t ) ⩽ { 1 − e − λ t , t ⩾ 0 0 , t < 0 F(t)\leqslant \begin{cases} 1-e^{-\lambda t},&t\geqslant 0 \\0, &t<0 \end{cases} F(t){1eλt,0,t0t<0

柯西分布

  • f ( x ) = 1 π ( 1 + x 2 ) ( − ∞ < x < + ∞ ) F ( x ) = 1 π arctan ⁡ x + 1 2 f(x)=\frac{1}{\pi(1+x^2)}(-\infinf(x)=π(1+x2)1(<x<+)F(x)=π1arctanx+21

  • 用的较少

正态分布

  • f ( x ) = 1 2 π ⋅ σ e − ( x − u ) 2 2 σ ( − ∞ < x < + ∞ ) f(x)=\frac{1}{\sqrt{2\pi}\cdot\sigma}e^{-\frac{(x-u)^2}{2\sigma}} \\(-\infinf(x)=2π σ1e2σ(xu)2(<x<+)

    • f ( x ) 关于 x = u 对称 f(x)关于x=u对称 f(x)关于x=u对称
      • f ( x ) 在 x = u 处有最大值 f ( u ) = ( 2 π σ ) − 1 f(x)在x=u处有最大值f(u)=(\sqrt{2\pi}\sigma)^{-1} f(x)x=u处有最大值f(u)=(2π σ)1
      • 从密度函数的形式上也可以看出来 f ( x ) f(x) f(x)关于x=u对称
        • f ( x ) = f ( 2 u − x ) 总是成立的 , 因此 f ( x ) 关于 x = u 对称 f(x)=f(2u-x)总是成立的,因此f(x)关于x=u对称 f(x)=f(2ux)总是成立的,因此f(x)关于x=u对称
          • N o t e : x 1 + x 2 = 2 u ; f ( x 1 ) = f ( x 2 ) Note:x_1+x_2=2u;f(x_1)=f(x_2) Note:x1+x2=2u;f(x1)=f(x2)
    • f ( x ) 在 x = u ± σ 处有拐点 f(x)在x=u\pm \sigma处有拐点 f(x)x=u±σ处有拐点
      • Note:曲线图形的函数在拐点有二阶导数,则二阶导数在拐点处异号(由正变负或由负变正)或不存在
    • x → ∞ 时 , 以 x 轴为渐近线 x\to\infin时,以x轴为渐近线 x,x轴为渐近线
    • 如果固定 σ \sigma σ不变
      • 改变u,则图形沿着x轴平行移动
      • 形状不变
      • u是正态分布密度函数的位置参数,位置是有u决定的
    • 如果固定u不变,
      • 改变 σ , 当 σ 变小的时候 , 图形越尖 改变\sigma,当\sigma变小的时候,图形越尖 改变σ,σ变小的时候,图形越尖
      • 否则越扁平
        • 因为最大值 f ( u ) = ( 2 π σ ) − 1 因为最大值f(u)=(\sqrt{2\pi}\sigma)^{-1} 因为最大值f(u)=(2π σ)1
      • σ 正态分布密度函数的 \sigma 正态分布密度函数的 σ正态分布密度函数的尺度参数

    这个密度函数 ( 钟型曲线 ) 不易直接积分 , 直接用积分表达式代替 F ( x ) = 1 2 π σ ∫ − ∞ x e − ( t − u ) 2 2 σ 2 d t \\这个密度函数(钟型曲线)不易直接积分,直接用积分表达式代替 \\ F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infin}^{x}{e^{-\frac{(t-u)^2}{2\sigma^2}}}dt 这个密度函数(钟型曲线)不易直接积分,直接用积分表达式代替F(x)=2π σ1xe2σ2(tu)2dt

标准正态分布

  • 当 μ = 0 , σ = 1 时 , 当\mu=0,\sigma=1时, μ=0,σ=1,的正态分布为标准正态分布

  • 这时候,密度函数和分布函数可以具体为

    • f ( x ) = 1 2 π ⋅ σ e − ( x − μ ) 2 2 σ 取标准型参数 u = 0 , σ = 1 ϕ ( x ) = 1 2 π e − x 2 2 Φ ( x ) = 1 2 π σ ∫ − ∞ x e − ( t ) 2 2 d t f(x)=\frac{1}{\sqrt{2\pi}\cdot\sigma}e^{-\frac{(x-\mu)^2}{2\sigma}} \\取标准型参数u=0,\sigma=1 \\ \phi(x)=\frac{1}{\sqrt{2\pi}}{e^\frac{-x^2}{2}} \\\Phi(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infin}^{x}{e^{-\frac{(t)^2}{2}}}dt f(x)=2π σ1e2σ(xμ)2取标准型参数u=0,σ=1ϕ(x)=2π 1e2x2Φ(x)=2π σ1xe2(t)2dt

3 σ 原则 3\sigma原则 3σ原则

  • 对于标准正态分布 μ ∼ N ( 0 , 1 ) \mu\sim N(0,1) μN(0,1)

    • Φ ( − μ ) = 1 − Φ ( μ ) \Phi(-\mu)=1-\Phi(\mu) Φ(μ)=1Φ(μ)

      • 或者 Φ ( μ ) = 1 − Φ ( − μ ) \Phi(\mu)=1-\Phi(-\mu) Φ(μ)=1Φ(μ)
        • Φ ( μ ) + Φ ( − μ ) = 1 \Phi(\mu)+\Phi(-\mu)=1 Φ(μ)+Φ(μ)=1
      • P ( μ > μ ) = 1 − P ( μ ⩽ μ ) = 1 − Φ ( μ ) P(\mu>\mu)=1-P(\mu\leqslant \mu)=1-\Phi(\mu) P(μ>μ)=1P(μμ)=1Φ(μ)
      • P ( a < μ ⩽ b ) = Φ ( b ) − Φ ( a ) P(a<\mu\leqslant b)=\Phi(b)-\Phi(a) P(a<μb)=Φ(b)Φ(a)
      • P ( ∣ μ ∣ < c ) = P ( − c < μ < c ) = Φ ( c ) − Φ ( − c ) = Φ ( c ) − ( 1 − Φ ( c ) ) = 2 Φ ( c ) − 1 P(|\mu|P(μ<c)=P(c<μ<c)=Φ(c)Φ(c)=Φ(c)(1Φ(c))=(c)1
    • P ( ∣ X − μ ∣ < σ ) = Φ ( 1 ) − Φ ( − 1 ) ≈ 0.6826 P ( ∣ X − μ ∣ < 2 σ ) = Φ ( 2 ) − Φ ( − 2 ) ≈ 0.9544 P ( ∣ X − μ ∣ < 3 σ ) = Φ ( 3 ) − Φ ( − 3 ) ≈ 0.9973 表示对于正态分布密度函数两侧距离对称轴 x = μ 不超过 k σ ( k = 1 , 2 , 3 ) 的面积 ( 也即是概率 ) 可以看出 , 如果 X ∼ N ( μ , σ 2 ) , 则 ∣ X − μ ∣ ⩽ 3 σ 的概率相当高 P(|X-\mu|<\sigma)=\Phi(1)-\Phi(-1)\approx0.6826 \\P(|X-\mu|<2\sigma)=\Phi(2)-\Phi(-2)\approx 0.9544 \\P(|X-\mu|<3\sigma)=\Phi(3)-\Phi(-3)\approx 0.9973 \\表示对于正态分布密度函数两侧距离对称轴x=\mu不超过 \\k\sigma(k=1,2,3)的面积(也即是概率) \\可以看出,如果X\sim N(\mu,\sigma^2),则|X-\mu|\leqslant 3\sigma 的概率相当高 P(Xμ<σ)=Φ(1)Φ(1)0.6826P(Xμ<2σ)=Φ(2)Φ(2)0.9544P(Xμ<3σ)=Φ(3)Φ(3)0.9973表示对于正态分布密度函数两侧距离对称轴x=μ不超过(k=1,2,3)的面积(也即是概率)可以看出,如果XN(μ,σ2),Xμ3σ的概率相当高

一般正态分布标准化

  • F ( x ) = 1 2 π ⋅ σ ∫ − ∞ x e − ( t − μ ) 2 2 σ d t 积分区域 : t ∈ ( − ∞ , x ] 令 u = t − μ σ u = t − μ σ ∈ ( − ∞ , x − μ σ ] 即为换元后的积分区间 F ( u ) = 1 2 π ⋅ σ ∫ − ∞ x − μ σ e − u 2 2 d u 这个形式和标准型很相像 , 只有 : 积分上限从 x 变为 x − μ σ F ( x ) = Φ ( x − μ σ ) F(x)=\frac{1}{\sqrt{2\pi}\cdot\sigma}\int_{-\infin}^{x}e^{-\frac{(t-\mu)^2}{2\sigma}}dt \\积分区域:t\in(-\infin,x] \\ 令u=\frac{t-\mu}{\sigma} \\ u=\frac{t-\mu}{\sigma}\in(-\infin,\frac{x-\mu}{\sigma}] 即为换元后的积分区间 \\F(u) =\frac{1}{\sqrt{2\pi}\cdot\sigma}\int_{-\infin}^{\frac{x-\mu}{\sigma}}e^{-\frac{u^2}{2}}du \\这个形式和标准型很相像,只有:积分上限从x变为\frac{x-\mu}{\sigma} \\F(x)=\Phi(\frac{x-\mu}{\sigma}) F(x)=2π σ1xe2σ(tμ)2dt积分区域:t(,x]u=σtμu=σtμ(,σxμ]即为换元后的积分区间F(u)=2π σ1σxμe2u2du这个形式和标准型很相像,只有:积分上限从x变为σxμF(x)=Φ(σxμ)

    P ( a < X ⩽ b ) = F ( b ) − F ( a ) = Φ ( b − μ σ ) − Φ ( a − μ σ ) 特别的 , 只有一边 : P ( X ⩽ x ) = Φ ( x − μ σ ) P(aP(a<Xb)=F(b)F(a)=Φ(σbμ)Φ(σaμ)特别的,只有一边:P(Xx)=Φ(σxμ)

    • 因此,正态分布都可以用这个一般化的公式(将一般型标准化)计算概率

你可能感兴趣的:(概率论)