概率论总结

统计分布

最近在看统计相关的知识,发现自己之前学习的知识不是很清晰。该博客主要是理一理自己的思路。加上一些重要的推理公式。
一、离散分布
主要介绍两个相关的分布:二项分布泊松分布

  1. 二项分布
    二项分布市常见的离散分布之一,其基本思想是伯努利试验,伯努利试验是一个有且仅有两种结果的实验,称随机变量 X X X服从参数为 p p p的分布
    X = { 1 ( 概 率 为 p ) 0 ≤ p ≤ 1 0 ( 概 率 为 1 − p ) X=\begin{cases} 1(概率为p)\\ \quad\quad\quad\quad\quad\quad\quad 0\leq p\leq 1\\ 0(概率为1-p) \end{cases} X=1(p)0p10(1p)
    如果进行 n n n个完全相同的伯努利实验,随机变量 Y = n Y=n Y=n个实验中成功实验的数目。则
    P ( Y = y ∣ n , p ) = = ( n y ) p y ( 1 − p ) n − y \mathbf{P(Y=y|n,p) = } = \left( \begin{array}{ccc} n\\\\ y \end{array} \right)p^y(1-p)^{n-y} P(Y=yn,p)==nypy(1p)ny
    Y Y Y被称作参数为 ( n , p ) (n,p) (n,p)的二项随机变量。记为 b ( n , p ) b(n,p) b(n,p)
  2. 泊松分布
    给定时间内事物出现的次数就服从泊松分布。泊松分布的一个基本假设:在较短的时间段内,事物出现的概率与等待的时间成正比。
    泊松分布有唯一的参数 λ \lambda λ,称取值为非负整数的随机变量 X X X服从参数为 λ \lambda λ的泊松分布,如果
    P ( X = x ∣ λ ) = e − λ λ x x ! , x = 0 , 1 , . . . . . . \mathbf{P(X=x|\lambda) = } \frac{e^{-\lambda}\lambda^x}{x!} , x = 0,1,...... P(X=xλ)=x!eλλx,x=0,1,......
  3. 二者关系
    我们可以利用下面的递推公式快速计算泊松概率,它可由泊松分布概率质量(离散情况)函数推得:
    P ( X ∣ x ) = λ x P ( X = x − 1 ) , x = 1 , 2 , . . . P(X|x) = \frac{\lambda}{x}P(X = x-1) ,x = 1,2,... P(Xx)=xλP(X=x1),x=1,2,...
    Y Y Y服从参数为 ( n , p ) (n,p) (n,p)的二项分布,则:
    P ( Y = y ) = n − y + 1 y p 1 − p P ( Y = y − 1 ) P(Y = y) = \frac{n-y+1}{y} \frac{p}{1-p}P(Y = y-1) P(Y=y)=yny+11ppP(Y=y1)
    λ = n p \lambda =np λ=np,并且如果 p p p很小,则有
    n − y + 1 y p 1 − p = n p − p ( y − 1 ) y − y p ≈ λ y \frac{n-y+1}{y} \frac{p}{1-p} = \frac{np-p(y-1)}{y-yp} \approx \frac{\lambda}{y} yny+11pp=yypnpp(y1)yλ
    这是因为 p p p很小是项 p ( y − 1 ) p(y-1) p(y1) p y py py均可忽略。于是,
    P ( Y = y ) = λ y P ( Y = y − 1 ) P(Y = y) = \frac{\lambda}{y} P(Y = y-1) P(Y=y)=yλP(Y=y1)
    恰好泊松递推关系。为了完全确定近似关系,我们需要验证 P ( X = 0 ) ≈ P ( Y = 0 ) P(X=0) \approx P(Y=0) P(X=0)P(Y=0)。因为 n p = λ np=\lambda np=λ,则有
    P ( Y = 0 ) = ( 1 − p ) n = ( 1 − n p n ) n = ( 1 − λ n ) n P(Y=0) = (1-p)^n = (1-\frac{np}{n})^n = (1-\frac{\lambda}{n})^n P(Y=0)=(1p)n=(1nnp)n=(1nλ)n
    当n很大时,有如下近似
    P ( Y = 0 ) = ( 1 − λ n ) n ≈ e − λ = P ( X = 0 ) P(Y=0)=(1-\frac{\lambda}{n})^n \approx e^{-\lambda}=P(X=0) P(Y=0)=(1nλ)neλ=P(X=0)
    综上,我们证明了二项分布的泊松近似。主要运用在样本很大时的二项分布。
    二、连续分布
    \quad 连续分布主要从伽马分布开始,接着是贝塔分布。之所以先将这两个,是为了引出指数分布(伽马分布的特殊情况)和均匀分布(贝塔分布的特殊情况)。
  4. 伽马分布
    伽马分布族是区间 [ , + ∞ ) [,+ \infty) [,+)上的,适用性很强的一类分布。如下积分定义了 Γ \Gamma Γ函数
    Γ ( α ) = ∫ 0 + ∞ t α − 1 e − t d t \Gamma(\alpha) = \int_{0}^{+\infty} t^{\alpha-1}e^{-t}dt Γ(α)=0+tα1etdt
    利用分部积分法容易得到: Γ ( α ) = α Γ ( α ) , α > 0 \Gamma (\alpha) = \alpha \Gamma( \alpha) ,\alpha >0 Γ(α)=αΓ(α),α>0 Γ ( 1 ) = 1 ; Γ ( n ) = ( n − 1 ) ! \Gamma(1)=1;\Gamma(n)=(n-1)! Γ(1)=1;Γ(n)=(n1)!
    由于伽马函数恒大于0,于是根据概率密度函数的公理化要求,故
    f ( t ) = t α − 1 e − t ∫ 0 + ∞ t α − 1 e − t d t , 0 < t < + ∞ f(t) = \frac{t^{\alpha-1}e^{-t}}{\int_{0}^{+\infty} t^{\alpha-1}e^{-t}dt} , 0<t<+\infty f(t)=0+tα1etdttα1et,0<t<+
    上式是概率密度函数。完整的伽马函数分布族实际上有两个参数,可由变量变换 X = β t X = \beta t X=βt,其中 β \beta β为大于0的常数。
    f ( x ∣ α , β ) = 1 Γ ( α ) β α x α − 1 e − x / β , 0 < x < + ∞ , α > 0 , β > 0 f(x| \alpha,\beta) = \frac{1}{\Gamma(\alpha)\beta^\alpha}x^{\alpha-1}e^{-x/\beta} ,0<x<+\infty ,\alpha>0,\beta>0 f(xα,β)=Γ(α)βα1xα1ex/β0<x<+,α>0,β>0
    有的书也有如下定义 λ \lambda λ = 1 β \frac{1}{\beta} β1
    f ( x ∣ α , λ ) = λ α Γ ( α ) x α − 1 e − λ x f(x| \alpha,\lambda) = \frac{\lambda^{\alpha}}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x} f(xα,λ)=Γ(α)λαxα1eλx
    数学期望: E X = 1 Γ ( α ) β α ∫ 0 ∞ x x α − 1 e − x / β = 1 Γ ( α ) β α ∫ 0 ∞ x α e − x / β = 1 Γ ( α ) β α Γ ( α + 1 ) β α + 1 = α β EX= \frac{1}{\Gamma(\alpha)\beta^\alpha} \int_{0}^{\infty} x x^{\alpha-1}e^{-x/\beta}= \frac{1}{\Gamma(\alpha)\beta^\alpha} \int_{0}^{\infty} x^{\alpha}e^{-x/\beta} =\frac{1}{\Gamma(\alpha)\beta^\alpha}\Gamma(\alpha+1)\beta^{\alpha+1}=\alpha \beta EX=Γ(α)βα10xxα1ex/β=Γ(α)βα10xαex/β=Γ(α)βα1Γ(α+1)βα+1=αβ
    方差:同样利用上式可以得到 V a r X = α β 2 Var X = \alpha\beta^2 VarX=αβ2
    与泊松分布的联系
    设X是服从参数为 ( α , β ) (\alpha,\beta) (α,β)的伽马随机变量,其中 α \alpha α为整数,Y为服从参数 ( x / β ) (x/\beta) (x/β)的泊松分布,则对任意x,都有
    P ( X ≤ x ) = P ( Y ≥ a ) P(X\leq x) = P(Y\geq a) P(Xx)=P(Ya)
    连续利用分部积分法即可证明上式:
    P ( X ≤ x ) = 1 ( α − 1 ) ! β α ∫ 0 x x α − 1 e − x / β d t P(X\leq x) = \frac{1}{(\alpha-1)!\beta^\alpha}\int_{0}^{x} x^{\alpha-1}e^{-x/\beta} dt P(Xx)=(α1)!βα10xxα1ex/βdt
    与指数分布的联系
    α = 1 \alpha=1 α=1,就有伽马分布的另一个重要特例,概率密度函数为:
    f ( x ∣ β ) = 1 β e − x / β , 0 < x < + ∞ f(x|\beta) = \frac{1}{\beta}e^{-x/\beta} ,0<x<+\infty f(xβ)=β1ex/β0<x<+
    卡方分布的联系
    α = p / 2 \alpha=p/2 α=p/2,其中 p p p为整数且 β = 2 \beta=2 β=2,则伽马概率密度函数为:
    f ( x ∣ p ) = 1 Γ ( p / 2 ) 2 p / 2 x p / 2 − 1 e − x / 2 , 0 < x < ∞ f(x|p) = \frac{1}{\Gamma(p/2)2^{p/2}}x^{p/2-1}e^{-x/2} ,0<x<\infty f(xp)=Γ(p/2)2p/21xp/21ex/20<x<
  5. 贝塔分布
    贝塔分布(0,1)区间上含两个参数的一类连续分布,参数为( α , β \alpha,\beta α,β)的贝塔分布概率密度函数为:
    f ( x ∣ α , β ) = 1 B ( α , β ) x α − 1 ( 1 − x ) β − 1 , 0 < x < 1 , α > 0 , β > 0 f(x|\alpha,\beta) = \frac{1}{B(\alpha,\beta)}x^{\alpha-1}(1-x)^{\beta-1} ,0<x<1,\alpha>0,\beta>0 f(xα,β)=B(α,β)1xα1(1x)β10<x<1,α>0,β>0
    其中, B ( α , β ) = ∫ 0 1 x α − 1 ( 1 − x ) β − 1 ; B ( α , β ) = Γ ( α ) Γ ( β ) Γ ( α + β ) B(\alpha,\beta) = \int_{0}^{1}x^{\alpha-1}(1-x)^{\beta-1};B(\alpha,\beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)} B(α,β)=01xα1(1x)β1;B(α,β)=Γ(α+β)Γ(α)Γ(β)
    α = β = 1 \alpha=\beta=1 α=β=1时,贝塔分布退化为U(0,1)均匀分布
  6. 正态分布
    正态分布是一个最常见的分布,必须要掌握的,这里主要补充一些重要公式和正态分布的高阶矩的计算问题。
  7. 对数正态分布

你可能感兴趣的:(概率论)