概率论与统计(三)常见分布

文章目录

    • 1.离散变量分布
      • 1.1伯努利分布与二项分布(Bernoulli and Binomial Distribution)
      • 1.2泊松分布(Poisson Distribution)
      • 1.3超几何分布(Hypergeometric Distribution)
    • 2.连续变量分布
      • 2.1均匀分布(Uniform Distribution)
      • 2.2正态分布(Normal Distribution)
      • 2.3指数分布(Exponential distribution)
      • 2.4卡方分布(Chi-square Distribution)
      • 2.5 t分布(t-Distribution)
      • 2.6 F分布(F-Distribution)

1.离散变量分布

1.1伯努利分布与二项分布(Bernoulli and Binomial Distribution)

伯努利实验:实验结果为成功或失败两种情况(抛硬币)
伯努利随机变量:在伯努利实验中,令X=1代表成功,X=0代表失败,则X称为伯努利随机变量
P ( X = 1 ) = p P(X=1)=p P(X=1)=p
P ( X = 0 ) = 1 − p P(X=0)=1-p P(X=0)=1p
二项分布随机变量:在n次独立重复的伯努利实验中,X为成功次数,则X服从二项分布
P ( X = i ) = C n i p i ( 1 − p ) n − i P(X=i)=C_n^ip^i(1-p)^{n-i} P(X=i)=Cnipi(1p)ni
二项分布
P ( X ≤ i ) = ∑ k = 0 i C n k p k ( 1 − p ) k P(X\le i)=\sum_{k=0}^iC_n^kp^k(1-p)^k P(Xi)=k=0iCnkpk(1p)k
P ( X = k + 1 ) = p 1 − p n − k k + 1 P ( X = k ) P(X =k+1)= \frac{p}{1-p} \frac{n-k}{k+1}P(X =k) P(X=k+1)=1ppk+1nkP(X=k)
E [ X ] = n p E[X]=np E[X]=np
V a r [ X ] = n p ( 1 − p ) Var[X]=np(1-p) Var[X]=np(1p)

1.2泊松分布(Poisson Distribution)

泊松随机变量:随机变量X,取值为0,1,2…,且随机变量取值的概率如下,则X为泊松随机变量
P ( X = i ) = e − λ λ i i ! P(X=i)=e^{-\lambda}\frac{\lambda^i}{i!} P(X=i)=eλi!λi i = 0,1,2…
λ \lambda λ取值为4时,概率分布情况如下
概率论与统计(三)常见分布_第1张图片
E [ X ] = λ E[X]=\lambda E[X]=λ
V a r [ X ] = λ Var[X]=\lambda Var[X]=λ
当n很大,p很小时,二项分布可以近似为泊松分布,其中 λ = n p \lambda=np λ=np
两个泊松随机变量相加,结果依然符合泊松分布,期望为 λ 1 + λ 2 \lambda_1+\lambda_2 λ1+λ2
P ( X = i + 1 ) = λ i + 1 P ( X = i ) P(X=i+1)=\frac{\lambda}{i+1}P(X=i) P(X=i+1)=i+1λP(X=i)

1.3超几何分布(Hypergeometric Distribution)

超几何分布:N+M个样本,其中N个样本属于A类,M个样本属于B类,选出n个样本,其中A类样本的数量分布为超几何分布
P ( X = i ) = C N + M n C M n − i C N + M n P(X=i)=\frac{C_{N+M}^nC_{M}^{n-i}}{C_{N+M}^n} P(X=i)=CN+MnCN+MnCMni
E [ X ] = n N N + M E[X]=\frac{nN}{N+M} E[X]=N+MnN
V a r [ X ] = n N M ( N + M ) 2 ( 1 − n − 1 N + M − 1 ) Var[X]=\frac{nNM}{(N+M)^2}(1-\frac{n-1}{N+M-1}) Var[X]=(N+M)2nNM(1N+M1n1)
超几何分布可以看作连续不放回抽取样本,每次抽取可以视作伯努利分布
当超几何分布样本数量很大时,近似为二项分布,因为每次抽取可视为总体样本量不变

2.连续变量分布

2.1均匀分布(Uniform Distribution)

f ( x ) = 1 β − α f(x)=\frac{1}{\beta-\alpha} f(x)=βα1 if α ≤ x ≤ β \alpha\le x \le \beta αxβ else f ( x ) = 0 f(x)=0 f(x)=0
E [ x ] = β + α 2 E[x]=\frac{\beta+\alpha}{2} E[x]=2β+α
V a r [ x ] = ( β − α ) 2 12 Var[x]=\frac{(\beta-\alpha)^2}{12} Var[x]=12(βα)2
概率论与统计(三)常见分布_第2张图片

2.2正态分布(Normal Distribution)

f ( x ) = 1 2 π σ e x p ( − ( x − μ ) 2 / 2 σ 2 ) f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp(-(x-\mu)^2/2\sigma^2) f(x)=2π σ1exp((xμ)2/2σ2)
E [ X ] = μ E[X]=\mu E[X]=μ
V a r [ X ] = σ 2 Var[X]=\sigma^2 Var[X]=σ2
在计算正态分布的概率时,通常转化为标准正态分布,再通过查概率论与统计(三)常见分布_第3张图片
表的方法计算
正态分布的数乘以及线性组合依然服从正态分布
E [ ∑ X i ] = ∑ μ i E[\sum X_i]=\sum \mu_i E[Xi]=μi
E [ ∑ X i ] = ∑ σ i 2 E[\sum X_i]=\sum \sigma_i^2 E[Xi]=σi2

2.3指数分布(Exponential distribution)

if x ≥ 0 x\ge0 x0 f ( x ) = λ e x p ( − λ x ) f(x)=\lambda exp(-\lambda x) f(x)=λexp(λx)
if x < 0 x<0 x<0 f ( x ) = 0 f(x)=0 f(x)=0

F ( x ) = 1 − e x p ( − λ x ) F(x)=1-exp(-\lambda x) F(x)=1exp(λx)
E [ X ] = 1 λ E[X]=\frac{1}{\lambda} E[X]=λ1
V a r [ X ] = 1 λ 2 Var[X]=\frac{1}{\lambda^2} Var[X]=λ21
指数分布的变量是无记忆的(memoryless)
P ( X > s + t ∣ X > t ) = P ( X > s ) P(X>s+t|X>t)=P(X>s) P(X>s+tX>t)=P(X>s)
概率论与统计(三)常见分布_第4张图片

2.4卡方分布(Chi-square Distribution)

X = Z 1 2 + Z 2 2 + . . . + Z n 2 X=Z_1^2+Z_2^2+...+Z_n^2 X=Z12+Z22+...+Zn2
X服从n个自由度的卡方分布
E [ X ] = n E[X]=n E[X]=n
V a r [ X ] = 2 n Var[X]=2n Var[X]=2n
概率论与统计(三)常见分布_第5张图片

2.5 t分布(t-Distribution)

T n = Z X n 2 / n T_n=\frac{Z}{\sqrt{X_n^2/n}} Tn=Xn2/n Z
t分布与正态分布类似,当自由度足够大时,t分布近似于正态分布
概率论与统计(三)常见分布_第6张图片

2.6 F分布(F-Distribution)

F n , m = X n 2 / n X m 2 / m F_{n,m}=\frac{X_n^2/n}{X_m^2/m} Fn,m=Xm2/mXn2/n
概率论与统计(三)常见分布_第7张图片

下面链接时概率论与统计知识连载
概率论与统计(一)描述性统计
概率论与统计(二)概率论知识总结

你可能感兴趣的:(数学基础)