【概率分布】--- 离散与连续概率分布

  • 一. 随机变量
    • 离散随机变量
    • 连续性随机变量
  • 概率分布
    • 离散分布
      • 伯努利分布
      • 二项分布
      • 几何分布
      • 泊松分布
    • 连续分布
      • 均匀分布
      • 正态分布
      • 卡方分布
      • 指数分布
      • F分布

概率分布描述了随机变量取值的规律,首先了解什么是随机变量。

一. 随机变量

随机变量是一个函数,它用数字来表示一个可能出现的事件。你可以定义你自己的随机变量,然后生成一些样本来观察它的经验分布。

多用 X X X 表示随机变量,用 x x x 来表示随机变量的取值

常见的随机变量有两种类型:

  • 离散型随机变量,可能的取值范围只有有限个或可列个的值
  • 连续型随机变量,可能取值的范围是一个无限不可数集合(如全体实数)

1. 离散随机变量

定义: 如果 X X X是一个随机变量,存在非负函数 f ( x ) f(x) f(x) F ( X ) F(X) F(X), 使得 P ( X = x ) = f ( x ) P ( X < x ) = F ( x ) P(X=x)=f(x)\\P(X<x)=F(x) P(X=x)=f(x)P(X<x)=F(x)则称 X X X是一个离散型随机变量。

一种离散变量的概率质量函数 f ( x ) f(x) f(x)和分布函数 F ( x ) F(x) F(x):(伯努利分布)
【概率分布】--- 离散与连续概率分布_第1张图片

对于离散变量满足一些分布,如下只介绍4种:

  • 伯努利分布 Bernoulli
  • 二项分布 Binomial
  • 几何分布 Geometric
  • 泊松分布 Poisson

上述四种离散的分布将在后面介绍

2. 连续性随机变量

定义:如果 X X X是一个随机变量,存在非负函数 f ( x ) f(x) f(x), 使得 P ( a ≤ X ≤ b ) = ∫ a b f ( x ) d x P ( X < x ) = F ( x ) P(a \leq X \leq b) = \int_a^bf(x)dx \\ P(X<x)=F(x) P(aXb)=abf(x)dxP(X<x)=F(x) X X X是连续型随机变量。

一种连续变量的概率质量函数 f ( x ) f(x) f(x)和分布函数 F ( x ) F(x) F(x):(正态分布)

【概率分布】--- 离散与连续概率分布_第2张图片

对于连续变量满足以下一些分布,如下只介绍其中的6种:

  • 均匀分布 Uniform
  • 正态分布(也称高斯分布) Normal(Gaussian)
  • 卡方分布 Chi Squared
  • 指数分布 Exponential
  • F分布 F

上述五种离散的分布将在后面介绍

二. 概率分布

1. 离散分布

a) 伯努利分布

如果一个随机变量 X X X只取值 0 0 0 1 1 1,概率分布是 P ( X = 1 ) = p P ( x = 0 ) = 1 − p P(X=1)=p \\ P(x=0)=1-p P(X=1)=pP(x=0)=1p则称 X X X符合伯努利分布(Bernoulli)。

PMF 期望 方差
f ( x ; p ) = { p , x = 1 1 − p , x = 0 f(x;p)=\left\{\begin{matrix} p, & x=1 & \\ 1-p, & x=0 & \end{matrix}\right. f(x;p)={p,1p,x=1x=0 p p p p ( 1 − p ) p(1-p) p(1p)

常用伯努利分布来模拟只有两种结果的试验,如抛硬币实验。

b) 二项分布

如果随机变量 X X X n n n个参数为 p p p的独立伯努利随机变量之和,则称 X X X是二项分布(binomial)。

PMF 期望 方差
f ( x ; n , p ) = ( n x ) p x ( 1 − p ) n − x f(x;n,p)=\binom{n}{x}p^x(1-p)^{n-x} f(x;n,p)=(xn)px(1p)nx n p np np n p ( 1 − p ) np(1-p) np(1p)

常用二项分布来模拟若干独立同分布的伯努利试验中的成功次数。比如说,抛五次硬币,其中正面的次数可以用二项分布来表示:Bin ( 5 , 1 2 ) (5,\frac{1}{2}) (5,21)

c) 几何分布

一个服从几何分布的随机变量表示了在重复独立同分布的伯努利试验中获得一次成功所需要的试验次数。
记成功概率为 p p p独立的伯努利实验中, X X X为首次成功的试验次数,这个 X X X就俯冲与几何分布。

PMF 期望 方差
f ( x ; n , p ) = ( 1 − p ) x p f(x;n,p)=(1-p)^{x}p f(x;n,p)=(1p)xp 1 p \frac{1}{p} p1 1 − p p 2 \frac{1-p}{p^2} p21p

比如说,如果我们重复投一枚骰子,我们则可以用几何分布来表示投出一个6所需要的试验次数。

d) 泊松分布

泊松分布表示了一个事件在固定时间或者空间中发生的次数。泊松分布的参数 λ \lambda λ是这个时间发生的频率。

PMF 期望 方差
f ( x ; λ ) = λ x e − λ x ! f(x;\lambda)=\frac{\lambda^xe^{-\lambda}}{x!} f(x;λ)=x!λxeλ λ \lambda λ λ \lambda λ

比方说,我们可以用泊松分布来刻画流星雨或者足球比赛中的进球数。

2. 连续分布

a) 均匀分布

如果随机变量 X X X在其支撑集上所有相同长度的区间上有相同的概率,即如果 b 1 − a 1 = b 2 − a 2 b1−a1=b2−a2 b1a1=b2a2,则 P ( X ∈ [ a 1 , b 1 ] ) = P ( X ∈ [ a 2 . b 2 ] ) P(X\in[a_1,b_1])=P(X\in[a_2.b_2]) P(X[a1,b1])=P(X[a2.b2])那么称 X X X服从均匀分布。

PMF 期望 方差
f ( x ; a , b ) = { 1 b − a , x ∈ [ a , b ] 0 , o t h e r w i s e f(x;a,b)=\left\{\begin{matrix} \frac{1}{b-a}, & x\in[a,b] & \\ 0, & otherwise & \end{matrix}\right. f(x;a,b)={ba1,0,x[a,b]otherwise a + b 2 \frac{a+b}{2} 2a+b ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(ba)2

比方说,我们一般可以假设人在一年中出生的概率是相等的,因此可以用均匀分布来模拟人的出生时间。

b) 正态分布

很重要,也很特别

正态分布(也称高斯分布)的密度函数是一个钟形曲线。科学中常用正态分布来模拟许多小效应的叠加。

PMF 期望 方差
f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − 1 ( x − μ ) 2 2 σ 2 f(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-1\frac{(x-\mu)^2}{2\sigma^2}} f(x;μ,σ2)=2πσ2 1e12σ2(xμ)2 μ \mu μ σ 2 \sigma^2 σ2

比方说,我们知道人的身高是许多微小的基因和环境效应的叠加。因此可以用正态分布来表示人的身高。

c) 卡方分布

如果随机变量 X X X k k k个独立的标准正态随机变量的平方和,则称 X X X是自由度为 k k k的卡方随机变量: X ∼ χ k 2 X \sim \chi^2_k Xχk2

PMF 期望 方差
∑ i = 1 k Z i 2      Z i ∼ N ( 0 , 1 ) \sum^k_{i=1}Z_i^2~~~~Z_i \sim N(0,1) i=1kZi2    ZiN(0,1) k k k 2 k 2k 2k

卡方分布常见于假设检验和构造置信区间.

d) 指数分布

指数分布可以看作是几何分布的连续版本。

PMF 期望 方差
f ( x ; λ ) = { λ e − λ x x ≥ 0 0 o t h e r w i s e f(x;\lambda)=\left\{\begin{matrix} \lambda e^{-\lambda x} & x \geq 0 & \\ 0 & otherwise & \end{matrix}\right. f(x;λ)={λeλx0x0otherwise 1 λ \frac{1}{\lambda} λ1 1 λ 2 \frac{1}{\lambda^2} λ21

指数分布常见于描述等待时间。

e) F分布

F分布(Fisher–Snedecor分布)常在假设检验中出现。

PMF 期望 方差
U 1 / d 1 U 2 / d 2        U 1 ∼ χ d 1 U 2 ∼ χ d 2 \frac{U_1/d_1}{U_2/d_2}~~~~~~\begin{matrix} U_1 \sim\chi_{d_1} & \\ U_2 \sim\chi_{d_2} & \end{matrix} U2/d2U1/d1      U1χd1U2χd2 d 2 d 2 − 2 \frac{d_2}{d_2-2} d22d2 2 d 2 2 ( d 1 + d 2 − 2 ) d 1 ( d 2 − 2 ) 2 ( d 2 − 4 ) \frac{2d_2^2(d_1+d_2-2)}{d_1(d_2-2)^2(d_2-4)} d1(d22)2(d24)2d22(d1+d22)

一个比较有名的例子是方差分析

你可能感兴趣的:(统计学习笔记)