概率分布描述了随机变量取值的规律,首先了解什么是随机变量。
随机变量是一个函数,它用数字来表示一个可能出现的事件。你可以定义你自己的随机变量,然后生成一些样本来观察它的经验分布。
多用 X X X 表示随机变量,用 x x x 来表示随机变量的取值
常见的随机变量有两种类型:
定义: 如果 X X X是一个随机变量,存在非负函数 f ( x ) f(x) f(x)和 F ( X ) F(X) F(X), 使得 P ( X = x ) = f ( x ) P ( X < x ) = F ( x ) P(X=x)=f(x)\\P(X<x)=F(x) P(X=x)=f(x)P(X<x)=F(x)则称 X X X是一个离散型随机变量。
一种离散变量的概率质量函数 f ( x ) f(x) f(x)和分布函数 F ( x ) F(x) F(x):(伯努利分布)
对于离散变量满足一些分布,如下只介绍4种:
上述四种离散的分布将在后面介绍
定义:如果 X X X是一个随机变量,存在非负函数 f ( x ) f(x) f(x), 使得 P ( a ≤ X ≤ b ) = ∫ a b f ( x ) d x P ( X < x ) = F ( x ) P(a \leq X \leq b) = \int_a^bf(x)dx \\ P(X<x)=F(x) P(a≤X≤b)=∫abf(x)dxP(X<x)=F(x)则 X X X是连续型随机变量。
一种连续变量的概率质量函数 f ( x ) f(x) f(x)和分布函数 F ( x ) F(x) F(x):(正态分布)
对于连续变量满足以下一些分布,如下只介绍其中的6种:
上述五种离散的分布将在后面介绍
如果一个随机变量 X X X只取值 0 0 0或 1 1 1,概率分布是 P ( X = 1 ) = p P ( x = 0 ) = 1 − p P(X=1)=p \\ P(x=0)=1-p P(X=1)=pP(x=0)=1−p则称 X X X符合伯努利分布(Bernoulli)。
PMF | 期望 | 方差 |
---|---|---|
f ( x ; p ) = { p , x = 1 1 − p , x = 0 f(x;p)=\left\{\begin{matrix} p, & x=1 & \\ 1-p, & x=0 & \end{matrix}\right. f(x;p)={p,1−p,x=1x=0 | p p p | p ( 1 − p ) p(1-p) p(1−p) |
常用伯努利分布来模拟只有两种结果的试验,如抛硬币实验。
如果随机变量 X X X是 n n n个参数为 p p p的独立伯努利随机变量之和,则称 X X X是二项分布(binomial)。
PMF | 期望 | 方差 |
---|---|---|
f ( x ; n , p ) = ( n x ) p x ( 1 − p ) n − x f(x;n,p)=\binom{n}{x}p^x(1-p)^{n-x} f(x;n,p)=(xn)px(1−p)n−x | n p np np | n p ( 1 − p ) np(1-p) np(1−p) |
常用二项分布来模拟若干独立同分布的伯努利试验中的成功次数。比如说,抛五次硬币,其中正面的次数可以用二项分布来表示:Bin ( 5 , 1 2 ) (5,\frac{1}{2}) (5,21)
一个服从几何分布的随机变量表示了在重复独立同分布的伯努利试验中获得一次成功所需要的试验次数。
记成功概率为 p p p独立的伯努利实验中, X X X为首次成功的试验次数,这个 X X X就俯冲与几何分布。
PMF | 期望 | 方差 |
---|---|---|
f ( x ; n , p ) = ( 1 − p ) x p f(x;n,p)=(1-p)^{x}p f(x;n,p)=(1−p)xp | 1 p \frac{1}{p} p1 | 1 − p p 2 \frac{1-p}{p^2} p21−p |
比如说,如果我们重复投一枚骰子,我们则可以用几何分布来表示投出一个6所需要的试验次数。
泊松分布表示了一个事件在固定时间或者空间中发生的次数。泊松分布的参数 λ \lambda λ是这个时间发生的频率。
PMF | 期望 | 方差 |
---|---|---|
f ( x ; λ ) = λ x e − λ x ! f(x;\lambda)=\frac{\lambda^xe^{-\lambda}}{x!} f(x;λ)=x!λxe−λ | λ \lambda λ | λ \lambda λ |
比方说,我们可以用泊松分布来刻画流星雨或者足球比赛中的进球数。
如果随机变量 X X X在其支撑集上所有相同长度的区间上有相同的概率,即如果 b 1 − a 1 = b 2 − a 2 b1−a1=b2−a2 b1−a1=b2−a2,则 P ( X ∈ [ a 1 , b 1 ] ) = P ( X ∈ [ a 2 . b 2 ] ) P(X\in[a_1,b_1])=P(X\in[a_2.b_2]) P(X∈[a1,b1])=P(X∈[a2.b2])那么称 X X X服从均匀分布。
PMF | 期望 | 方差 |
---|---|---|
f ( x ; a , b ) = { 1 b − a , x ∈ [ a , b ] 0 , o t h e r w i s e f(x;a,b)=\left\{\begin{matrix} \frac{1}{b-a}, & x\in[a,b] & \\ 0, & otherwise & \end{matrix}\right. f(x;a,b)={b−a1,0,x∈[a,b]otherwise | a + b 2 \frac{a+b}{2} 2a+b | ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(b−a)2 |
比方说,我们一般可以假设人在一年中出生的概率是相等的,因此可以用均匀分布来模拟人的出生时间。
很重要,也很特别
正态分布(也称高斯分布)的密度函数是一个钟形曲线。科学中常用正态分布来模拟许多小效应的叠加。
PMF | 期望 | 方差 |
---|---|---|
f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − 1 ( x − μ ) 2 2 σ 2 f(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-1\frac{(x-\mu)^2}{2\sigma^2}} f(x;μ,σ2)=2πσ21e−12σ2(x−μ)2 | μ \mu μ | σ 2 \sigma^2 σ2 |
比方说,我们知道人的身高是许多微小的基因和环境效应的叠加。因此可以用正态分布来表示人的身高。
如果随机变量 X X X是 k k k个独立的标准正态随机变量的平方和,则称 X X X是自由度为 k k k的卡方随机变量: X ∼ χ k 2 X \sim \chi^2_k X∼χk2
PMF | 期望 | 方差 |
---|---|---|
∑ i = 1 k Z i 2 Z i ∼ N ( 0 , 1 ) \sum^k_{i=1}Z_i^2~~~~Z_i \sim N(0,1) ∑i=1kZi2 Zi∼N(0,1) | k k k | 2 k 2k 2k |
卡方分布常见于假设检验和构造置信区间.
指数分布可以看作是几何分布的连续版本。
PMF | 期望 | 方差 |
---|---|---|
f ( x ; λ ) = { λ e − λ x x ≥ 0 0 o t h e r w i s e f(x;\lambda)=\left\{\begin{matrix} \lambda e^{-\lambda x} & x \geq 0 & \\ 0 & otherwise & \end{matrix}\right. f(x;λ)={λe−λx0x≥0otherwise | 1 λ \frac{1}{\lambda} λ1 | 1 λ 2 \frac{1}{\lambda^2} λ21 |
指数分布常见于描述等待时间。
F分布(Fisher–Snedecor分布)常在假设检验中出现。
PMF | 期望 | 方差 |
---|---|---|
U 1 / d 1 U 2 / d 2 U 1 ∼ χ d 1 U 2 ∼ χ d 2 \frac{U_1/d_1}{U_2/d_2}~~~~~~\begin{matrix} U_1 \sim\chi_{d_1} & \\ U_2 \sim\chi_{d_2} & \end{matrix} U2/d2U1/d1 U1∼χd1U2∼χd2 | d 2 d 2 − 2 \frac{d_2}{d_2-2} d2−2d2 | 2 d 2 2 ( d 1 + d 2 − 2 ) d 1 ( d 2 − 2 ) 2 ( d 2 − 4 ) \frac{2d_2^2(d_1+d_2-2)}{d_1(d_2-2)^2(d_2-4)} d1(d2−2)2(d2−4)2d22(d1+d2−2) |
一个比较有名的例子是方差分析