常见的连续概率分布

高斯分布

高斯分布是统计学与机器学习中使用最广泛的分布,他的概率密度函数( pdf ):

N(x|μ,σ2)=12πσ2e(xμ)22σ2

高斯分布的精度: λ=1/σ2 ,精度越高意味着高斯分布越集中在 μ 附近。

累计分布函数: Φ(x;μ,σ2)=xN(z|μ,σ2)dz

$Φ(x;μ,σ2)=12[1+erf(z/2)]
z = (x-\mu)/\sigma erf(x)=\frac{2}{\sqrt{\pi}}\int_0^{x}e^{-t^{2}}dt$

退化分布

σ20 时,高斯分布就集中在 μ 上:
limσ20N(x|μ,σ2)=δ(xu)
其中 δ 是 狄拉克 δ 函数

δ(x)={0 if x = 0  if otherwise

Student t 分布

T(x|μ,σ2,ν)[1+1ν(xμσ)2](ν+12)

拉普拉斯分布

Lap(x|μ,b)=12bexp(|xμ|b)

其中 mean=μ,mode=μ,var=2b2 ,拉普拉斯分布对离散点比高斯分布更鲁棒。并且在很多点上的概率密度都为0,因此可以用来稀疏化一个模型。

常见的连续概率分布_第1张图片

常见的连续概率分布_第2张图片

伽马分布

伽马分布是一个对正实数随机变量很灵活的分布, Ga(T|shape=a,rate=b)=baΓ(a)Ta1eTb a>0,b>0

其中, Γ(x)=0μx1eμdμ

并且 mean=ab,mode=a1b,var=ab2

伽马的逆: IG(x|shape=a,scale=b)=baΓ(a)T(a+1)eb/x

如果 XGa(a,b) , 则 1XIG(a,b)

而且该分布: mean=ba1,mode=ba+1,var=b2(a1)2(a2)

集中特殊情况下的伽马分布

  1. 指数分布: Exp(x|λ)=Ga(x|1,λ)
  2. Erlang分布: Erlang(x|λ)=Ga(x|2,λ)
  3. Chi-squared分布: χ2(x|ν)=Ga(x|ν2,12) 。如果 ZiN(0,1),S=νi=1Z2i ,那么 Sχ2ν

贝塔分布

贝塔分布在[0,1]内, Beta(x|a,b)=1B(a,b)xa1(1x)b1 ,其中 B(a,b)=Γ(a)Γ(b)Γ(a+b)

常见的连续概率分布_第3张图片

mean=aa+b,mode=a1a+b2,var=ab(a+b)2(a+b+1)

帕累托分布

80/20法则: Pareto(x|k,m)=kmkx(k+1)1(xm)

mean=kmk1,mode=m,var=m2k(k1)2(k2)

常见的连续概率分布_第4张图片

参考

Machine Learning A Probabilistic Perspective
帕累托分布

你可能感兴趣的:(数学)