高斯分布是统计学与机器学习中使用最广泛的分布,他的概率密度函数( pdf ):
高斯分布的精度: λ=1/σ2 ,精度越高意味着高斯分布越集中在 μ 附近。
累计分布函数: Φ(x;μ,σ2)=∫x−∞N(z|μ,σ2)dz
当 σ2→0 时,高斯分布就集中在 μ 上:
limσ2→0N(x|μ,σ2)=δ(x−u)
其中 δ 是 狄拉克 δ 函数
Student t 分布
伽马分布是一个对正实数随机变量很灵活的分布, Ga(T|shape=a,rate=b)=baΓ(a)Ta−1e−Tb , a>0,b>0
其中, Γ(x)=∫∞0μx−1e−μdμ
并且 mean=ab,mode=a−1b,var=ab2
伽马的逆: IG(x|shape=a,scale=b)=baΓ(a)T−(a+1)e−b/x
如果 X∼Ga(a,b) , 则 1X∼IG(a,b)
而且该分布: mean=ba−1,mode=ba+1,var=b2(a−1)2(a−2)
贝塔分布在[0,1]内, Beta(x|a,b)=1B(a,b)xa−1(1−x)b−1 ,其中 B(a,b)=Γ(a)Γ(b)Γ(a+b)
80/20法则: Pareto(x|k,m)=kmkx−(k+1)1(x≥m)
Machine Learning A Probabilistic Perspective
帕累托分布