机器学习常见概率模型

机器学习常见概率模型

    • 概率模型
        • Bernoulli 分布
        • Multinoulli 分布
        • 高斯分布
        • 指数分布和Laplace 分布
        • 分布的混合

概率模型

Bernoulli 分布

Bernoulli 分布(Bernoulli distribution)是单个二值随机变量的分布。它由单个参数ϕ 控制,ϕ 给出了随机变量等于1 的概率。它具有如下的一些性质:
机器学习常见概率模型_第1张图片

Multinoulli 分布

Multinoulli 分布(multinoulli distribution)或者范畴分布(categorical distribution)是指在具有k 个不同状态的单个离散型随机变量上的分布,其中k 是一个有限值,范畴分布范畴分布实际是对二维泊松分布在维数上的扩展。

高斯分布

实数上最常用的分布就是正态分布(normal distribution),也称为高斯分布(Gaussian distribution),公式和分布如下:
在这里插入图片描述
机器学习常见概率模型_第2张图片
采用正态分布在很多应用中都是一个明智的选择。当我们由于缺乏关于某个实数上分布的先验知识而不知道该选择怎样的形式时,正态分布是默认的比较好的选择,其中有两个原因。
第一,我们想要建模的很多分布的真实情况是比较接近正态分布的。中心极限定理(central limit theorem)说明很多独立随机变量的和近似服从正态分布。这意味着在实际中,很多复杂系统都可以被成功地建模成正态分布的噪声,即使系统可以被分解成一些更结构化的部分。
第二,在具有相同方差的所有可能的概率分布中,正态分布在实数上具有最大的不确定性。因此,我们可以认为正态分布是对模型加入的先验知识量最少的分布。

指数分布和Laplace 分布

在深度学习中,我们经常会需要一个在x = 0 点处取得边界点(sharp point) 的分布。为了实现这一目的,我们可以使用指数分布(exponential distribution):
在这里插入图片描述
一个联系紧密的概率分布是Laplace 分布(Laplace distribution),它允许我们在任意一点 μ \mu μ 处设置概率质量的峰值。
在这里插入图片描述

分布的混合

通过组合一些简单的概率分布来定义新的概率分布也是很常见的。一种通用的组合方法是构造混合分布(mixture distribution)。混合分布由一些组件(component)分布构成。

Reference: LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton. “Deep learning.” nature 521.7553 (2015): 436.

你可能感兴趣的:(机器学习理论)