《LDA漫游指南》——2.3 Beta分布(Beta distribution)

本节书摘来异步社区《LDA漫游指南》一书中的第2章,第2.3节,作者: 马晨,更多章节内容可以访问云栖社区“异步社区”公众号查看

2.3 Beta分布(Beta distribution)

在概率论中,Beta分布是指一组定义在区间(0,1)的连续概率分布,有两个参数alpha 和beta ,且alpha ,beta > 0。

Beta分布的概率密度函数是

《LDA漫游指南》——2.3 Beta分布(Beta distribution)_第1张图片

(2.5)

随机变量X服从参数为的Beta分布通常写作:Xsim Beta(alpha ,beta )。

这个式子中分母的函数B(alpha ,beta )称为beta函数。

两种证明方法
这里我们来证明一个重要的公式,该公式中的关系在LDA算法Gibbs Sampling采样公式中也有使用,这个关系也就是mathbf {beta}函数和gamma函数的关系(该公式也被称为第一型欧拉积分):

345c13598cf79d37535803d2d1d05a2aee9ce086

(2.6)

下面我们给出这个关系式的两种证明方法。

证明方法1:

《LDA漫游指南》——2.3 Beta分布(Beta distribution)_第2张图片

图2-1为积分区域。

《LDA漫游指南》——2.3 Beta分布(Beta distribution)_第3张图片

在图 2-1的上半部分(阴影部分)为积分区域,则交换积分次序为

952b80e8408938859c0f2323fb48e6cd3722c07f

再令x = tmu ,则x = t,mu = 1;当x = 0,则mu = 0。

《LDA漫游指南》——2.3 Beta分布(Beta distribution)_第4张图片

第二种证明方法不涉及多重积分,因此颇为简洁,具体如下:

5a0d5df9eedba502b3d2e1a590786995e0f02eb8

这个方法的关键之处在于应用分部积分法,

e7c869be84f540c092626cc9d1f36b76f3607ff9

换元之后再使用分部积分法可得

《LDA漫游指南》——2.3 Beta分布(Beta distribution)_第5张图片

我们思如泉涌,如同多米诺骨牌,很快便发现一个规律,

《LDA漫游指南》——2.3 Beta分布(Beta distribution)_第6张图片

这个证明过程使用了分部积分法,在最后又利用了gamma函数的阶乘特性,显得非常巧妙和简洁。

Beta分布的期望

《LDA漫游指南》——2.3 Beta分布(Beta distribution)_第7张图片

化简后

00e7db52dbb09954b48bdba5e0eed760e531d438

这说明,Beta分布的均值可以用frac{alpha }{{alpha + beta }}来估计。

对于后面2.6节提到的Dirichlet分布也有相似结论:

《LDA漫游指南》——2.3 Beta分布(Beta distribution)_第8张图片

这个结论在LDA算法做完Gibbs sampling后,估计vec theta 和vec varphi时会用到。

你可能感兴趣的:(人工智能)