机器学习-白板推导系列笔记(二十五)-近似推断

此文章主要是结合哔站shuhuai008大佬的白板推导视频:近似推断_31min

全部笔记的汇总贴:机器学习-白板推导系列笔记

可以参考一下花书第十九章

一、介绍

机器学习-白板推导系列笔记(二十五)-近似推断_第1张图片

许多概率模型很难训练的原因就是很难进行推断,比如我们有一系列的可见变量 v v v和一系列的隐变量 h h h,推断困难通常就是指难以计算 p ( h ∣ v ) p(h|v) p(hv)或者他的期望。所以推断的动机是推断本身就是有价值的,而且还有一些learning问题的需要。

推断是困难的(如上图,除了图2-RBM的后验是可求的,其余三个都不可求),因此我们需要追求的是近似推断。

推 断 是 困 难 的 { 有 向 图 : e x p l a i n    a w a y                    无 向 图 : m u t u a l    i n t e r a c t i o n 推断是困难的\left\{\begin{matrix} 有向图:explain\;away\;\;\;\;\;\;\;\;\;\\\\无向图:mutual\;interaction \end{matrix}\right. explainawaymutualinteraction

二、推断即优化

样本: V = { v } V=\{v\} V={ v}

log-likelihood:

∑ v ∈ V log ⁡ p ( v ) \sum_{v\in V}\log p(v) vVlogp(v)

其中,

log ⁡ p ( v ) = log ⁡ p ( v , h ) p ( h ∣ v ) = log ⁡ p ( v , h ) q ( h ∣ v ) ⋅ q ( h ∣ v ) p ( h ∣ v ) = log ⁡ p ( v , h ) q ( h ∣ v ) + log ⁡ q ( h ∣ v ) p ( h ∣ v ) \log p(v)=\log\frac{p(v,h)}{p(h|v)}\\=\log\frac{p(v,h)}{q(h|v)}\cdot\frac{q(h|v)}{p(h|v)}\\=\log\frac{p(v,h)}{q(h|v)}+\log\frac{q(h|v)}{p(h|v)} logp(v)=logp(hv)p(v,h)=logq(hv)p(v,h)p(hv)q(hv)=logq(hv)p(v,h)+logp(hv)q(hv)

等式两边乘上 q ( h ∣ v ) q(h|v) q(hv) h h h求积分,

∫ q ( h ∣ v ) log ⁡ p ( v ) d h = ∫ q ( h ∣ v ) log ⁡ p ( v , h ) q ( h ∣ v ) d h + ∫ q ( h ∣ v ) log ⁡ q ( h ∣ v ) p ( h ∣ v ) d h \int q(h|v)\log p(v){d}h=\int q(h|v)\log\frac{p(v,h)}{q(h|v)}{d}h+\int q(h|v)\log\frac{q(h|v)}{p(h|v)}{d}h q(hv)logp(v)dh=q(hv)logq(hv)p(v,h)dh+q(hv)logp(hv)q(hv)dh
log ⁡ p ( v ) = E q ( h ∣ v ) [ log ⁡ p ( v , h ) q ( h ∣ v ) ] + K L ( q ( h ∣ v ) ∣ ∣ p ( h ∣ v ) ) = E q ( h ∣ v ) [ log ⁡ p ( v , h ) − log ⁡ q ( h ∣ v ) ] + K L ( q ( h ∣ v ) ∣ ∣ p ( h ∣ v ) ) = E q ( h ∣ v ) [ log ⁡ p ( v , h ) ] + H [ q ] ⏟ E L B O = L ( v , h , q ) + K L ( q ( h ∣ v ) ∣ ∣ p ( h ∣ v ) ) ⏟ K L ( q ∣ ∣ p ) \log p(v)=E_{q(h|v)}\Big[\log\frac{p(v,h)}{q(h|v)}\Big]+KL(q(h|v)||p(h|v))\\=E_{q(h|v)}\Big[\log{p(v,h)}-\log{q(h|v)}\Big]+KL(q(h|v)||p(h|v))\\=\underset{ELBO=L(v,h,q)}{\underbrace{E_{q(h|v)}\Big[\log{p(v,h)}\Big]+H[q]}}+\underset{KL(q||p)}{\underbrace{KL(q(h|v)||p(h|v))}} logp(v)=Eq(hv)[logq(hv)p(v,h)]+KL(q(hv)p(hv))=Eq(hv)[logp(v,h)logq(hv)]+KL(q(hv)p(hv))=ELBO=L(v,h,q) Eq(hv)[logp(v,h)]+H[q]+KL(qp) KL(q(hv)p(hv))

下一章传送门:白板推导系列笔记(二十六)-sigmoid信念网络

你可能感兴趣的:(哔站机器学习白板推导,机器学习,深度学习)