weixin_30851409

变分贝叶斯（Variational Bayes）

此文公式图片不全。详见博客： http://www.blog.huajh7.com/variational-bayes/

【关键字】平均场理论，变分法，贝叶斯推断，EM算法，KL散度，变分估计，变分消息传递

引言

· 从贝叶斯推断说起

Question：如果我们有一组观测数据D，如何推断产生这些数据的模型m？

模型由1）模型的类别ξ（如高斯分布，伽马分布，多项式分布等）与2）模型的参数Θ共同决定，即 .

模型的选择

假设M为所有可能的模型集合（包括不同类别），那么选择
如何计算p(m | D)?
- 通常情况很难直接计算p(m | D)，根据贝叶斯公式有，p(m)表示模型的先验，p(D | m)表示证据；
- 先验：贝叶斯规则倾向于选择能解释数据的最简单模型：Occam剃刀原理。因为简单模型只在有限范围内做预测，复杂模型（如有更多自由参数）能对更宽范围做预测。

那么如何计算证据（evidence）？
- 参数θ的后验概率为
- 证据p(D | m)通常会在最可能的参数附近有一个很强的峰。
- 以一维参数为例：利用Laplace方法近似，即用被积函数乘以其宽度。即。
- 此处不在深究Occam因子。
- 从模型的选择可以看出参数的估计非常重要。

考虑同一个类别的模型。由于任何模型（函数）都可以由统一的数学形式给出，比如拉格朗日展开，傅里叶极数，高斯混合模型（GMM）等，因而通常我们更关心一个模型的参数Θ。换句话说，给出一组观测数据D，我们总是能够通过估计参数来推测模型，即。或者更简单的形式。

后验概率的估计

通常情况，取后验概率最大的参数值为估计值。根据贝叶斯公式，参数θ后验概率为

，

其中p(D)为归一化常数（normalizing constant）。

从经典的统计学角度看，概率是相对频率的，是真实世界的客观属性。因而每个模型被选择的概率是一样的，因而p(θ) =constant。此时问题转化为：，这便是极大似然法（ML, Maximum Likelihood）。
从贝叶斯学派的角度看，每一个模型都有一个先验概率p(θ)，但先验概率需事先给定。此时问题转化为：，这便是极大后验估计（MAP, Maximum A Posteriori）。

另一方面，许多科学问题的基本部分是计算一个目标函数的积分。Ω通常是高维空间中的一个区域，一般情况下f(x)稍微复杂一些，积分就难以计算。如果f(x)能被分解成一个函数g(x)与一个概率密度函数π(x)的乘积，那么上述积分可看做是g(x)在密度π(x)下的期望。

比如，

（1）计算后验概率：

（2）点估计：

（3）训练样本预测将来的数据的概率密度：假设D’与D条件独立， .

（4）新观测样本D’的隐藏变量(hidden variable) x’的后验分布：

上述积分最简单的近似方法就是通过估计参数θ来估计单点积分值，比如上述贝叶斯选择模型中极大后验估计（MAP）。由于ML、MAP只是估计概率密度而不是概率分布，因而省去了积分过程。ML, MAP估计最常用也最基本的方法是期望最大化算法（Expectation Maximization，EM）。

此外，可以通过蒙特卡洛方法（Monte Carlo），或马氏链蒙特卡洛法（Markov Chain Monte Carlo, MCMC）来模拟积分。此类方法具有较高的精度，但需要大量的计算。

本文介绍一种变分方法来近似积分。其主要思想是，对一个特定模型，构造一种简单（tractable）的数学形式来近似未观测变量的后验分布，同时给出观测数据的边缘似然（或者称证据，evidence）的下界（lower bound）。而积分过程转化为求下界的最优值问题。

· 传统方法的挑战

EM算法

EM算法主要是用于在不完全数据的情况下计算最大似然估计，是一个不断迭代优化的过程。以高斯混合模型为例。给定一些观察数据y,假设y符合如下高斯分布：

Laplace算法

隐马尔科夫模型HMM

再谈马尔科夫链蒙特卡洛(MCMC)

变分贝叶斯

· 前言

变分贝叶斯方法最早由Matthew J.Beal在他的博士论文《Variational Algorithms for Approximate Bayesian Inference》中提出，作者将其应用于隐马尔科夫模型，混合因子分析，非线性动力学，图模型等。变分贝叶斯是一类用于贝叶斯估计和机器学习领域中近似计算复杂（intractable）积分的技术。它主要应用于复杂的统计模型中，这种模型一般包括三类变量：观测变量(observed variables, data)，未知参数（parameters）和潜变量（latent variables）。在贝叶斯推断中，参数和潜变量统称为不可观测变量(unobserved variables)。变分贝叶斯方法主要是两个目的:

(1) 近似不可观测变量的后验概率，以便通过这些变量作出统计推断。

(2) 对一个特定的模型，给出观测变量的边缘似然函数（或称为证据，evidence）的下界。主要用于模型的选择，认为模型的边缘似然值越高，则模型对数据拟合程度越好，该模型产生Data的概率也越高。

对于第一个目的，蒙特卡洛模拟，特别是用Gibbs取样的MCMC方法，可以近似计算复杂的后验分布，能很好地应用到贝叶斯统计推断。此方法通过大量的样本估计真实的后验，因而近似结果带有一定的随机性。与此不同的是，变分贝叶斯方法提供一种局部最优，但具有确定解的近似后验方法。

从某种角度看，变分贝叶斯可以看做是EM算法的扩展，因为它也是采用极大后验估计(MAP)，即用单个最有可能的参数值来代替完全贝叶斯估计。另外，变分贝叶斯也通过一组相互依然（mutually dependent）的等式进行不断的迭代来获得最优解。

· 问题描述

现在重新考虑一个问题：1）有一组观测数据D，并且已知模型的形式，求参数与潜变量（或不可观测变量）的后验分布：P(Z|D)。

正如上文所描述的后验概率的形式通常是很复杂(Intractable)的,对于一种算法如果不能在多项式时间内求解，往往不是我们所考虑的。因而我们想能不能在误差允许的范围内，用更简单、容易理解(tractable)的数学形式Q(Z)来近似P(Z|D),即。

由此引出如下两个问题：

（1）假设存在这样的Q(Z),那么如何度量Q(Z)与P(Z|D)之间的差异性（dissimilarity）？

（2）如何得到简单的Q(Z)?

对于问题一，幸运的是，我们不需要重新定义一个度量指标。在信息论中，已经存在描述两个随机分布之间距离的度量，即相对熵，或者称为Kullback-Leibler散度。

对于问题二，显然我们可以自主决定Q(Z)的分布，只要它足够简单，且与P(Z|D)接近。然而不可能每次都手工给出一个与P(Z|D)接近且简单的Q(Z)，其方法本身已经不具备可操作性。所以需要一种通用的形式帮助简化问题。那么数学形式复杂的原因是什么？在“模型的选择”部分，曾提到Occam's razor，认为一个模型的参数个数越多，那么模型复杂的概率越大;此外，如果参数之间具有相互依赖关系(mutually dependent)，那么通常很难对参数的边缘概率精确求解。

幸运的是，统计物理学界很早就关注了高维概率函数与它的简单形式，并发展了平均场理论。简单讲就是：系统中个体的局部相互作用可以产生宏观层面较为稳定的行为。于是我们可以作出后验条件独立（posterior independence）的假设。即，。

· Kullback-Leibler散度

在统计学中，相对熵对应的是似然比的对数期望，相对熵D(p||q)度量当真实分布为p而假定分布为q时的无效性。

定义两个概率密度函数为p(x)和q(x)之间的相对熵定义为

KL散度有如下性质：

（1）；

（2），当且仅当p=q时为零；

（3）不满足三角不等式。

Q分布与P分布的KL散度为：

或者

由于对数证据logP(D)被相应的Q所固定，为了使KL散度最小，则只要极大化L(Q)。通过选择合适的Q，使L(Q)便于计算和求极值。这样就可以得到后验P(Z|D)的近似解析表达式和证据（log evidence）的下界L(Q)，又称为变分自由能（variational free energy）：

· 平均场理论（Mean Field Method）

数学上说，平均场的适用范围只能是完全图，或者说系统结构是well-mixed，在这种情况下，系统中的任何一个个体以等可能接触其他个体。反观物理，平均场与其说是一种方法，不如说是一种思想。其实统计物理的研究目的就是期望对宏观的热力学现象给予合理的微观理论。物理学家坚信，即便不满足完全图的假设，但既然这种“局部”到“整体”的作用得以实现，那么个体之间的局部作用相较于“全局”的作用是可以忽略不计的。

根据平均场理论，变分分布Q(Z)可以通过参数和潜在变量的划分（partition）因式分解，比如将Z划分为Z₁…Z_M,

注意这里并非一个不可观测变量一个划分，而应该根据实际情况做决定。当然你也可以这么做，但是有时候，将几个潜变量放在一起会更容易处理。

平均场方法的合理性

在量子多体问题中，用一个（单体）有效场来代替电子所受到的其他电子的库仑相互作用。这个有效场包含所有其他电受到的其他电子的库仑相互作用。这个有效场包含了所有其他电子对该电子的相互作用。利用有效场取代电子之间的库仑相互作用之后，每一个电子在一个有效场中运动，电子与电子之间的运动是独立的(除了需要考虑泡利不相容原理)，原来的多体问题转化为单体问题。

同样在变分分布Q(Z)这个系统中，我们也可以将每一个潜变量划分看成是一个单体，其他划分对其的影响都可以用一个看做是其自身的作用。采用的办法是迭代(Iterative VB(IVB) algorithm)。这是由于当变分自由能取得最大值的时候，划分Z_i与它的互斥集Z_-I(或者更进一步，马尔科夫毯(Markov blanket), mb(Z_i) )具有一个简单的关系：

（为保持文章的连贯性，此处先不证明，下文将详细说明）

于是，对于某个划分Z_i ,我们可以先保持其他划分Z_-i不变，然后用以上关系式更新Z_i。相同步骤应用于其他划分的更新，使得每个划分之间充分相互作用，最终达到稳定值。

具体更新边缘概率（VB-marginal）步骤如下：

（1）初始化Q⁽¹⁾(Z_i)，可随机取；

（2）在第k步，计算Z_-i的边缘密度

（3）计算Z_i的边缘密度

（4）理论上将会收敛，则反复执行(2), (3)直到Q(Z_i), Q(Z_-i)稳定，或稳定在某个小范围内。

（5）最后，得

平均场估计下边缘概率的无意义性（VB-marginals）

注意到Q(Z)估计的是联合概率密度，而对于每一个Q_i(Z_i)，其与真实的边缘概率密度P_i(Z_i)的差别可能是很大的。不应该用Q_i(Z_i)来估计真实的边缘密度，比如在一个贝叶斯网络中，你不应该用它来推测某个节点的状态。而这其实是很糟糕的，相比于其他能够使用节点状态信息来进行局部推测的算法，变分贝叶斯方法更不利于调试。

比如一个标准的高斯联合分布P(µ,x)和最优的平均场高斯估计Q(µ,x)。Q选择了在它自己作用域中的高斯分布，因而变得很窄。此时边缘密度Q_x(x)变得非常小，完全与P_x(x)不同。

· 边缘密度（VB-marginal）公式的证明

上文已经提到我们要找到一个更加简单的函数D(Z)来近似P(Z|D)，同时问题转化为求解证据logP(Z)的下界L(Q)，或者L(Q(Z))。应该注意到L(Q)并非普通的函数，而是以整个函数为自变量的函数，这便是泛函。我们先介绍一下什么是泛函，以及泛函取得极值的必要条件。

泛函的概念

【泛函】设对于(某一函数集合内的)任意一个函数y(x)，有另一个数J[y]与之对应，则称J [y]为y(x)的泛函。泛函可以看成是函数概念的推广。这里的函数集合，即泛函的定义域，通常要求y(x) 满足一定的边界条件，并且具有连续的二阶导数．这样的y(x)称为可取函数。

泛函不同于复合函数，例如g=g(f(x)); 对于后者，给定一个x值，仍然是有一个g值与之对应；对于前者，则必须给出某一区间上的函数y(x)，才能得到一个泛函值J[y]。(定义在同一区间上的)函数不同，泛函值当然不同，为了强调泛函值J[y]与函数y(x)之间的依赖关系，常常又把函数y(x)称为变量函数。

泛函的形式多种多样，通常可以积分形式：

泛函取极值的必要条件

泛函的极值

“当变量函数为y(x)时，泛函J [y]取极大值”的含义就是：对于极值函数y(x)及其“附近”的变量函数y(x) + δy(x)，恒有 ;

所谓函数y(x) + δy(x)在另一个函数y(x)的“附近”，指的是：

| δy(x) | < ε;
有时还要求| (δy)’(x) | < ε.

这里的δy(x)称为函数y(x)的变分。

Euler–Lagrange方程

可以仿造函数极值必要条件的导出办法，导出泛函取极值的必要条件，这里不做严格的证明，直接给出。泛函J[y]取到极大值的必要条件是一级变分δJ[y]为0，其微分形式一般为二阶常微分方程，即Euler-Largange方程：

泛函的条件极值

在约束条件下求函数J[y]的极值，可以引入Largange乘子λ，从而定义一个新的泛函，。仍将δy看成是独立的，则泛函在边界条件下取极值的必要条件就是，

问题求解

对于，将右式第一项定义为能量(Energy)，第二项看做是信息熵(Shannon entropy)。我们只考虑自然对数的形式，因为对于任何底数的对数总是可以通过换底公式将其写成自然对数与一个常量的乘积形式。另外根据平均场假设可以得到如下积分形式，

其中，且满足

考虑划分，其中，先考虑能量项(Energy)（第一项），

其中定义，C为的归一化常数。再考虑熵量(entropy)（第二项），

此时得到泛函，

注意到L(Q(Z))并非只有一个等式，如果不可观测变量有M个划分。那么将有M个方程。为了使得L(Q(Z))达到最大值，同时注意到约束条件，根据泛函求条件极值的必要条件，得，

直接求解将得到Gibbs分布，略显复杂;实际上，注意到KL散度，我们可以直接得到KL散度等于0的时候，L(D)达到最大值，最终得到

C为归一化常数，为联合概率函数在除Z_i本身外的其他划分下的对数期望。又可以写为

例子:高斯混合模型（GMM）

Question2 假设现在有独立同分布（i.d.d.）的训练样本X符合下列混合高斯分布

如何求解高斯混合分布的三组参数？

步骤一：选择无信息先验分布（non-informative prior）

先验分布的不是随便取的，一般可以根据共轭分布方法，Jefferys原则，最大熵原则等来确定。一般要求先验分布应取共轭分布（conjugate distribution）才合适，即先验分布h(θ)与后验分布h(θ|x)属于同一分布类型。本文不展开讨论，直接给出

k表示单高斯分布的个数，N表示样本个数，每个分布的解释，

SymDir() 表示K维对称 Dirichlet分布；它是卡方分布（categorical）或多项式分布（multinomial）的共轭先验分布。
W() 表示Wishart分布；对一个多元高斯分布（multivariate Gaussian distribution），它是Precision矩阵（逆协方差矩阵）的共轭先验。
Mult() 表示多项分布（此处也称卡方分布）；多项式分布是二项式分布的推广，表示在一个K维向量中只有一项为1，其它都为0.
N() 为高斯分布，在这里特别指多元高斯分布。

对变量的解释

是N个训练样本，每一项都是服从多元高斯分布的K维向量。
是一组潜在变量，每一项用于表示对应的样本属于哪个混合部分（mixture component）。
表示每个单高斯分布混合比例（mix proportion）
和分别表示每个单高斯分布参数的均值（mean）和精度（precision）

另外，为了区分联合分布的参数，以上分布的参数如又称为超参数（hyperparameter），并且都是已知量。

步骤二：写出联合概率密度函数

用“盘子表示法”（plate notation）表示贝叶斯多元高斯混合模型，如图所示。

小正方形表示不变的超参数，如β₀ ,ν₀ ,α₀ ,µ₀ ,W₀；圆圈表示随机变量，如；圆圈内的值为已知量。其中[K],[D]表示K、D维的向量，[D,D]表示的矩阵，单个K表示一个有K个值的categorical变量；波浪线和一个开关表示变量x_i通过一个K维向量z_i 来选择其他传入的变量(µ_k,Ʌ_k)。

假设各参数与潜在变量条件独立，则联合概率密度函数可以表示为

每个因子为：

其中，

D为各观测点的维度。

步骤三：计算边缘密度(VB- marginal)

（1）计算Z的边缘密度，根据平均场假设，，则

其中，

两边分别取对数可得，

归一化，即对于观测变量的属于某个单高斯分布的概率相加应等于1,则有

，其中

可见是多个单观测多项式分布(single-observation multinomial distribution)的乘积，可以因式分解成一个个以为参数的单观测多项式分布。更进一步，根据categorical分布，有 .

另外，需特别注意的是，在求期望的过程中，由于联合密度可以写成几个因子乘积的形式，而方程是关于Z的函数，因此对于不包含Z的密度函数可以当做常数处理。我们可以用马尔科夫毯（Markov blanket）描述，在一个贝叶斯网络中，它表示一个节点的父节点(parents)，子节点和子节点的父节点（co-parents）,如图所示。我们将在后文中详细说明。

（2）计算π的概率密度，

两边取对数，可见是Dirichlet分布，

其中， .

（3）最后同时考虑，对于每一个单高斯分布有，

经过一系列重组化解将得到Gaussian-Wishart分布，

其中定义，

步骤四：迭代收敛

最后，注意到对π,µ,Ʌ的边缘概率都需要且只需要r_nk；另一方面，r_nk的计算需要ρ_nk，而这又是基于 , , ,即需要知道π,µ,Ʌ的值。不难确定这三个期望的一般表达式为：

这些结果能够导出：。由于需要归一化使得，这样可以从线性相对值转化为绝对值。

再次分析各参数，

参数变量更新方程中的超参数都依赖与统计量，而这些统计量又依赖于 .
参数变量更新方程中的超参数都依赖于统计量，即 .
潜在变量的更新方程对超变量有直接的依赖关系，同时对通过有间接的依赖关系。

这样迭代过程便很清楚了，可以总结为如下两个迭代步骤：

1. 在VBE-Step，用参数和超参数的旧值计算潜在变量；
2. 在VBM-Step，用潜在变量计算参数和超参数的新值。

· 与EM算法的比较

以上迭代步骤与EM算法用ML或MAP解决高斯混合模型很相似。在E-step中，潜在变量r_nk对应于潜在变量关于数据样本的后验概率，如P(Z|X); 统计量对应于EM算法中“soft-count”统计量；用这些统计量去计算参数的新值与EM算法中用“soft-count”计算新参数值一致。

但经过如此，VBEM算法与EM算法还有有很多不同之处的。比如迭代中，逼近最优值的过程是不一样的，如下图所示。在有限制的情况下，EM算法极大似然值是动态变化的。刚开始与当前最优值相差一个KL.在E步骤，下界逼近最大似然值（或者由于条件限制相差一点）；然后在E步骤中，根据新参数重新确定新的似然值。如此往复，直到达到稳定。而在VBEM算法中，极大似然值是不变的。VBE与VBM步骤，都是逼近极大似然值的过程。

EM算法（with constrained）

VBEM算法

进一步讨论

· 再谈EM与VBEM

EM算法计算随机变量（或归类于参数）后验分布的点估计，但估计潜在变量的真实后验分布（至少在soft EM算法，并且经常只当潜在变量是离散化的情况）。这些参数的众数（modes）作为点估计，无任何其他信息。

而在VB算法，计算所有变量的真实后验分布的估计，包括参数和潜在变量。计算点估计的过程中，一般使用在贝叶斯推断中常用的均值（mean）而非众数。与此同时，应该注意的是计算参数在VB中与EM有不同的意义。EM算法计算贝叶斯网络本身的参数的最优值。而VB计算用于近似参数和潜在变量的贝叶斯网络的参数最佳值。正如之前的高斯混合模型例子，对于每一个混合部分都需要计算其参数。EM算法将会直接估计这些参数的最优值；而VB会先找一个合适的参数分布，通常是一个先验分布的形式，然后计算这个分布的参数值，更准确说是超参数，最后得到联合分布的各参数。

· 算法复杂度

· 信息耦合(Intractable Coupling)

改进：变分消息传递(Variational Message Passing, VMP)

从高斯混合模型的例子可以看出，传统的变分贝叶斯方法对模型的推导是繁琐而复杂的。而在推导边缘概率的时候，我们也提到对数联合概率的在一些参数下的期望可以简化，我们只需要关心所求参数的马尔科夫毯上的节点。另外，又认识到许多先验和条件概率属于指数分布族，而对数可以将乘积形式展开为加法。那么，我们是不是可以找到一些简单计算方法或者统一的形式呢？

这便是变分消息传递（Variational Message Passing; John Winn, Bishop 2005）他们考虑了贝叶斯网络中的共轭指数网络（conjugate-exponential networks）,这种方法使得充分统计量（sufficient statistics）与自然参数（natural parameter）都有一个标准形式（standard form），现在该方法已经取代了手工推导(derivation by hand),成为标准的变分贝叶斯推断方法。而对于非共轭指数网络（比如混合模型），也能通过进一步的近似转化为标准形式。

· 贝叶斯网络

变分信息传递方法是建立在贝叶斯网络上的，如图所示，对于一个节点H_j,它的父节点为pa_j，子节点为ch_j,子节点X_k的父节点为。所有节点可以统称为H_j的马尔科夫毯，对于变分贝叶斯推理，我们只需要关系这个模型，H为参数或潜在变量，其父节点为它的超参数，子节点为数据样本， co-parents为其他参数或潜在变量。

具体的，对于混合高斯模型，我们有如下图模型，

· 指数分布族

定义：设是可控参数统计结构，加入其密度函数可表示为如下形式：

并且它的支撑不依赖于θ，则称此结构为指数型的统计结构，简称指数结构，其中的分布族为指数分布族，这里的都与θ无关，且取有限值的B可测函数，k为正整数，h(x)>0，常见指数分布族，如二项分布，二元正态分布，伽马分布。

对于一个条件分布，如果它能写成如下形式，则称它属于指数分布族，

其中称为自然参数（natural parameter）向量，称为自然统计（natural statistic）向量。作为归一化函数使得对于任意的Y都能整合到统一的形式。指数分布族的好处是它的对数形式是可计算的（be tractable to compute）并且它的状态可以用自然参数向量所概括。

共轭指数模型（Conjugate-Exponential Model）当变量X关于父节点Y的条件概率分布P(X|Y)为指数分布族，且为父节点分布P(Y)的共轭先验，那么我们称这样的模型是共轭指数模型。

我们考虑共轭指数模型，这样后验的每个因子与它的先验都有相同的形式，因而我们只需要关心参数的变化，而无需整个函数。所谓相同的形式是指属于同样的分布，比如都属于正态分布，伽马分布，多项式分布等，后面我们将详细说明。

· 自然统计量的期望

如果我们知道自然参数向量，那么我们就能找到自然统计量的期望。重写指数分布族，用ϕ作为参数，g重新参数化( reparameterisation )为则,

对X积分有，

然后对ϕ微分，

得自然统计量的期望，

（1）如何计算？u(X)表示什么意思？

· 变分分布Q在共轭指数模型下的最优化

不失一般性，考虑变分分布的一个因子Q(Y),Y为马尔科夫毯上一个节点,子节点为X，如下图所示。

根据指数族条件分布的一般形式，则变量Y关于父节点的条件概率为，

（2）

的下标Y用于区分不同节点对数条件概率中的各成员。考虑Y的子节点，则X的关于其父节点的条件概率为，

（3）

可以将可以看出Y的先验，作为Y的似然函数。共轭的要求是这两个条件分布具有关于Y相同的函数形式，因而可以通过定义和函数将后者改写成

（4）

为了更新Q(Y),需要找到(2),(3)式关于除Y外其他因子的期望。对任何指数族的自然统计量u的期望都可以用自然参数向量ϕ带入（1）式得到。即对于任何变量Ａ，都可以找到。特别的，当A为被观测量时，我们能直接计算得 .

从(3)，(4)式可以看出与分布成线性关系。而共轭要求对数条件分布也会与所有的成线性，。因而看得出是一个关于u的多线性函数(multi-linear function)。

重新考虑Y的变分更新方程，

其中（5）

正如以上所解释的，和的期望都是关于自然统计量的多线性函数。因而有可能将以上期望重新参数化为

举例：如果X服从，那么

其中

可以重参数化为

· 下界L(Q)的计算

在贝叶斯网络中,由于Q可因式分解，则有

L(Q)被分解为每一个节点上的贡献值（contribution）{L_i}，如节点H_j的贡献值为

在变分消息传递算法中，和在找的后验分布时就已经计算了；在传出消息的时候也已经计算了。这样下界可以是分开计算的，大大降低了计算复杂性。

特别地，对于每个观测变量对下界的贡献值更简单，

· 变分消息传递算法

现在我们已经准确知道节点之间的消息应该由什么样的形式传递，那么定义变分消息传递算法：

来自父节点的消息（Message from parents）：父节点传递给子节点的消息只是自然统计量的期望：

（6）

消息传递给父节点（Message to parents）：依赖于X之前从Y的co-parents接收到的消息；对任何节点A，如果A是被观测量，那么 ,

（7）

用Y接收来自父节点与子节点的所有消息来计算，然后我们就能通过计算更新后的自然参数向量来找到Y的更新后的后验分布，的计算公式如下，

（8）

该式与（5）式一致。从（1）式可以看出自然统计量的期望是的单一函数，这样我们就可以用它来计算期望的新值。变分消息传递算法通过反复迭代的消息传递来最优化变分分布。

完整的算法描述如下，

Step1. 通过初始化相关的矩向量来初始化每个因子分布 .

Step2. 对于每一个节点，

从父节点和子节点接收 (6),(7)式所定义的消息。前提是子节点已经从的co-parents接收到消息。
使用（8）式更新自然参数向量
根据新的参数向量更新距向量

Step3. 计算新的下界（如果需要）

Step4. 如果经过数次迭代已经无法增加下界值，或者各边缘分布达到稳定值，则结束；否则回到第二步。

举例：对于单一高斯模型（univariate Gaussian Model）消息传递过程如下图(a)(b)(c)(d)，

· 混合模型

到目前为止，我们只考虑了来自指数族的分布。而通常来讲混合分布(Mixture Distribution)并非来自指数族，比如高斯混合模型。那么我们是否能将这些混合分布转化为指数族的分布呢？

考虑高斯混合模型，通常有如下形式，

我们可以引入一个离散型潜在变量λ,表示每个观测点是属于哪个单高斯分布。在变分贝叶斯方法中，我们已经举过该例子，故不加以描述。重写分布函数为：

加入该λ变量后该分布属于指数分布族，可写成

如果X有孩子Z，那么共轭条件要求每一个成分都有相同的自然统计向量，统一定义为。另外，我们可能要使模型的其他部分也有相同的形式，虽然不要求共轭，即。在这种情况下，混合模型的每个成分都有相同的形式，我们写成，

其中定义。这样对于每个成分来说条件分布都有了与指数分布族一样的形式。我们便可以应用变分消息传递算法。从某个节点X传递个子节点的消息为，而这是通过混合参数向量计算的。相似地，节点X到父亲节点的消息是那些以它为父节点的子节点发出的，而节点X中哪些属于是由指标变量的后验确定的。最后，从X到的消息是一个K维向量，其中第k个元素为 .

应用

隐马尔科夫模型(Hidden Markov Model, HMM)
混合因子分析(mixture of factor analysers)
非线性动力系统（linear dynamical systems）
图模型（Graphical models）

总结

参考文献

[1] V. Smidl, A.Quinn(2005), The Variational Bayes Method In Signal Processing, Signal and Communication Technology,

[2] Matthew J.Beal(1998), Variational Algorithms for Approximate Bayesian Inference, London, UK: University of Cambridge, PHD. Thesis

[3] John M. Winn(2003), Variational Message Passing and its Applications, University of Cambridge , PHD. Thesis

[4] John M. Winn, M. Bishop(2004), Variational Message Passing, Journal of Machine Learning Research

[5] Wikipedia, Variational Bayesian methods, http://en.wikipedia.org/wiki/Variational_Bayes

[6] Charles W.Fox, Stephen J.Roberts(2011), A tutorial on variational Bayesian inference, Artif Intell Rev

[7] Jason Eisner(2011), High-Level Explanation of Variational Inference, http://www.cs.jhu.edu/~jason/tutorials/variational.html

[8] Michael I. Jordan, Z. Ghahramani(1999), An Introduction to Variational Methods for Graphical Models, Machine Learning.

[9] Tommi S. Jaakkola(2001), Tutorial on variational approximation methods, Advanced mean field methods: theory and practice

转载于:https://www.cnblogs.com/huajh/archive/2012/12/04/2801328.html

你可能感兴趣的:(变分贝叶斯（Variational Bayes）)

《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
放下是一段成长的修行小莳玥
人来到这个世界上，只有两件事：生和死。一件事已经做完了，另一件你还急什么呢?是人，都有七情六欲。是心，都有喜怒哀乐，这些再正常不过了。别总抱怨自己活得累，过得辛苦。永远记住：舒坦是留给死人的。苦，才是生活；累，才是工作；变，才是命运；忍，才是历练；容，才是智慧；静，才是修养；舍，才会得到；做，才会拥有。人生，活得太清楚，才是最大的不明白。有些事，看得很清，却说不清；有些人，了解很深，却猜不透；有些
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
没有一件绝对好看的衣服段童
没有一件绝对好看的衣服只有好看的人没有绝对好看的人只有你可能会爱上的他没有你绝对会爱上的他只有你从来就缺少的那一部分的自己爱是本能的脆弱是欲望的茧——《没有一件绝对好看的衣服》
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
没想到，真没想到一棵落花的树
生活中，每一件小事都蕴藏着他的道理。有些令你意外，却能让你收到更为意外的结果。那一次，我真没想到的事，让我收获了爱。记忆的雨飘落下来，扰乱了我平静的心湖。那是一次数学考试，我破天荒地考了“99”分。我不禁沾沾自喜，这成绩我可不容易得到，妈妈一定会好好表扬我的。回到家，我想妈妈得意的报出成绩，妈妈只是淡淡的说：“嗯，等会儿试卷拿给我看看。”做完作业，我把试卷拿给了妈妈。只见妈妈捧着试卷，眯着眼睛盯着
冬天短期的暴利小生意有哪些？那些小生意适合新手做？一起高省
短期生意不失为创业的一个商机，不过短期生意的商机是转瞬即逝的，而且这类生意也很难作为长期的生意去做，那冬天短期暴利小生意查看更多关于短期暴利小生意的文章有哪些呢?给大家先推荐一个2023年风口项目吧，真很不错的项目，全程零投资，当做副业来做真的很稳定，不管你什么阶层的人，或多或少都网购吧？你们知道网购是可以拿提成，拿返利，拿分佣的吗？你们知道很多优惠券群里面，天天群主和管理发一些商品吗？他们其实在
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
Low Power概念介绍-Voltage Area 飞奔的大虎
随着智能手机，以及物联网的普及，芯片功耗的问题最近几年得到了越来越多的重视。为了实现集成电路的低功耗设计目标，我们需要在系统设计阶段就采用低功耗设计的方案。而且，随着设计流程的逐步推进，到了芯片后端设计阶段，降低芯片功耗的方法已经很少了，节省的功耗百分比也不断下降。芯片的功耗主要由静态功耗（staticleakagepower）和动态功耗(dynamicpower)构成。静态功耗主要是指电路处于等
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
对于写作者最重要的两点：热情和分享鱼和熊掌兼得
【热情】在开头，塔奇曼提到光有热情是不够的。但是，要想长期的坚持写作，没有热情是不行的。很多人都说，这是一个对写作者很优待的时代，也有很多人前仆后继的写作。在写作这条路上的人，始终很多，一些人来了，一些人走了，但是能坚持下来的却只有那么几个。不知道什么时候开始，写作变现这个词火了起来。不管是谁，都想来分一杯羹。可是写作变现真的没有这么容易，鱼哥说过，写作的人千千万万，能变现的也不过是其中的千分之一
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
读《人间鲁迅》有感琳语读书
上周读完《闻一多传》后，我对中国近代知识分子产生了兴趣，这周继续读了《人间鲁迅》。厚厚的两本书，记录了一个人的一生，苦痛，彷徨和挣扎，虽然只读了一小部分，却也心潮澎湃。闻一多和鲁迅是完全不同的。鲁迅是沉郁的，现实的，寂寞的，抗争的。除了天生性格的不同外，环境的塑造也是非常之大。鲁迅少年经历了家庭的变故，看尽了人间冷暖，世态炎凉。这种经历促使他很早就观察思考人生，立志用文学来改变中国国民的劣根。闻一
目前哪里有卖高仿包包，推荐十个渠道已更新富腕表之家
1、工厂购买，推荐微信:【76929666】目前买的人最多的渠道。2、某宝购买，价格较高，质量没有保障。3、拼夕夕，价格是便宜，但是质量不敢想象。4、专柜购买，数量较少，经常断货，价格也太高不好接受。5、批发市场购买，可遇不可求，一般生活在批发市场附近的，根本不用考虑在哪里买高仿包包分几个级别？在当今的包类市场中，广州作为一个知名的货源地，已经成为高仿包行业的一个重要标志。随着市场的需求增加，高仿
2023-07-24 DXZHY
很2023年7月24号星期天，今天呢一早我就去开店，淋完花我就赶去了中心联谊，感谢中心联谊过程当中，他们在唱诵读者上面1.一边流泪，感觉自己的内在灵魂太长，时间没有得到这样了，所以一边唱手一边在流泪，我分不清楚自己是感动了，还是被呼唤的灵魂所能看到，但我就是哭了，泪流满面，我全身细胞在放松，最后我们荣耀完了之后，我打包了一部分回来，我发现我是挺真爱想摸的，然而。那我们商量好之后，他要做出一些违背我
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
一比一复刻手表哪里可以买到？推荐三个可靠渠道腕表世界
在我国，提及一比一复刻手表，人们总是充满好奇与争议。这种高度仿真的复刻手表，凭借其精湛的工艺、时尚的设计，以及与正品相差无几的质感，深受一部分消费者的喜爱。但与此同时，其背后的侵权争议也一直不断。那么，究竟哪里可以买到这些令人心动的一比一复刻手表呢？腕表咨询微信：10428850一、何为一比一复刻手表？一比一复刻手表，指的是严格按照正版手表的设计、尺寸和工艺制作的仿制品。这些手表在材质、外观、功能
提高教师信息素养，提高道德与法治课教学效益长白159宋彦红
提高教师信息素养，提高道德与法治课教学效益随着经济和社会的发展，信息技术已经运用到课堂教学中，为课堂教学展示了一个崭新的天地。的确，信息技术形象、生动、直观性强，能够将课本中的一些抽想的概念直接展示在学生面前，从而调动学生的眼、耳、脑，让他们兴奋起来，变被动学习为主动学习，充分发挥教师的教育引导作用，创造一个可以使学生积极参与的场景。在制作、使用信息技术的实践过程中，本文拟就教师提升信息素养的必要
安徽省这个湖,比西湖大8倍,称是安徽的北戴河, 合肥的后花园旅游小号角
旅游爱好者都知道，安徽省是一个旅游资源十分丰富的省份，且不说黄山、九华山、天柱山这三大名山，单说湖泊就不比其它省份少，今天我们一起走遍世界将为大家说说一个号称安徽北戴河，合肥后花园的湖泊，看看到底是哪个湖泊？话说，这个湖泊位于安徽省六安市舒城县境内，东距合肥50千米，大约一个小时左右的车程，它号称是合肥的后花园，安徽的北戴河。相传，湖畔石壁之上有一奇石神似观音临湖，湖中漂动众多小岛栩栩如佛子，宛若
三梦 | 心碎了还是醉了培根不是肉
今天，让我一起走进彝族火把节。图片发自App“中国彝族火把节之乡·2016布拖民间火把节”在离学校走约一个时辰路程的地方举行，奔着要在如此隆重的节日之中好好欣赏一番的目的，三梦团队一早便和随队的两个孩子整装待发。图片发自App第一部分:吉尔吉呷我万万没有想到，从踏出校门开始，从我牵上那个孩子的手开始，我心的触动就没有停过。图片发自App我以为我这一路会在观察、拍照和思考中度过，但我发现我错了。这个
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人北京大数据苏焕之
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人原创——莫转载粘贴有人选择昙花一现，如大理的花海，有人选择细水长流，如雨夜的浪漫。都说，五分喜欢的人恨不得将他挂在嘴边，十分喜欢的人却只舍得放在心里边了，在爱情眼里，对方说的每一句话都在乎你的感受，TA的眼里也只有你，我想也是这样！说起我的爱情，我也喜欢过一个忧郁的女孩，她喜欢的男孩不喜欢她，于是我成了她倾诉的朋友＋备胎，一年来我们互相推荐伤感的歌曲
虚张声势六月荷清香
绵绵密密的细雨不间断地下个不停，给这初冬的天气添了几份清冷和寂寥。午后的菜市场内没有一个顾客光顾，几个分肉的屠户望着案板上那些没有分完的肉，还在期待着来一个主顾将它们一起买走。贩卖小菜的女人一边漫不经心地择着菜，一边不时打个哈欠，这样的时光正是好睡觉的时候，可是一天的工作没有完成，还是要坚守岗位。喜欢开玩笑的屠户不时说几句黄段子，调侃着胖胖的卖鸡老板娘，大家说说笑笑着以打发这无聊的时光。张屠户打了
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
九月班级管理工作反思追梦蜂
这个月应该算是最难的一个月，我已N年没当班主任，然后我又开始当了。职称是一方面，想到我如果退休了，不能再接触学生了，那该是多么遗憾的事！我的学生梁*铭是我的榜样，她那么努力，那么拼，那么上进，为什么我不行？虽然我面临的工作很难，但是高考数学也不容易。她拿下来了！满分150分她考了146分！我目睹她的艰辛，她的拼搏！还有，我要为我的孩子做榜样，如何竭尽全力，实现梦想。还有，服务，为社会做事，也是会有
一次冒险追梦少年_4509
每个人应该都会经历很多冒险，这样你才能变得坚强起来，变得勇敢起来，冒险就是用来磨练自己，勇气的工具，接下来就给大家说说，我经历过的最吓人的冒险。2016年的夏天我和大爷大娘一起去北地捉知了我们边走边找，我负责拿着罐子大娘拿了一个电灯四处照，大爷就拿着一个棍子负责把知了，弄下来我们边走边捉，一会儿罐子就满了，就在我四处看分神的时候看见了一个知了接着我叫大爷大娘来拿知了我一看旁边没有人，我的心里十分害
又到年末伊人微语
今天，工作群里，各个部门开始提醒老师们上交各种期末总结资料，才蓦然感觉这个学期已接近尾声，才意识到2022即将过去，新的一年的脚步声已经越来越近不由得生阳一些感慨。年纪大了，感觉到每个日子都是“倏”地一声就过去了，来不及思量，来不及回顾，一年就这么过去了。我常常想，为什么会有这样的感觉呢？年轻时候的每一天是24小时，现在的每一天也不曾少过一分钟，为什么就会感觉到它的脚步越来越快呢？后来我想明白了，
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那