七元权

论文阅读 - Understanding Diffusion Models: A Unified Perspective

文章目录

1 概述
2 背景知识
- 2.1 直观的例子
- 2.2 Evidence Lower Bound(ELBO)
- 2.3 Variational Autoencoders(VAE)
- 2.4 Hierachical Variational Autoencoders(HVAE)
3 Variational Diffusion Models(VDM)
4 三个等价的解释
- 4.1 预测图片
- 4.2 预测噪声
- 4.3 预测分数
5 Guidance
- 5.1 Classifier Guidance
- 5.2 Classifier-free Guidance
参考资料

1 概述

假设给定了一个数据集 ${x_1, x_2, x_3, ..., x_N\}$ ，在图像生成任务中，每个 $x_i$ 就是一张图片，每个点都是独立采样于真实数据分布 $p (x)$ 的。生成模型的目的就是通过有限的数据集 ${x_i\}$ 学习得到 $p (x)$ ，然后从 $p (x)$ 中采样得到更多新的样本。在某些情况下，甚至可以使用 $p (x)$ 来估计某个数据出现的概率。

作者认为，生成模型可以分为三大类：
（1）GAN：通过对抗的方式进行学习，本文不会讲这块
（2）likelihood-based：学习一个使得当前数据集出现概率最高的模型，包括autoregressive models，normalizing flows和VAEs等等
（3）energy-based：将分布学习为任意灵活的能量函数，然后归一化。score-based和energy-based很相似，学的是energy-based model的score。

在某些地方，会讲（2）和（3）都统称为likelihood-based models，而将（1）称为implicit generative models。

而本文重点要讲的Diffusion Model(DM)，既可以用likelihood-based的观点来解释，也可以使用score-based的观点来解释。

2 背景知识

2.1 直观的例子

作者在这里引用了柏拉图的地穴寓言来辅助读者理解DM的直观思想，即我们观测到的数据 $x$ 是由隐变量 $z$ 生成的，根据观测到的 $x$ 来估计出隐变量 $z$ ，就可以通过构造隐变量 $z$ 来生成 $x$ 。

如图2-1所示，地穴寓言讲的是一群人一生都被锁在洞穴里，只能看到投射到他们面前墙壁上的二维阴影，这些阴影是由看不见的三维物体在大火前经过而产生的。对这样的人来说，他们所观察到的一切实际上都是由他们永远看不到的高维抽象概念所决定的。

图2-1 地穴寓言示意图

类似的，其实我们现实生活中看到的三维物体，也可能是其他维度的物体投影产生的。

我们的生成模型，就是想从观测到的 $x$ 中，抽象出隐变量 $z$ ，这里 $z$ 的维度通常是低于 $x$ 的，这是为了抽象出对生成图片真正有用的信息，比如颜色，尺寸，形状等等。

2.2 Evidence Lower Bound(ELBO)

接下来从数学的角度进行说明，我们将隐变量 $z$ 和观测数据 $x$ 的联合分布写作 $p (x, z)$ ，根据"likelihood-based"的观点，我们的目的是最大化 $p (x)$ 。 $p (x)$ 和 $p (x, z)$ 之间的关系，有两种写法：
（1）积分角度
$\int p(x,z) dz \tag{2-1}$

（2）条件概率角度
$\frac{p(x,z)}{p(z|x)} \tag{2-2}$

根据式 $(2 - 1)$ 直接算的话，没打算，因为 $z$ 这个隐变量是未知的，如何积分也就未知了；根据式 $(2 - 2)$ 算也不行，因为 $p (z ∣ x)$ 也是未知的。那么我们为了最大化 $p (x)$ ，就需要给它找一个代理目标。

我们设计一个模型，叫做 $q_\phi(z|x)$ ，这个也就是后面会说到的encoder，即根据观测值 $x$ 预测隐变量 $z$ 。这个 $q_\phi(z|x)$ 就是通过优化参数 $\phi$ 来逼近真实分布 $p (z ∣ x)$ 的。由于 $\int q_\phi (z|x) dz$ ，所以有

$\begin{align} logp(x) &= logp(x)\int q_\phi (z|x)dz \\ &= \int q_\phi (z|x)(logp(x))dz &\qquad (与z无关的常量拿进来) \\ &= E_{q_\phi (z|x)}[logp(x)] &\qquad (期望的定义)\\ &= E_{q_\phi (z|x)}[log \frac{p(x,z)}{p(z|x)}] &\qquad (式2-2) \\ &= E_{q_\phi (z|x)}[log \frac{p(x,z)q_\phi (z|x)}{p(z|x)q_\phi (z|x)}] &\qquad \\ &= E_{q_\phi (z|x)}[log \frac{p(x,z)}{q_\phi (z|x)}] + E_{q_\phi (z|x)}[log \frac{q_\phi (z|x)}{p(z|x)}]&\qquad \\ &= E_{q_\phi (z|x)}[log \frac{p(x,z)}{q_\phi (z|x)}] + D_{KL}(q_\phi(z|x) || p(z|x))&\qquad (KL散度的定义)\\ &\geq E_{q_\phi (z|x)}[log \frac{p(x,z)}{q_\phi (z|x)}] &\qquad (KL散度必然不小于0) \end{align} \tag{2-3}$

这里 $E_{q_\phi (z|x)}$ 表示的是给定 $x$ ，根据 $\sim q_\phi (z|x)$ 采样得到的所有 $z$ 下的期望。还想不明白，可以从离散的角度思考一下，遍历所有的 $z$ 去算期望，只不过每个 $z$ 有对应的概率 $q_\phi (z|x)$ 。

推导到这里， $l o g p (x)$ 的下界就出现了，为了突出其重要性，这里单独再写一下
$E_{q_\phi (z|x)}[log \frac{p(x,z)}{q_\phi (z|x)}] \tag{2-4}$

式 $(2 - 4)$ 就是ELBO，其中evidence就是指的 $l o g p (x)$ ，其lower bound就是式 $(2 - 4)$ 。

我们来分析一下式 $(2 - 3)$ ，它与 $l o g p (x)$ 之间只相差了一个KL散度 $D_{KL}(q_\phi(z|x) || p(z|x))$ ， $D_{KL}(q_\phi(z|x) || p(z|x))$ 表示了模型学习的分布 $q_\phi(z|x)$ 与真实分布 $p (z ∣ x)$ 之间的距离。由于 $x$ 是我们的数据集，是固定不变的，因此 $l o g p (x)$ 就是一个常数，因此式 $(2 - 4)$ 越大， $D_{KL}(q_\phi(z|x) || p(z|x))$ 就越小， $q_\phi(z|x)$ 与 $p (z ∣ x)$ 就越接近。总而言之，就是可以通过最大化式 $(2 - 4)$ 来最小化KL散度 $D_{KL}(q_\phi(z|x) || p(z|x))$ 。 $D_{KL}(q_\phi(z|x) || p(z|x))$ 没法直接最小化，因为 $p (z ∣ x)$ 是不知道的。

除此之外，训练好之后，式 $(2 - 4)$ 会和 $l o g p (x)$ 很接近，因此可以当做 $l o g p (x)$ 来估计观测数据或者生成数据的出现概率。

2.3 Variational Autoencoders(VAE)

在介绍VAE之前，读者最好对VAE有个初步的认识，可以参考我的另一篇博客论文阅读 - Jukebox: A Generative Model for Music。

图2-2 VAE模型示意图

我们令 $q_\phi(z|x)$ 为VAE中的encoder， $p_\theta(x|z)$ 为VAE中的decoder，对式 $(2 - 4)$ 进行变形，则有

$\begin{align} E_{q_\phi (z|x)}[log \frac{p(x,z)}{q_\phi (z|x)}] &= E_{q_\phi (z|x)}[log \frac{p_\theta(x|z)p(z)}{q_\phi (z|x)}] \\ &= E_{q_\phi (z|x)}[log p_\theta(x|z)] + E_{q_\phi (z|x)}[log \frac{p(z)}{q_\phi (z|x)}] \\ &= E_{q_\phi (z|x)}[log p_\theta(x|z)] - D_{KL}(q_\phi (z|x) || p(z)) \end{align} \tag{2-5}$

这里的第一个等号，我认为并不能直接等过来，因为 $p_\theta(x|z)$ 只是 $p (x ∣ z)$ 的一个估计，而且取决于模型的训练效果，这里存疑，之后想明白了这里会改过来。

我们假设已经等过来了，那么式 $(2 - 5)$ 的前一项 $E_{q_\phi (z|x)}[log p_\theta(x|z)]$ 表示的是decoder重建图片的似然度，称作reconstruction term；后一项 $D_{KL}(q_\phi (z|x) || p(z))$ 表示经过encoder得到的 $z$ 的分布与先验 $p (z)$ 之间的距离，称作prior matching term。

将ELBO最大化，就相当于最大化reconstruction term，同时最小化prior matching term。

VAE的encoder通常被设计为对角方差的多元高斯，所谓对角方差，就是没有协方差的意思，如下式 $(2 - 6)$ 所示。

$q_\phi (z|x) = N(z;\mu_\phi(x), \sigma_\phi ^2(x)I) \tag{2-6}$

与其对应的prior为标准的多元高斯，如下式 $(2 - 6)$ 所示。

$\tag{2-7}$

结合式 $(2 - 6)$ 和式 $(2 - 6)$ ，式 $(2 - 5)$ 的后一项，也就是KL散度这项是可以算出解析解的，而式 $(2 - 5)$ 的前一项则通过蒙特卡洛估计得到，也就是连续离散，使用有限的数据集来估计期望 $E_{q_\phi (z|x)}[log p_\theta(x|z)]$ 。

于是，我们的目标函数可以写成

$arg\max_{\phi,\theta}E_{q_\phi(z|x)}[logp_\theta(x|z)] - D_{KL}(q_\phi (z|x) || p(z)) = \\ arg\max_{\phi,\theta}\sum_{l=1}^Llogp_\theta(x|z^{(l)}) - D_{KL}(q_\phi (z|x) || p(z)) \tag{2-8}$

其中， ${z^{(l)}}_{l=1}^L$ 是从 $q_\phi(z|x)$ 中采样得到的，也就是数据集的图片过一遍encoder。不过这里有一个问题，就是每个 $z^{(l)}$ 都是通过随机高斯分布采样的过程得到的，没有办法求导。为了解决这个问题，就有了重参化技巧，重参化的精妙之处在于使用标准的随机过程构造任意随机过程，学习只学习构造的参数，而随机过程是不参与梯度计算的。

举个例子，假设随机过程为 $\sim N(x;\mu, \sigma^2)$ ，这可以写作

$\mu + \sigma \epsilon, \epsilon \sim N(0, I)$

在VAE当中，任意一次从 $q_\phi (z|x)$ 中对 $z$ 的采样可以表示为

$\mu_\phi(x) + \sigma_\phi(x) \odot\epsilon, \epsilon \sim N(0, I)$

其中， $\odot$ 表示element-wise的乘积。

VAE就是借助与重参化的技巧和蒙特卡洛估计来同时更新 $\phi$ 和 $\theta$ 的。

训练完成后，只需要在 $p (z) = N (z; 0, I)$ 上进行采样，输入decoder就可以得到预测的结果了，encoder已经不需要了。

$z$ 的维度通常大大小于 $x$ ，这样可以迫使模型学习最有用的特征表示。

2.4 Hierachical Variational Autoencoders(HVAE)

HVAE就是在VAE的基础上再增加了多层的隐变量，也就是隐变量也是通过更深一层的隐变量生成的。一般情况下，HVAE中的每一层隐变量 $z_t$ 是由其之前的所有隐变量决定的，不过本文只针对马尔可夫过程的HVAE，也就是 $z_t$ 仅由 $z_{t+1}$ 决定，这也被称为MHVAE，如下图2-3所示。

图2-3 MHVAE示意图

此时， $x$ 和 $z_t$ 的联合概率可以写作（也就是图2-3上方乘起来）

$z_{1:T}) = p(z_T)p_\theta(x|z_1)\prod_{t=2}^Tp_\theta(z_{t-1}|z_t) \tag{2-9}$

后验概率可以写作（也就是图2-3下方乘起来）
$q_\phi (z_{1:T}|x) = q_\phi(z_1|x)\prod_{t=2}^Tq_\phi(z_t|z_{t-1}) \tag{2-10}$

此时的ELBO可以被改写为

$\ \tag{2-11}$
其中，最后一步用到了琴生不等式，这也是式 $(2 - 3)$ 的另一种推导方式。

将式 $(2 - 9)$ 和式 $(2 - 10)$ 代入式 $(2 - 11)$ 可以得到

$E_{q_\phi (z_{1:T}|x)}[log \frac{p(x,z_{1:T})}{q_\phi (z_{1:T}|x)}] = E_{q_\phi (z_{1:T}|x)}[log\frac{p(z_T)p_\theta(x|z_1)\prod_{t=2}^Tp_\theta(z_{t-1}|z_t)}{q_\phi(z_1|x)\prod_{t=2}^Tq_\phi(z_t|z_{t-1})}] \tag{2-12}$

式 $(2 - 12)$ 将在下文的VDM中被拆解为可解释的多个部分。

3 Variational Diffusion Models(VDM)

一种理解VDM最简单的思路，就是将VDM看成MHVAE，如图3-1所示，不过需要满足三个额外的限制：
（1）隐变量的维度需要和输入图片维度一致
（2）encoder的每一步不是学习得到的，是事先设计好的线性高斯分布。换句话说，每一步是以上一步为中心的高斯分布
（3）每一步的高斯分布参数会发生一定的变化，使得最后一步接近标准高斯分布

图3-1 VDM示意图

根据第一点限制，我们不用分 $z$ 和 $x$ 了，统一使用 $x_t$ 来表示任意时刻的数据即可。当 $t = 0$ 时， $x_0$ 指的是原始图片。当 $t\in [1,T]$ 时，表示对应步数的数据。如此以来，后验概率式 $(2 - 10)$ 可以写成

$q_\phi (x_{1:T}|x_0) = \prod_{t=1}^Tq_\phi(x_t|x_{t-1}) \tag{3-1}$

根据第二点限制，每一步的高斯参数人为设计为 $\mu_t(x_t) = \sqrt{\alpha_t}x_{t-1}$ ， $\Sigma_t(x_t) = (1-\alpha_t)I$ ，其中 $\alpha_t$ 是一个潜在的可学习的参数，这里是个超参数，随着步数的变化而变化。因此，有

$q(x_t|x_{t-1}) = N(x_t;\sqrt{\alpha_t}x_{t-1}, (1-\alpha_t)I) \tag{3-2}$

根据第三点限制，最终的分布 $p(x_T)$ 是一个标准的高斯分布，其本质是真实分布逐渐变为标准高斯分布的过程。因此，式 $(2 - 9)$ 可以写作

$p(x_{0:T}) = p(x_T)\prod_{t=1}^Tp_\theta(x_{t-1}|x_t) \tag{3-3}$

其中， $p(x_T)=N(x_T;0, I)$ 。

在VDM中， $q(x_t|x_{t-1})$ 是人为事先设计的，已经与参数 $\phi$ 没有关系了，所以我们需要学习的参数只有 $p_\theta(x_{t-1}|x_t)$ 中的 $\theta$ 而已。当VDM整个模型训练好之后，只需要在标准高斯分布 $p(x_T)=N(x_T;0, I)$ 中采样，再一步步经过 $p_\theta(x_{t-1}|x_t)$ 生成图片即可。

VDM的优化也是通过最大化ELBO的，推导过程为

$\ \tag{3-4}$

最终得到的结果可以被解释为reconstruntion term，prior matching term和consistency term三项。

reconstruction term和VAE中的很像，就是最终生成图片的似然概率，训练方式也和VAE中的类似。也就是要是的生成的图片和真实图片越接近越好。

proir matching term这一项没有训练参数，当 $T$ 足够大时， $q(x_T|x_{T-1})$ 会趋近于 $N(x_T;0, I)$ ，因此这项可以认为是0。

consistency term是为了保证正向的过程和逆向的过程是一致的，也就是加噪声和去噪声是需要一致的。这也是训练的主导项。

图3-2 VDM的第一种推导示意图

在这种推导方式下，ELBO的所有项都是期望，因此可以通过蒙特卡洛方法来进行估计。但是，实际使用式 $(3 - 4)$ 进行估计的方案是次优的，因为consistency term的每一步都有两个随机变量 ${x_{t-1}, x_{t+1}\}$ ，这种情况下的蒙特卡洛估计方差会大于只有一个随机变量的方式。这是为啥，我也不太清楚，姑且就假设这是一个正确的结论吧。

因此，为了将期望当中的随机变量变为一个，我们要进行一些改动。由于整个过程是满足马尔可夫链的，因此 $x_t$ 只由 $x_{t-1}$ 决定，于是就有 $q(x_t|x_{t-1}) = q(x_t|x_{t-1}, x_0)$ 。根据贝叶斯定理，每一次的正向加噪过程可以写作

$q(x_t|x_{t-1}, x_0) = \frac{q(x_{t-1}|x_t, x_0)q(x_t|x_0)}{q(x_{t-1}|x_0)} \tag{3-5}$

基于式 $(3 - 5)$ ，可以重新推导ELBO

$\ \tag{3-6}$

推导的结果又可以被解释为三项，分别是reconstruntion term，prior matching term和denoising matching term。

reconstruntion term没有发生变化，仍旧是生成图片的似然度，可以和VAE一样使用蒙特卡洛估计来进行优化

prior matching term没有可训练的参数，表示最终加满噪声的图片和标准高斯分布的距离，可以认为是0

denoising matching term表示去噪过程是否和加噪过程一致。 $q(x_{t-1}|x_t, x_0)$ 可以认为是GT，也就是真实的去噪过程。 $p_\theta(x_{t-1}|x_t)$ 要尽可能和 $q(x_{t-1}|x_t, x_0)$ 一致。

图3-3 VDM的第二种推导示意图

值得一提的是，式 $(3 - 5)$ 和式 $(3 - 6)$ 的整个推导过程，只用到了马尔可夫假设，因此适用于任意的MHVAE。当 $T = 1$ 时，式 $(3 - 5)$ 和式 $(3 - 6)$ 都变成了式 $(2 - 5)$ 。

式 $(3 - 6)$ 中的主导项还是最后一项denoising matching term。根据贝叶斯定理，我们有

$q(x_{t-1}|x_t, x_0) = \frac{q(x_t|x_{t-1}, x_0)q(x_{t-1}|x_0)}{q(x_t|x_0)} \tag{3-7}$

其中，根据式 $(3 - 2)$ 有 $q(x_t|x_{t-1}, x_0) = q(x_t|x_{t-1}) = N(x_t;\sqrt{\alpha_t}x_{t-1}, (1-\alpha_t)I)$ ，目前需要确定的就是 $q(x_{t-1}|x_0)$ 和 $q(x_t|x_0)$ 。根据重参化技巧，对于 $x_t \sim q(x_t|x_{t-1})$ 可以写作

$x_t = \sqrt{\alpha_t}x_{t-1} + \sqrt{1-\alpha_t}\epsilon \tag{3-8}$

同理，有

$x_{t-1} = \sqrt{\alpha_{t-1}}x_{t-2} + \sqrt{1-\alpha_{t-1}}\epsilon \tag{3-9}$

不断地迭代，代入，可以得到

$\begin{align} x_t &= \sqrt{\prod_{i=1}^t \alpha_i}x_{0} + \sqrt{1 - \prod_{i=1}^t \alpha_i}\epsilon \\ &= \sqrt{\overline{\alpha}_t}x_0 + \sqrt{1-\overline{\alpha}_t}\epsilon \\ &\sim N(x_t; \sqrt{\overline{\alpha}_t}x_0, 1-\overline{\alpha}_t I) \end{align} \tag{3-10}$

这里省略了推导过程，想了解的可以参见原文。

式 $(3 - 10)$ 就是 $q(x_t|x_0)$ ，其重大意义在于，任意的 $x_t$ 不用一步步加噪声，而是可以直接通过 $x_0$ 得到了。 $q(x_{t-1}|x_0)$ 同理也可以得到，这里就不赘述了。

回到式 $(3 - 7)$ ，我们有

$\ \tag{3-11}$

回到式 $(3 - 6)$ 的denoising matching term，这里注意到 $\Sigma_q(t)=\sigma_q^2(t)I$ 是一个常数，所以我们也可以将 $p_\theta(x_{t-1}|x_t)$ 的方差设置为同样的常数。

两个高斯分布之间的KL散度的计算公式为

$D_{KL}(N(x;\mu_x, \Sigma_x)||N(y;\mu_y, \Sigma_y)) = \frac{1}{2}[log\frac{|\Sigma_y|}{|\Sigma_x|} -d + tr(\Sigma_y^{-1}\Sigma_x) +(\mu_y-\mu_x)^T\Sigma_y^{-1}(\mu_y - \mu_x)] \tag{3-12}$

于是就有

其中， $\mu_\theta$ 和 $\mu_q$ 是 $\mu_\theta(x_t, t)$ 和 $\mu_q(x_t, x_0)$ 的简写。

根据式 $(3 - 11)$ 有

$\mu_q(x_t, x_0) = \frac{\sqrt{\alpha_t}(1-\overline{\alpha}_{t-1})x_t+\sqrt{\overline{\alpha}_{t-1}}(1-\alpha_t)x_0}{1-\overline{\alpha}_t} \tag{3-13}$

我们可以将 $\mu_\theta(x_t, t)$ 设计为

$\mu_\theta(x_t, t) = \frac{\sqrt{\alpha_t}(1-\overline{\alpha}_{t-1})x_t+\sqrt{\overline{\alpha}_{t-1}}(1-\alpha_t)\hat{x}_\theta(x_t, t)}{1-\overline{\alpha}_t} \tag{3-14}$

这里的 $\hat{x}_\theta(x_t, t)$ 就是我们的设计的神经网络，输入是噪声图片 $x_t$ 和步数索引 $t$ ，输出是生成的图片。

denoising matching term可以写作

$\ \tag{3-15}$

于是，VDM就变成了学习一个神经网络，在任意的加噪步的位置预测出原始图片 $x_0$ ，将所有时间步的期望求和，就有

$arg\min_\theta E_{t\sim U\{2, T\}}[E_{q(x_t|x_0)}D_{KL}(q(x_{t-1}|x_t,x_0)||p_\theta(x_{t-1}|x_t))] \tag{3-16}$

4 三个等价的解释

VDM可以设计网络来预测图片，设计网络来预测噪声，也可以设计网络来预测分数，接下来分别讲一下。

4.1 预测图片

预测图片的方式就是式 $(3 - 15)$ 中描述的方式，即将网络设计为 $\hat{x}_\theta(x_t, t)$ 来预测原始图片，这里不在赘述。

4.2 预测噪声

将式 $(3 - 10)$ 做一个变形可以得到

$x_0 = \frac{x_t - \sqrt{1 - \overline{\alpha}_t}\epsilon}{\sqrt{\overline{\alpha}_t}} \tag{4-1}$

将其代入式 $(3 - 13)$ 可以得到

$\ \tag{4-2}$

于是，我们重新设计 $\mu_\theta(x_t, t)$ 为

$\mu_\theta(x_t, t) = \frac{1}{\sqrt{\alpha_t}}x_t - \frac{1-\alpha_t}{\sqrt{1-\overline{\alpha}_t}\sqrt{\alpha_t}}\hat{\epsilon}_\theta(x_t, t) \tag{4-3}$

对应的denoising matching term可以写作

$\ \tag{4-4}$
其实可以认为是把 $x_0$ 用 $\epsilon$ 来表示，然后系数什么变了一下。从理论上来说，预测原图 $x_0$ 和预测噪声 $\epsilon$ 是等价的。

但是从实际经验上来说，预测噪声 $\epsilon$ 的效果会更好一些。

4.3 预测分数

预测分数的推导需要借助于Tweedie’s formula，从数学的角度来说，对于高斯变量 $\sim N(z;\mu_z, \Sigma_z)$ ，Tweedie’s formula指出

$E[\mu_z|z] = z+\Sigma_z\nabla_zlogp(z) \tag{4-5}$

不知道这个公式怎么来的没关系，这是个结论，我们暂且认为它是对的。

对于式 $(3 - 10)$ 使用Tweedie’s formula，可以得到

$E[\mu_{x_t}|x_t] = x_t + (1 - \overline{\alpha}_t)\nabla_{x_t}logp(x_t) \tag{4-6}$

后面为了方便表示，将 $\nabla_{x_t}logp(x_t)$ 简写为 $\nabla logp(x_t)$ 。根据式 $(3 - 10)$ ，有 $\mu_{x_t}=\sqrt{\overline{\alpha}_t}x_0$ ，再结合式 $(4 - 6)$ 就有

$\sqrt{\overline{\alpha}_t}x_0 = x_t + (1 - \overline{\alpha}_t)\nabla_{x_t}logp(x_t) \\ x_0 = \frac{x_t + (1 - \overline{\alpha}_t)\nabla_{x_t}logp(x_t)}{\sqrt{\overline{\alpha}_t}} \tag{4-7}$

然后，和4.2一样的套路，将其代入式 $(3 - 13)$ ，可以有

$\ \tag{4-8}$

于是，我们重新设计 $\mu_\theta(x_t, t)$ 为
$\mu_\theta(x_t, t) = \frac{1}{\sqrt{\alpha_t}}x_t + \frac{1 - \alpha_t}{\sqrt{\alpha_t}}s_{\theta}(x_t, t) \tag{4-9}$

对应的denoising matching term可以写作

$\ \tag{4-10}$

这里的 $s_\theta(x_t, t)$ 就是一个用来预测score function $\nabla_{x_t}logp(x_t)$ 的神经网络。用心的读者可以发现， $\nabla_{x_t}logp(x_t)$ 和 $\epsilon$ 很像。我们结合式 $(4 - 7)$ 和式 $(4 - 1)$ 可以得到

$\ \tag{4-11}$

可以看出，就是差了一个缩放系数常数。同时也可以发现，他们的正负号是相反的，也就是说，往加噪的反方向来去噪是最佳更新模型参数的路径。

5 Guidance

到目前为止，我们的重心都放在真实数据的分布 $p (x)$ 上，但我们通常更加关注某些条件下的真实数据分布 $p (x ∣ y)$ 。这可以让我们在一定程度上控制生成的图片。

一个很自然的想法就是在每一步都加上条件，于是式 $(3 - 3)$ 可以改写为
$p(x_{0:T}|y) = p(x_T)\prod_{t=1}^Tp_\theta(x_{t-1}|x_t, y) \tag{5-1}$

$y$ 可以是文本，可以是其他图片，也可以是一个类别。对应到章节4中的三种解释，VDM的目标就变成了 $\hat{x}_\theta (x_t, t, y) \approx x_0$ ，或者 $\hat{\epsilon}_\theta (x_t, t, y) \approx \epsilon$ ，或者 $s_\theta(x_t, t, y) \approx \nabla log p(x_t|y)$ 。

目前有两种主流的控制方式，分别是Classifier Guidance和Classifier-free Guidance。

5.1 Classifier Guidance

我们使用基于分数的公式来进行说明，目标就是学习 $\nabla log p(x_t|y)$ 。根据贝叶斯公式，我们有

$\ \tag{5-2}$

其中，第二行的 $p (y)$ 关于 $x_t$ 的导数是0，就没有了。

最终，式 $(5 - 2)$ 可以理解为无条件分数和一个分类器 $p(y|x_t)$ 的梯度。

为了更加细粒度地控制条件的重要程度，还会加上一个超参数 $\gamma$ ，于是就有

$\nabla log p(x_t|y) = \nabla log p(x_t) + \gamma \nabla log p(y|x_t) \tag{5-3}$

当 $\gamma = 0$ 时，就是无条件的，当 $\gamma$ 很大时，会依赖于条件，往往会损失生成结果的多样性。

Classifier Guidance的缺点就是需要处理任意噪声输入，没有可以直接使用的预训练好的classifier，需要和VDM一起进行训练。

5.2 Classifier-free Guidance

Classifier-free Guidance的方案不需要单独的分类模型。

将式 $(5 - 2)$ 做一些变形，可以得到

$\nabla log p(y|x_t) = \nabla log p(x_t|y) - \nabla log p(x_t) \tag{5-4}$

将式 $(5 - 4)$ 代入式 $(5 - 3)$ 可以得到

同样， $\gamma$ 是一个控制我们学习的条件模型对条件信息的关注程度的超参数。当 $\gamma=0$ 时，学习的条件模型完全忽略条件器并学习无条件扩散模型；当 $\gamma=1$ 时，该模型在没有指导的情况下显式地学习条件分布；当 $\gamma>1$ 时，扩散模型不仅优先考虑条件得分函数，而且在远离无条件得分函数的方向上移动。换句话说，它降低了生成不使用条件信息的样本的概率，有利于显式地使用条件信息的样本。

由于学习两个独立的扩散模型是昂贵的，我们可以同时学习条件和无条件扩散模型作为一个单一的条件模型。无条件扩散模型可以通过用诸如零的固定常数值替换条件信息来查询，这本质上是对条件信息进行dropout。

Classifier-free Guidance是优雅的，因为它使我们能够更好地控制我们的条件生成过程，同时只需要正常的扩散模型训练。

参考资料

[1] Understanding Diffusion Models: A Unified Perspective
[2] 一文解释经验贝叶斯估计, Tweedie’s formula

你可能感兴趣的:(论文阅读,扩散模型,深度学习,图像生成,Diffusion,model,论文阅读)

深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
LLaMA Factory 微调后，迁移模型激进小猪1002 llama llamafactory 人工智能 python
方法1：使用HuggingFaceHub（最推荐）fromtransformersimportAutoModelForCausalLM,AutoTokenizer#在源服务器上保存模型到Hubmodel.push_to_hub("your-username/your-model-name")tokenizer.push_to_hub("your-username/your-model-name")
腾讯混元3D制作角色模型的教程-2 速易达网络数字媒体专业课程 3d
图生3D，这是一个非常具体的操作指导需求。用户可能是设计师、游戏开发者或3D建模爱好者，希望快速掌握如何利用腾讯混元3D技术通过图片生成3D模型。基础操作：在线平台快速生成步骤1：访问平台登录腾讯混元3D创作引擎官网：https://3d.hunyuan.tencent.com。步骤2：上传图片点击“图生3D”（Imageto3D）功能，上传本地图片。建议：非透明背景图片勾选“RemoveBack
2024年AI 智能助手（大模型）产品市场分析｜商派徐礼昭｜商派软件市场负责人人工智能
一、引言人工智能的浪潮不断向前推进，智能助手作为其中的重要应用，已经逐渐渗透到我们生活的各个方面。它们以其便捷性和个性化的特点，改变了我们与世界的互动方式。本报告将对AI智能助手进行全面的行业分析，包括行业概况、主要玩家、用户数据、发展要素以及未来趋势等方面，并通过具体案例分享，帮助读者深入了解这一领域的现状和未来发展潜力。二、行业概览（一）智能助手的定义和发展阶段智能助手是利用人工智能技术为用户
大模型RLHF强化学习笔记（一）：强化学习基础梳理Part1 Gravity! 大模型笔记大模型 LLM 算法机器学习强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.1Intro定义：强化学习是一种机器学习方法，需要智能体通过与环境交互学习最优策略基本要素：状态（State）：智能体在决策过程中需要考虑的所有相关信息（环境描述）动作（Action）：在环境中可以采取的行为策略（Policy）：定义了在给定状态下智能体应该选择哪个动作，目标是最大化智能体的长期累积奖
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
【LlamaIndex核心组件指南 | 模型篇】一文通晓 LlamaIndex 模型层：LLM、Embedding 及多模态应用全景解析
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
2025 VUE常见面试题 hmildj vue.js 面试前端
前言总结一些VUE面试的基础知识，共同学习1.什么是Vue？答案：Vue.js（通常简称为Vue）是一个用于构建用户界面的‌渐进式JavaScript框架，Vue3是Vue.js框架的最新版本，它引入了许多改进和优化，包括性能提升、更好的类型支持、组合API等。2.MVVM模式是什么？Vue如何体现这一模式？‌答案：MVVM将视图（View）与数据（Model）通过ViewModel层解耦，Vue
高斯混合模型（Gaussian Mixture Model, GMM）不想秃头的程序神经网络语音识别人工智能深度学习网络
高斯混合模型（GaussianMixtureModel,GMM）是一种概率模型，用于表示数据点由多个高斯分布（GaussianDistribution）混合生成的过程。它广泛应用于聚类分析、密度估计、图像分割、语音识别等领域，尤其适合处理非球形簇或多模态数据。以下是GMM的详细介绍：一、核心思想GMM假设数据是由多个高斯分布混合生成的，每个高斯分布代表一个簇（Cluster），并引入隐变量（Lat
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
平台再升级！接入DeepSeek AI，三大能力一键生成橙武科技低代码 AI deepseek 人工智能
在数字化项目落地过程中，很多企业都会面临相同的问题：数据库建模要写SQL表结构；业务流程需要画LogicFlow流程图；前端页面还要写AMISJSON配置。从想法到实现，中间至少要经历产品经理、架构师、后端、前端多轮沟通。每个环节都耗时，改起来还要推翻重来。demo地址：https://admin.cwcode.top✨我们的平台，现在直接整合了DeepSeekAI大模型只要输入一句需求，就能：✅
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
✨【Blender/Houdini 渲染必看】CPUⓥⓢGPU？3 分钟选对算力不踩坑！渲染101专业云渲染 blender houdini 分布式服务器 maya
核心问题速答Q：渲染该选CPU还是GPU？✅CPU：复杂场景/批量渲染/预算可控首选✅GPU：单帧速度/实时预览/急单交付必选维度1：硬件硬刚——CPU凭啥赢麻了？▫️多线程王者：16核/32核服务器矩阵，支持50-300台并行渲染▫️场景兼容性：粒子特效/全局光照/超复杂模型稳定输出秘密武器：CPU批量渲染100帧耗时=GPU单帧耗时，整体效率持平！⚙️维度2：动态计费逻辑——成本由什么决定？计
Golang Fiber框架最佳实践：如何构建企业级应用 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 开发语言后端 ai
GolangFiber框架最佳实践：如何构建企业级应用关键词：Golang、Fiber框架、企业级应用、最佳实践、Web开发摘要：本文聚焦于GolangFiber框架在企业级应用构建中的最佳实践。详细介绍了Fiber框架的背景、核心概念、算法原理、数学模型等基础知识，通过具体的代码案例展示了如何搭建开发环境、实现和解读源代码。同时探讨了Fiber框架在实际应用场景中的应用，推荐了相关的学习资源、开
PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection justtoomuchforyou 目标检测人工智能计算机视觉智驾
ECCV2022paper：[2205.07403]PillarNet:Real-TimeandHigh-PerformancePillar-based3DObjectDetectioncode：https://github.com/VISION-SJTU/PillarNet-LTS纯点云基于pillar3D检测模型网络比较SECOND基于voxel，one-stage，基于sparse3Dc
深入研究 Golang 领域的 Fiber 框架架构 Golang编程笔记 golang 架构网络 ai
深入研究Golang领域的Fiber框架架构关键词：Golang、Fiber框架、架构、高性能、Web开发摘要：本文将深入探讨Golang领域的Fiber框架架构。我们会先介绍背景知识，包括目的、预期读者等。接着用通俗易懂的方式解释核心概念，如Fiber框架的各个组成部分，以及它们之间的关系。然后详细阐述核心算法原理、数学模型，通过实际代码案例展示其应用。还会介绍Fiber框架的实际应用场景、推荐
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
RAG应用的评估（一） AI老炮 AIGC ai 机器学习人工智能语言模型
前言上篇文档主要是对Advanced-RAG的定义、策略和适用场景做了一个细致的分析，那么当我们准备将一个基于大模型的RAG应用投入生产时，如何去判断这个RAG是否合理呢？下面有一些问题是需要提前考并应付的：LLM输出的不确定性会带来一定的不可预知性。一个RAG应用在投入生产之前需要科学的测试以衡量这种不可预知性。在LLM应用上线后的持续维护中,需要科学、快速、可复用的手段来衡量其改进效果,比如回
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
Linux I/O 文件操作详解：从系统调用到实际工程应用平凡灵感码头 linux学习 linux 运维服务器
一、写在前面在Linux或任何类Unix操作系统中，文件是一切的核心——无论是硬盘上的文本文件，还是串口设备、GPIO寄存器、甚至网络接口，几乎都被抽象为“文件”。理解Linux下的I/O文件操作机制，不仅是嵌入式开发的基础，也是进行系统编程与底层控制的关键。二、I/O的本质：一切皆文件Linux将外设抽象成文件的方式，统一了对各种资源的操作模型。你可以用open打开串口设备/dev/ttyS0，
Spring AI快速入门学java的cc spring 大数据 java
一、引入依赖org.springframework.aispring-ai-starter-model-openaiorg.springframework.aispring-ai-bom${spring-ai.version}pomimport二、配置模型spring：ai:openai:base-url:https://dashscope.aliyuncs.com/compatible-mode
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
企业级知识库私有化部署：腾讯混元+云容器服务TKE实战大熊计算机 #腾讯云语言模型
1.背景需求分析在金融、医疗等数据敏感行业，企业需要构建完全自主可控的知识库系统。本文以某证券机构智能投研系统为原型，演示如何基于腾讯混元大模型与TKE容器服务实现：千亿级参数模型的私有化部署金融领域垂直场景微调高并发低延迟推理服务全链路安全合规方案1.1典型技术挑战#性能基准测试数据（单位：QPS）|场景|裸机部署|容器化部署|优化后||--------------------|--------
简单介绍物联网MQTT协议 Zio_Zhou 计算机网络 linux
在学习mqtt应用层协议之前，我们先来介绍一下发布/订阅模型以及请求/响应模型两种模型。请求/响应模型是网络应用系统中最常见的模型。在这种模型中，一个客户端（如一个Web浏览器）向服务器发送一个请求，服务器处理这个请求并返回一个响应。这个过程是同步的，意味着客户端需要等待服务器的响应。这种模型的优点是简单和易于理解，但在处理大量并发请求时可能会导致性能问题。发布/订阅模型。在这种模型中，有一个或多
RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用 ApacheDubbo spring 人工智能架构 Spring AI RAG
>夏冬,SpringAIAlibabaContributorRAG简介什么是RAG（检索增强生成）RAG（RetrievalAugmentedGeneration，检索增强生成）是一种结合信息检索和文本生成的技术范式。核心设计理念RAG技术就像给AI装上了「实时百科大脑」，通过先查资料后回答的机制，让AI摆脱传统模型的"知识遗忘"困境。️四大核心步骤1.文档切割→建立智能档案库核心任务:将海量文档
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D