旋转的油纸伞

【终结扩散模型】Consistency Models.OpenAI开源新模型代码，一步成图，1秒18张

0、前言
Abstract
1. Introduction
2. Diffusion Models
3. Consistency Models
- 3.1 Definition
- 3.2 Parameterization
- 3.3 Sampling
- 3.4 Zero-Shot Data Editing
4. Training Consistency Models via Distillation
- Definition 1.
- Theorem 1.
5. Training Consistency Models in Isolation
6. Experiments
- 6.1. Training Consistency Models
- 6.2. Few-Step Image Generation
- - Distillation
  - Direct Generation
- 6.3. Zero-Shot Image Editing
7. Conclusion
Reference
图片结果

代码地址：https://github.com/openai/consistency_models
论文地址：https://arxiv.org/abs/2303.01469
本篇博客详细的介绍了Consistency Models的原理。
值得一提的是这篇文章的第一作者是Yang Song宋飏，之前的score-based generative models即扩散模型也是他写的，这篇文章有很多相关的理论。

0、前言

在 AI 画图的领域，人们一直关注的是扩散模型，人们一直在尝试不断改进，推出了 Stable Diffusion、Midjourney、DALL-E 等技术，并在其基础上构建应用。不过最近，OpenAI 提出的全新生成模型看起来要让这一领域经历一场革命。

作者阵容也非常强大，有本科毕业于清华大学数理基础科学班、目前在 OpenAI 担任研究员的宋飏。宋飏将于 2024 年 1 月加入加州理工学院电子系（Electrical Engineering）和计算数学科学系（Computing and Mathematical Sciences）担任助理教授。此外还包括 OpenAI 联合创始人、首席科学家 Ilya Sutskever。

有网友将其视为扩散模型的有力竞争者！并表示 Consistency Models 无需对抗性训练，这使得它们更容易训练，不容易出现模式崩溃。还有网友认为扩散模型的时代即将结束。更有网友测试了生成速度，3.5 秒生成了 64 张分辨率 256×256 的图片，平均一秒生成 18 张。

首先我们看看 Consistency Model 零样本图像编辑能力：

图 6a 展示了 Consistency Model 可以在测试时对灰度卧室图像进行着色，即使它从未接受过着色任务的训练，可以看出，Consistency Model 的着色效果非常自然，很逼真；图 6b 展示了 Consistency Model 可以从低分辨率输入生成高分辨率图像，Consistency Model 将 32x32 分辨率图像转成 256x256 高分辨率图像，和真值图像（最右边）看起来没什么区别。图 6c 证明了 Consistency Model 可以根据人类要求生成图像（生成了有床和柜子的卧室）。

Consistency Model 图像修复功能：左边是经过掩码的图像，中间是 Consistency Model 修复的图像，最右边是参考图像：

Consistency Model 生成高分辨率图像：左侧为分辨率 32 x 32 的下采样图像、中间为 Consistency Model 生成的 256 x 256 图像，右边为分辨率为 256x 256 的真值图像。相比于初始图像，Consistency Model 生成的图像更清晰。

Abstract

提出问题：扩散模型在图像、音频和视频生成方面取得了重大突破，但它们依赖于迭代生成过程，导致采样速度慢，限制了(caps)它们在实时应用中(real-time applications)的潜力。
提出解决方案：为了克服这一局限性，作者团队提出了consistency models，这是一类新的生成模型，它无需对抗性训练就能获得高样本质量。
它们支持设计的快速one-step生成，同时仍然允许用few-step采样，以权衡计算量和样本质量。
它们还支持零样本（zero-shot）数据编辑，如图像修复、着色和超分辨率，而不需要针对这些任务进行具体训练。
consistency models可以用蒸馏预训练扩散模型的方式进行训练，也可以作为独立的(standalone)生成模型进行训练。
实验：研究团队通过实验证明了Consistency Models 在one-step 和 few-step 生成中优于现有的扩散模型蒸馏技术。例如，在 one-step 生成方面，Consistency Models在CIFAR10上实现了新的 SOTA FID 3.55，在ImageNet 64x64上实现了6.20的FID。
当作为独立生成模型进行训练时，Consistency Models在CIFAR-10、ImageNet 64x64和LSUN 256x256等标准基准上的表现也优于single-step、非对抗生成模型。

读到目前有可能的疑问是：distill pre-trained diffusion models即什么是蒸馏预训练扩散模型和existing distillation techniques for diffusion models现有的扩散模型蒸馏技术。

蒸馏技术（Luhman&Luhman，2021；Salimans&Ho，2022；Meng et al.，2022；Zheng et al.，2022)是一种用于扩散模型快速采样的方法。最好的蒸馏方法是渐进式蒸馏 (PD, Salimans & Ho (2022))，作者在实验中广泛地将Consistency Models与之比较。

1. Introduction

文章首先介绍了一下Diffusion models，及其优缺点，主要问题就是慢。

关键性技术：

能够single-step generation，但是不损失太多样本质量。
必要时能够权衡了样本质量与计算量。
执行零样本（zero-shot）数据编辑任务的能力。如image inpainting, colorization, and super-resolution。

Consistency Models 作为一种生成模型，核心设计思想是支持 single-step 生成，同时仍然允许迭代生成，支持零样本（zero-shot）数据编辑，权衡了样本质量与计算量。

首先 Consistency Models 建立在连续时间扩散模型中的概率流probability flow (PF) 常微分方程ordinary differential equation (ODE) 之上，利用其轨迹trajectories平滑地将数据分布转化为可处理的噪声分布。
如下图 1 所示，给定一个将数据平滑地转换为噪声的 PF ODE，Consistency Models 学会在任何时间步（time step）将任意点(e.g., $x_t,x_{t\prime},and\ x_T$ )映射成轨迹的初始点 $x_0$ 以进行生成式建模。
Consistency Models 一个显著的特性是自洽性（self-consistency）：同一轨迹上的点会映射到相同的初始点。这也是模型被命名为 Consistency Models（一致性模型）的原因。

Consistency Models 允许通过仅使用 one network 评估转换随机噪声向量（ODE 轨迹的端点，例如图 1 中的 $x_T$ ）来生成数据样本（ODE 轨迹的初始点，例如图 1 中的 $x_0$ ）。
更重要的是，通过在多个时间步链接 Consistency Models 模型的输出，该方法可以提高样本质量，并以更多计算为代价执行零样本数据编辑，类似于扩散模型的迭代优化。

在训练方面，研究团队为 Consistency Models 提供了两种基于自洽性的方法：
第一种方法依赖于使用数值 ODE 求解器和预训练扩散模型来生成 PF ODE 轨迹上的相邻点对。通过最小化这些点对的模型输出之间的差异，该研究有效地将扩散模型蒸馏为 Consistency Models，从而允许通过 one network 评估生成高质量样本。

第二种方法则是完全消除了对预训练扩散模型的依赖，可独立训练 Consistency Models。这种方法将 Consistency Models 定位为一类独立的生成模型。

值得注意的是，这两种训练方法都不需要对抗训练，并且都允许 Consistency Models 灵活采用神经网络架构。

实验验证：
研究团队证明了Consistency Models在几个具有挑战性的图像基准上的有效性，包括CIFAR-10、ImageNet 64x64和LSUN 256x256。在经验上，研究团队观察到，作为一种蒸馏方法(distillation approach)，Consistency Models在各种数据集和采样步骤数上都优于渐进蒸馏(progressive distillation)。

在CIFAR-10上，Consistency Models达到了一步和两步生成的3.55和2.93的新的SOTA FIDs。在ImageNet 64x64上，它分别以一次和两次网络评估获得了破纪录的6.20和4.70的FIDs。当Consistency Models训练为独立的生成模型时，尽管没有利用预训练扩散模型，在单步生成方面还是取得了与渐进蒸馏相当的性能。

它们能够在多个数据集上超越许多GANs，以及所有其他非对抗性的、单步生成模型。研究团队还表明，Consistency Models可以用于执行零样本数据编辑任务，包括图像去噪、插值、修复、着色、超分辨率和笔画引导的图像编辑。

2. Diffusion Models

一致性模型在很大程度上受到（连续时间）扩散模型理论的启发（Song et al.，2021)。

扩散模型从用随机微分方程(SDE)扩散 $P_{data}(x)$ 开始
正向过程：

$\in [0,T]$ ,T>0是一个常数。其中 $\mu(⋅,t)$ 称为漂移系数， $\sigma(t)即g(t)$ 称为扩散系数， $w_t$ 表示标准布朗运动，dw可以看作为无穷小的白噪声infinitesimal white noise。

我们将 $x_t$ 的分布表示为 $p_t(x)$ ，因此最终样本分布为 $p_0(x) \equiv p_{data}(x)$

此 SDE 的一个显着特性是存在一个常微分方程 (ODE)，被 Song 等人称为概率流 (PF) ODE。 (2021)，其在 t 采样的解轨迹根据 $p_t(x)$ 分布：

这里 $\nabla logp_t(x_t)$ 是 $p_t(x_t)$ 的score function，可以训练一个模型 $s_θ(x,t)$ 来近似它。所以扩散模型又称为score-based generative models。

公式（1）中的SDE，通常设计使得 $p_T(x)$ 接近于一个易于处理的高斯分布 $\pi(x)$ 。作者沿用Elucidating the Design Space of Diffusion-Based Generative Models的配置，使得 $\mu(x,t)=0$ 和 $\sigma(t)=\sqrt{2t}$ 。在这种情况下 $p_t(x)=p_{data}(x) \otimes \mathcal{N}(0,t^2I)$ ，其中 $\otimes$ 表示卷积运算convolution operation，并且 $\pi(x) = \mathcal{N}(0,T^2I)$ 。

对于采样，我们首先通过score matching训练一个分数模型 $s_\phi(x,t) \approx \nabla logp_t(x)$ ,然后将其插入等式（2）获得PF ODE的经验估计，其形式为：

我们称等式（3）为empirical PF ODE.
接下来采样 $\hat{x}_T \sim \mathcal{N}(0,T^2I)$ 来初始化empirical PF ODE，并用任一数值ODE求解器，如Euler和Heun Solvers及时向后求解，得到求解轨迹 $\{\hat{x}_t\}_{t \in [0,T]}$ 。

然后，可以将得到的结果 $\hat{x}_0$ 视为来自数据分布p_{data}(x)的近似样本。

为了避免数值不稳定，通常在 $\epsilon$ 处停止求解，这里 $\epsilon$ 是一个固定的小正数，而不是接受 $\hat{x}_{\epsilon}$ 作为近似样本。并且follow Karras et al. (2022),我们将图像中的像素值缩小到[-1,1]，然后设置T=80”和 $\epsilon$ =0.002。

扩散模型因其缓慢的采样速度而成为瓶颈。显然，使用ODE求解器进行采样需要对得分模型 $s_\phi(x,t)$ 进行多次评估，这在计算上是昂贵的。用于快速采样的现有方法包括更快的数值ODE求解器（Song et al.，2020；Zhang&Chen，2022；Lu et al.，2022；Dockhorn et al.，2022)和蒸馏技术（Luhman&Luhman，2021；Salimans&Ho，2022；Meng et al.，2022；Zheng et al.，2022)。然而，ODE求解器仍然需要10多个评估步骤才能生成有竞争力的样本。大多数蒸馏方法像Luhman&Luhman(2021)和Zheng等人。（2022）依赖于在蒸馏之前从扩散模型收集大量样本数据集，这本身在计算上是昂贵的。据我们所知，唯一没有这种缺点的蒸馏方法是渐进蒸馏(PD，Salimans&Ho(2022))，我们在实验中将之与consistency models进行了广泛比较。

一图解释SDE和ODE：

我们可以使用 SDE 将数据映射到噪声分布（先验），并反转此 SDE 以进行生成建模。我们还可以反转关联的概率流 ODE，这会产生一个确定性过程，该过程从与 SDE 相同的分布中采样。逆时SDE和概率流ODE都可以通过估计得分函数得到。

更多内容参考：score-based generative models。

3. Consistency Models

我们提出了Consistency Models，这是一种新型的生成模型，在设计的核心支持单步生成，同时仍然允许迭代生成零拍数据编辑和样本质量和计算量之间的权衡。稠度模型可以在蒸馏模式或隔离模式中训练。在前一种情况下，一致性模型将预先训练的扩散模型的知识提取到一个单步采样器中，显著提高了样本质量的其他提取方法，同时允许零镜头图像编辑应用。在后一种情况下，一致性模型是孤立训练的，不依赖于预先训练的扩散模型。这使得它们成为一个独立的新的生成模型类。

下面我们介绍Consistency Models的定义、参数化和采样，并简要讨论它们在零样本数据编辑中的应用。

3.1 Definition

给定公式（2）中PF ODE的解轨迹 $\{x_t\}_{t \in [\epsilon,T]}$ 。我们将consistency function定义为 $\mathbf{f}:(x_t,t)\mapsto x_\epsilon$ 。
consistency function具有自洽性的性质：对于属于同一 PF ODE 轨迹的任意 $x_t,t)$ 对，其输出是一致的，i.e.,对于所有 $t,t^\prime \in [\epsilon,T]$ 有 $\mathbf{f}(x_t,t)=\mathbf{f}(x_{t^\prime},t^\prime)$ 。
对于固定的时间参数， $\mathbf{f}(·,t)$ 总是一个可逆函数。
如图2所示.consistency model的目标，符号为 $\mathbf{f_θ}$ ，是通过学习来加强自洽性属性，从数据中估计这个consistency function $\mathbf{f}$ （详见第4节和第5节）。

3.2 Parameterization

对于任何consistency function $\mathbf{f}(·,·)$ ，我们有 $\mathbf{f}(x_\epsilon,\epsilon)$ ，即 $\mathbf{f}(·,·)$ 是一个恒等式函数。我们称这种约束为边界条件boundary condition。

一个有效的consistency model必须尊重这个边界条件。对于基于深度神经网络的consistency model，我们讨论了两种几乎免费almost for free实现该边界条件的方法。
假设我们有一个自由形式的深度神经网络 $F_\theta(x,t)$ ，其输出具有与x相同的维数。
第一种方法是简单地将一致性模型参数化为 :
第二种方法是使用skip connections参数化一致性模型，即，:
其中 $c_{skip}(t)$ 和 $c_{out}(t)$ 是可微函数，使得 $c_{skip}(\epsilon)=1$ 和 $c_{out}(\epsilon)=0$ 。这样，如果 $F_\theta(x,t)$ 和标度系数scaling coefficient是可微的，那么一致性模型在 $t=\epsilon$ 处是可微的，这对于训练连续时间一致性模型是至关重要的（附录B.1和B.2)。
公式（5）中的参数化与许多成功的扩散模型（Karras et al.，2022；Balaji et al.，2022)具有很强的相似性，使得更容易借用强大的扩散模型体系结构来构建一致性模型。因此，我们在所有实验中都遵循第二个参数化。

3.3 Sampling

有了一个训练好了的一致性模型 $f_θ(·,·)$ ，我们可以通过从初始分布 $\hat{x}_T \sim \mathcal{N}(0,T^2I)$ 中采样来生成样本，然后以 $\hat{x}_\epsilon = f_\theta(\hat{x}_T,T)$ 评估一致性模型。
这只涉及一致性模型的一次前向传递，因此在单个步骤中生成样本generates samples in a single step。
重要的是，还可以通过交替去噪和噪声注入步骤alternating denoising and noise injection steps来多次评估一致性模型，以提高样本质量。
在算法1中总结，这种multistep sampling过程提供了用计算量换取样本质量的灵活性。
它在零样本数据编辑中也有重要的应用。
在实践中，我们用贪心算法找到算法1中的时间点time points，其中时间点是一次一个地精确定位pinpointed one at a time 通过三进制搜索ternary search来优化算法1中得到的样本的FID。

3.4 Zero-Shot Data Editing

Consistency models能够在零样本下进行各种数据编辑和操作应用程序；而不需要具体的训练来执行这些任务。
例如，一致性模型定义从高斯噪声向量到数据样本的一对一映射。
与GAN、VAE和归一化流等潜在变量模型类似，一致性模型可以通过遍历潜在空间轻松地在样本之间进行插值（图11）。
由于一致性模型被训练为从任何有噪声的输入 $x_t$ （其中 $\in [\epsilon,T]$ ）中恢复 $x_\epsilon$ ，因此它们可以针对各种噪声水平执行去噪（图12）。
此外，算法1中的多步生成过程对于通过使用类似于扩散模型的迭代替换过程来求解zero shot中的某些逆问题是有用的。
这使得能够在图像编辑的上下文中实现许多应用，包括修复（图10）、着色（图8）、超分辨率（图6 b）和如在SDEDit(Meng et al., 2021).的笔划引导stroke-guided的图像编辑（图13）。
在第6.3节中，我们以经验证明了一致性模型在许多零样本图像编辑任务中的强大。

图片放在了文末

4. Training Consistency Models via Distillation

我们提出了我们的第一个训练一致性模型的方法，基于蒸馏一个预训练的分数模型 $s_\phi(x,t)$ 。
我们的讨论围绕公式（3）中的经验PF ODE展开。通过将分数模型 $s_\phi(x,t)$ 插入到PF ODE中得到。
考虑将时间范围 $[\epsilon,T]$ 离散成N-1个子区间，边界为 $t_1=\epsilont1=ϵ<t2<⋯<tN=T$

由于等式（2）中的PF ODE与SDE（公式1）之间的连接（见第2节），我们可以沿着ODE轨迹的分布进行采样：首先对 $x\sim p_{data}$ 采样，然后将高斯噪声添加到x上。
具体来说，给定一个数据点x，从数据集中采样x，然后从SDE $\mathcal{N}(x,t^2_{n+1}I)$ 的跃迁密度transition density中采样 $x_{t_{n+1}}$ ，然后利用公式（6）数值ODE求解器的一个离散化步骤来计算 $\hat{x}^\Phi_{t_n}$ ，可以有效地生成PF ODE轨迹上的一对相邻数据点 $(\hat{x}^\Phi_{t_n},x_{t_{n+1}})$ 。
也就是说x可以得到 $x_{t_{n+1}}$ ，然后 $x_{t_{n+1}}$ 可以得到 $\hat{x}^\Phi_{t_n}$
即： $\Rightarrow x_{t_{n+1}} \Rightarrow \hat{x}^\Phi_{t_n}$ 我们要的是 $(\hat{x}^\Phi_{t_n},x_{t_{n+1}})$
这激发了我们下面的consistency distillation loss以训练一致性模型。

Definition 1.

consistency distillation loss的定义如下：

其中 $\theta^-$ 表示优化过程中过去θ值的运行平均值.
除非另有说明，否则我们在本文中采用定义1中的符号，并用 $\mathbb{E}[·]$ 来表示所有相关随机变量的期望值。
在我们的实验中，我们考虑平方 $\ell_2$ 距离 $d(x,y)=\left \| x-y\right \|_2^2$ , $\ell_1$ 距离 $d(x,y)=\left \| x-y\right \|_1$ 和学习到的感知图像贴片相似性(LPIPS，Zhang et al.(2018))。
并且发现 $\lambda(t_n)\equiv1$ 在所有的任务和数据集上表现都很好。

在实践中，我们通过对模型参数θ的随机梯度下降来最小化目标，同时用指数移动平均exponential moving average(EMA)更新 $\theta^-$ 。也就是说，给定衰减率为 $0\le\mu<1$ ，我们在每个优化步骤后执行以下更新：

算法2总结了整个训练过程。

根据深度强化学习和基于动量的对比学习中的约定，我们将 $f_{\theta^-}$ 称为“目标网络”，将 $f_{\theta}$ 称为“在线网络”。
我们发现，与简单地设置 $\theta^-=\theta$ 相比，==等式（8）中的EMA 更新和”stopgrad“操作符，可以大大稳定训练过程，提高一致性模型的最终性能。 ==

下面我们根据渐近分析asymptotic analysis给出了consistency distillation的理论依据。

Theorem 1.

Proof. 该证明是基于归纳法的，并与数值ODE求解器的全局误差界的经典证明类似(S-Uli&Mayers，2003)。我们在附录A.2中提供了充分的证明。

由于 $\theta^-$ 是θ历史的运行平均值，当算法2的优化收敛时，我们有 $\theta^-=$ θ。
也就是说，目标和在线一致性模型最终会相互匹配。如果一致性模型另外达到零一致性蒸馏损失，则定理1意味着，在某些正则性条件下，只要ODE求解器的步长足够小，估计的一致性模型就可以变得任意精确。
尽管如此，它们涉及雅可比向量积，并需要前向模式自动微分才能有效实现，这在一些深度学习框架中可能没有得到很好的支持。我们在定理3到5中提供了这些连续时间蒸馏损失函数，并将细节归入附录B.1。

5. Training Consistency Models in Isolation

一致性模型可以在不依赖于任何预训练扩散模型的情况下进行训练。这与扩散蒸馏技术不同，使一致性模型成为一类新的独立的生成模型。

在一致性蒸馏中，我们使用一个预训练的分数模型 $s_\phi(x,t)$ ，来逼近真值分数函数 $\nabla logp_t(x)$ 。
为了摆脱这种依赖关系，我们需要寻求其他方法来估计得分函数。
实际上，由于以下恒等式（附录A中的引理1）存在着一个对 $\nabla logp_t(x_t)$ 的无偏估计量：

就是用蒙特卡罗估计score function $\nabla logp_t(x_t)$
我们现在证明，在 $\rightarrow \infty$ 的极限内，当使用欧拉方法（或任何高阶方法）作为ODE求解器时，该估计实际上足以取代预训练的扩散模型。

更确切地说，我们有以下定理。

twice continuously differentiable with bounded second derivatives, 二次连续可微的有界二阶导数，

*Proof.*证明基于泰勒级数展开和得分函数的性质（引理1）。附录A.3提供了完整的证明。

也就是说当 $\rightarrow \infty$ 且 $\triangle t \rightarrow 0$ 时，CT loss占公式（9）主导地位，那么就可以省去后面一项 $o(\triangle t)$ 。

为了提高实际性能，我们建议在训练过程中根据一个调度函数 $N (\cdot)$ 逐步增加N。
其动机（参见，图3D)，当N较小时（即ΔT较大），一致性训练损失相对于潜在的一致性蒸馏损失（即方程（9）的等式左边）有较少的“方差variance”，但有较多的“偏差bias”，这有利于在训练开始时更快地收敛。
相反，当N较大时（也就是Δt较小时），它具有较多的“方差”，但较少的“偏差”，这在接近训练结束时是可取的。
为了获得最佳性能，我们还发现，根据调度函数 $\mu(·)$ ， $\mu$ 应随N变化。一致性训练的完整算法在算法3中提供，我们实验中使用的调度函数在附录C中给出。

6. Experiments

利用consistency distillation和consistency training来学习真实图像数据集上的consistency models。
实验数据集包括 CIFAR-10 、ImageNet 64x 64 、LSUN Bedroom 256 x 256 、 LSUN Cat 256 x 256。评估指标包括FID,IS,Precision,Recall。
附录C提供了更多的实验细节。

6.1. Training Consistency Models

我们在CIFAR-10上进行了一系列实验，以了解各种超参数对通过一致性蒸馏(CD)和一致性训练(CT)训练的一致性模型性能的影响。
我们首先研究了度量函数 $d (\cdot,\cdot)$ 、ODE求解器和离散化步骤数N对CD的影响，然后研究了CT中schedule functions $N (\cdot)$ 和 $\mu(·)$ 对CT的影响。

如图3a所示，CD的最优度量是LPIPS，在所有训练迭代中，它的表现都比 $\ell _1$ 和 $\ell _2$ 好得多。这是可以预期的，因为一致性模型的输出是CIFAR-10上的图像，并且LPIPS是专门设计用于测量自然图像之间的相似性的。
接下来，我们研究哪种ODE求解器和哪种离散化步骤N最适合CD。如图3b和3c，Heun ODE求解器和N=18是最佳选择。两者都符合Karras et al.（2022）的建议，尽管我们正在训练一致性模型，而不是扩散模型。
此外，图3b显示出了在相同N的情况下，Heun的二阶求解器一致地优于Euler的一阶求解器。这也证实了Theorem 1，其中定理1指出，由高阶ODE求解器训练的最优一致性模型在相同的N下具有较小的估计误差。

图3c的结果还表明，一旦N足够大，CD的性能变得对N不敏感。鉴于这些见解，除非另有说明，否则我们在下文中使用LPIPS和Heun ODE求解器用于CD。对于CD中的N，我们遵循Karras等人（2022）关于CIFAR-10和ImageNet 64？64的建议。我们在其他数据集上单独调整N（详见附录C）。

由于CD和CT之间的紧密联系，我们在本文中采用LPIPS进行CT实验。
与CD不同，在CT中不需要使用Heun的二阶求解器，因为损失函数不依赖于任何特定的数值ODE求解器。（即与数值求解器相关的是分数网络 $s_\phi(x.t)$ 即参数 $\Phi$ ）

如图3d所示，CT的收敛对N高度敏感–较小的N导致较快的收敛但较差的样本，而较大的N导致较慢的收敛但在收敛时较好的样本。
这与我们在第5节中的分析相匹配，并促使我们实际选择逐渐增加CT的N和µ，以平衡收敛速度和样本质量之间的权衡。
如图3d所示，N和μ的自适应调度显著提高了CT的收敛速度和采样质量。在我们的实验中，我们针对不同分辨率的图像分别调整调度 $N (\cdot,\cdot)$ 和 $\mu(·,·)$ ，更多细节见附录C。

6.2. Few-Step Image Generation

Distillation

在当前文献中，与我们的一致性蒸馏（CD）最直接可比的方法是渐进蒸馏（PD，Salimans & Ho（2022））;迄今为止，这两种方法都是在蒸馏之前不构建合成数据的do not construct synthetic data before distillation 唯一蒸馏方法。
与此形成鲜明对比的是，其他蒸馏技术，如知识蒸馏（Luhman & Luhman，2021）和DFNO（Zheng等人，2022），必须通过用昂贵的数值ODE求解器从扩散模型生成大量样本来准备大的合成数据集。
我们在CIFAR-10、ImageNet 64x64和LSUN 256x256上对PD和CD进行了全面的比较，所有结果都在图4中报告。
所有方法均从内部预训练的EDM（Karras等人，2022）模型中蒸馏。All methods distill from an EDM (Karras et al., 2022) model that we pre-trained in-house.
我们注意到，在所有采样迭代中，与Salimans & Ho（2022）的原始论文中的平方 $\ell_2$ 距离相比，使用LPIPS度量均匀地改善了PD。using the LPIPS metric uniformly improves PD compared to the squared 2 distance in the original paper ofSalimans & Ho (2022).
PD和CD都随着我们采取更多的采样步骤而改善。
我们发现CD在所有数据集，采样步骤和度量函数中均优于PD，除了Bedroom 256x256上的单步生成，其中CD用 $\ell_2$ 的性能略低于PD用 $\ell_2$ 。
如表1所示，CD甚至优于需要合成数据集构建的蒸馏方法，例如知识蒸馏（Luhman & Luhman，2021）和DFNO（Zheng et al.2022年）。

可见CT一步与很少步的生成能力的强大。表 1 表明，CD（ consistency distillation ）优于 Knowledge Distillation、DFNO 等方法。

Direct Generation

在表1和表2中，我们将一致性训练（CT）的样本质量与使用一步和两步生成的其他生成模型进行了比较。
我们还包括PD和CD结果以供参考。两个表都报告了从 $\ell_2$ 度量函数获得的PD结果，因为这是Salimans & Ho（2022）原始论文中使用的默认设置。
为了公平比较，我们训练PD和CD来提取distill相同的EDM模型。
在表1和表2中，我们观察到CT优于所有单步、非对抗性生成模型，即VAE和归一化流，在CIFAR-10上有显著性差异。（但是没有GAN好。）
此外，CT获得了与PD相当的质量，用于单步生成而不依赖于蒸馏。
在图5中，我们提供了EDM样本（顶部）、单步CT样本（中间）和两步CT样本（底部）。
在附录E中，我们在图14到21中显示了CD和CT的额外样本。
重要的是，从相同的初始噪声向量获得的所有样本具有显著的结构相似性，即使CT和EDM模型彼此独立地训练。这表明CT不太可能遭受模式崩溃，因为EDM不会。（其中EDM (Karras et al., 2022)）

6.3. Zero-Shot Image Editing

与扩散模型相似，一致性模型通过修改算法1中的多步采样过程来允许零样本图像编辑。
我们使用一致性蒸馏在LSUN卧室数据集上训练的一致性模型证明了这种能力。
在图 6a中，我们证明了这种一致性模型可以在测试时对灰度卧室图像进行着色，尽管它从未被训练过着色任务。
在图 6b，我们证明了相同的一致性模型可以从低分辨率的输入生成高分辨率的图像。
在图 6C，我们还证明了它可以根据人类创建的笔画输入生成图像，就像SDEdit用于扩散模型（Meng et al.，2021)。
同样，这种编辑能力是零样本zero-shot,的，因为模型没有根据笔画输入进行训练。
在附录D中，我们还演示了一致性模型在修复（图10)、插值（图11）和去噪（图12）方面的零样本能力，并提供了更多关于着色（图8）超分辨率（图9）和笔画引导图像生成（图13）的示例。

7. Conclusion

我们介绍了一致性模型，这是一种专门设计用于支持一步或几步生成的生成模型。
我们的经验证明，我们的一致性蒸馏方法在许多图像基准和各种采样迭代上优于现有的扩散模型蒸馏技术。
此外，作为一个独立的生成模型，一致性模型优于其他允许单步生成的可用模型，不包括GANs。
与扩散模型类似，它们还允许零样本图像编辑应用，如修补、着色、超分辨率、去噪、插值和笔画引导图像生成。

此外，一致性模型与其他领域中使用的技术有着惊人的相似之处，包括深度Q学习（Mnih et al.，2015)和基于动量的对比学习（Grill et al.，2020；He et al.，2020)。这为这些不同领域的思想和方法的交叉研究提供了令人兴奋的前景。

了解更多内容，请参考原论文。

Reference

【1】：终结扩散模型：OpenAI开源新模型代码，一步成图，1秒18张

图片结果

spherical linear interpolation. 球面线性插值。

你可能感兴趣的:(CV,人工智能,计算机视觉,深度学习,一致性模型,扩散模型)

Django5.1（91）—— 如何删除一个 Django 应用小天的铁蛋儿 django Python django python 后端
如何删除一个Django应用Django提供了将一组功能组织成名为应用程序的Python包的能力。当需求发生变化时，应用程序可能会变得过时或不再需要。以下步骤将帮助你安全地删除一个应用程序。删除所有与该应用程序相关的引用（导入、外键等）。从相应的models.py文件中删除所有模型。通过运行makemigrations来创建相关的迁移。这一步会生成一个迁移，用于删除已删除模型的表，以及与这些模型相
相机位姿估计：基于四个特征点的精准姿态解算童嘉航Denley
相机位姿估计：基于四个特征点的精准姿态解算【下载地址】相机位姿估计1根据四个特征点估计相机姿态随文Demo本资源文件提供了一个基于OpenCV的相机位姿估计Demo，主要功能是根据四个特征点来估计相机的姿态。通过该Demo，您可以学习如何使用OpenCV库中的相关函数来实现相机位姿的估计项目地址:https://gitcode.com/open-source-toolkit/df72a项目介绍在计
搜索架构中的NLP技术：提升搜索准确性的关键搜索引擎技术架构自然语言处理人工智能 ai
搜索架构中的NLP技术：提升搜索准确性的关键关键词：搜索架构、NLP技术、查询理解、语义搜索、相关性排序、意图识别、BERT模型摘要：本文将深入探讨现代搜索架构中NLP技术的核心应用，从查询理解到结果排序的全流程，揭示NLP如何提升搜索准确性。我们将通过生动的比喻解释复杂概念，分析关键技术原理，并提供实际代码示例，帮助读者全面理解搜索系统背后的NLP魔法。背景介绍目的和范围本文旨在解析NLP技术在
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
OpenCV教程——图像模糊。均值模糊，高斯模糊，中值模糊，双边模糊，高斯分布
1.图像模糊图像模糊是图像处理中最简单和常用的操作之一。⚠️使用该操作的原因之一是为了给图像预处理时降低噪声。图像模糊操作背后是数学的卷积计算。卷积操作的原理：常用的图像模糊的方法：均值模糊高斯模糊中值模糊双边模糊这四种模糊方式有时也被称为：均值滤波、高斯滤波、中值滤波和双边滤波。因为模糊属于一种滤波操作，具体关系可参照下图：其中，均值滤波、高斯滤波和中值滤波属于线性滤波；而双边滤波属于非线性滤波
60天python训练计划----day59
在之前的学习中，我们层层递进的介绍了时序模型的发展，从AR到MA到ARMA，再到ARIMA。本质就是把数据处理的操作和模型结合在一起了，实际上昨天提到的季节性差分也可以合并到模型中，让流程变得更加统一。季节性差分用S来表示，所以这个模型叫做SARIMA模型一、SARIMA模型SARIMA(SeasonalAutoRegressiveIntegratedMovingAverage)是标准ARIMA模
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
PostgreSQL 使用 OFFSET 分页时的数据一致性问题心上之秋
在PostgreSQL中，使用OFFSET和LIMIT实现分页查询是一种常见的方法。然而，当分页查询执行时，如果有新数据插入或已有数据删除，可能会导致分页结果出现错乱或数据丢失的问题。一、OFFSET分页的工作原理OFFSET分页的基本语法如下：登录后复制SELECT*FROMtable_nameORDERBYcolumn_nameLIMITpage_sizeOFFSET(page_number-
如何用 Python 实现模拟木星的运行轨道、自转、公转 wh3933 python 开发语言
用Python来模拟木星的轨道运行、自转和公转是一个非常有趣且富有挑战性的项目。这需要结合天文学知识和编程技巧。我们将使用VPython这个库来实现这个模拟。VPython非常适合创建简单的3D物理场景和动画，它的语法直观，能够让我们快速地将物理概念转化为可视化的三维模型。在开始之前，请确保您已经安装了VPython。如果尚未安装，可以通过pip进行安装：pipinstallvpython模拟思路
ASP.NET Web Pages - 教程 samFuB asp.net 前端后端
ASP.NET是一个使用HTML、CSS、JavaScript和服务器脚本创建网页和网站的开发框架。ASP.NET支持三种不同的开发模式：WebPages（Web页面）、MVC（ModelViewController模型-视图-控制器）、WebForms（Web窗体）：本教程介绍WebPages。WebPagesMVCWebForms从何入手？多数开发人员学习一个新技术，是从查看运行实例开始的。通
Kafka 小熊哥^--^ kafka 分布式
一、什么是Kafka？Kafka的主要用途？Kafka是一个分布式流处理平台，是Apache的一个顶级项目，它被设计用于高吞吐量，分布式、持久性的数据流处理。Kafka实现了一套非常高效的一种发布订阅模型，应用场景非常广泛，比如日志聚合（收集日志）、数据流处理、数据仓库集成（传输数据到数据仓库）、应用程序集成（作为消息中间件来实现异步通信）、流媒体处理（列如实时监控，事件驱动的应用程序）二、top
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
Android 腾讯地图获取当前缩放级别 nc_kai Android 腾讯地图 android
Android腾讯地图获取当前缩放级别tencentMap.setOnCameraChangeListener(newTencentMap.OnCameraChangeListener(){@OverridepublicvoidonCameraChange(CameraPositioncameraPosition){}@OverridepublicvoidonCameraChangeFinishe
排查 DeepSeek API HandshakeFailure 错误的全景式指南
在Chatwise中调用DeepSeek模型时，reqwest抛出的AlertReceived(HandshakeFailure)通常意味着TLS握手阶段被服务器中止。本文透视DeepSeekAPI的TLS要求、Rust网络栈的实现细节以及常见的环境陷阱，借助可直接运行的代码与真实案例，给出一条可复制的排障路线。1 错误现象与日志解码Errorreqwest::Error{kind:Request
Git通讲-第二章（4）：分布式版本控制焦糖酒 Git通讲 git 分布式
前言也是到第二章的第四篇了，这篇我希望能结合前面讲到的快照模型、不可变数据对象、分支模型的知识，来探讨Git是如何实现分布式这件事情的，或许会捎带嘴的提一下Github之类远程托管仓库平台的兴起。Git分布式版本控制的实现Git的分布式版本控制系统与传统的集中式版本控制（如SVN）相比，有几个关键的不同点。Git的架构使得每个开发者的本地仓库不仅仅是一个工作副本，而是一个完整的仓库，包含了项目的所
Linux exec函数族完全指南
在Linux系统编程中，exec函数族用于在一个进程中替换当前运行的程序为另一个新的程序。它与fork()配合使用，是实现多进程编程、启动子进程执行外部命令的核心机制。目录一、exec函数族概述二、exec函数族成员三、函数原型详解1.execl()示例：2.execlp()示例：3.execv()示例：4.execvp()示例：5.execle()示例：四、exec执行流程图解（知识树状图）五、
产品经理-埋点分析文档（DRD） - AxureMost AxureMost NPDP 产品经理开源知识库产品经理
埋点分析文档（DRD）-AxureMost数据埋点文档是产品、数据分析师和开发人员之间沟通的桥梁，用于明确需要收集哪些用户行为数据，以及如何收集这些数据。它详细记录了数据埋点的需求、规范和实施细节，确保数据收集的准确性和一致性。以下是数据埋点文档的定义、内容、作用以及规范的详细说明：定义数据埋点文档是一种技术文档，它详细描述了在产品中需要埋点的位置、事件类型、数据字段、统计逻辑等信息。它是产品需求
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
文心一言插件：使用插件探索无限可能前端
文心一言作为一款强大的语言模型，为我们提供了丰富的功能和应用场景。而文心一言插件的出现，进一步拓展了其功能，为用户带来了更多的便利和可能性。本文将详细介绍文心一言插件的使用方法，并通过一个具体的实例展示其在实际应用中的强大之处。一、文心一言插件的安装和启用访问文心一言官方网站，登录你的账号。在页面左侧的菜单中，点击“插件”选项。在插件页面中，你可以浏览可用的插件列表，选择你需要的插件并点击“安装”
巧用云平台API实现开源模型免费调用的实战教程 herosunly AIGC 人工智能大模型 API 实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法工程师一职，获得CSDN博客之星第一名，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得多项AI顶级比赛的Top名次，其中包括阿里云、科大讯飞比赛第一名，CCF、开放原子比赛二等奖。在技术创新领域拥有多项授权发明。曾辅导多位非科班出身的同学成功进入算法行业就业
线性回归 python代码黄涵奕 python 线性回归 numpy 机器学习开发语言
下面是一个线性回归模型的Python代码示例：importnumpyasnpfromsklearn.linear_modelimportLinearRegression#训练数据x=np.array([[1],[2],[3],[4],[5]])y=np.array([5,7,9,11,13])#建立模型reg=LinearRegression().fit(x,y)#预测reg.predict(np
【数据分析】Python实现线性回归和多元线性回归（全代码）干了这一碗BUG 线性回归回归算法
老规矩，涉及到的数学原理，想深入了解的可以自行查阅相关资料，这里直接上干货用Python实现。目录逻辑回归中涉及的术语线性回归Python实现多元线性回归Python实现逻辑回归中涉及的术语以下是逻辑回归中一些常见的术语：自变量：应用于因变量预测的输入特征或预测因子。因变量：逻辑回归模型中的目标变量，即我们试图预测的变量。逻辑函数：用于表示自变量和因变量之间关系的公式。逻辑函数将输入变量转换为0到
python实现多元线性回归算法 (附完整源码) 源代码大师 python算法完整教程算法 python 线性回归
python实现多元线性回归算法1.使用正规方程实现多元线性回归代码说明运行结果示例2.使用梯度下降法实现多元线性回归代码说明运行结果示例进一步优化与注意事项下面是使用Python从头实现多元线性回归算法的完整源码。这个实现利用了numpy进行矩阵运算，并展示了如何训练模型、进行预测以及评估模型性能。为了更全面，代码中还包含了一个使用梯度下降法（GradientDescent）优化参数的实现。多元
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
交互式模式下启用 SAI（SoC 架构信息）的操作解析
一、交互式模式启用SAI的核心逻辑与流程在交互式模式下启用SAI（SoCArchitectureInformation）是通过命令行逐行输入指令，动态构建芯片架构模型并实时查看反馈的操作方式。其核心优势在于灵活性高，适合设计早期的单场景探索与命令调试，具体流程如下：二、关键操作步骤与命令详解启动SAI功能（read_sai）作用：启动物理设计环境并进入SAI交互模式。命令格式：tclread_sa
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
利用 SoC 架构信息 (SAI) 创建自动网表的解析 weixin_45371279 innovus
基于SAI（SoCArchitectureInformation）创建网表是在无完整电路网表时启动物理设计的关键技术，通过解析架构描述并生成等效网表，使Innovus能够执行布局规划与分析。以下是核心功能与实现逻辑的详细说明：一、SAI自动网表生成的技术背景与目标当设计早期缺乏RTL或门级网表时，SAI自动网表生成通过抽象模型具体化的方式，将架构描述转换为物理设计工具可识别的网表结构，实现：提前启
Python+AI十分钟自动生成小说！程序员：这工具让我月入5万+ 小筱在线人工智能人工智能开发语言
引言：AI写作革命已来，你准备好了吗？2025年的今天，AI写作已经从科幻概念变成了现实生产力。一位名叫李明的程序员在社交媒体上晒出他的收入截图：单月稿费突破5万元，而他的"秘密武器"竟是用Python开发的AI小说生成工具。这不是天方夜谭，而是正在发生的技术革命。随着GPT-4、Claude3等大语言模型的成熟，结合Python强大的自动化能力，任何人都可以在十分钟内生成一部完整的小说初稿。AI
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen