EDPJ

（2021|CoRR，AugCLIP，优化）FuseDream：通过改进的 CLIP+GAN 空间优化实现免训练文本到图像生成

FuseDream: Training-Free Text-to-Image Generation with Improved CLIP+GAN Space Optimization

公众：EDPJ（添加 VX：CV_EDPJ 或直接进 Q 交流群：922230617 获取资料）

0. 摘要

1. 简介

2. CLIP+GAN 文本到图像生成

2.1 CLIP容易受到攻击并陷入困境

3. 我们的方法 - FuseDream

3.1 AugCLIP：避免对抗生成

3.2 优化改进

3.3 组合生成

4. 相关工作

5. 实验

6. 结论

S. 总结

S.1 主要贡献

S.2 方法

0. 摘要

生成图像从自然语言指令是一个引人入胜但极具挑战性的任务。我们采用了一种 CLIP+GAN 的方法来进行文本到图像的生成，该方法在现成的 GAN 的潜在空间中进行优化，以找到在 CLIP 模型度量下，与给定输入文本具有最大语义相关性分数的图像。与从头开始训练将文本映射到图像的传统方法相比，CLIP+GAN 方法是无需训练的、zero-shot 的，并且可以轻松定制以适应不同的生成器。

然而，在 GAN 空间中优化 CLIP 分数是一个极具挑战性的优化问题，像 Adam 这样的现成优化器未能产生令人满意的结果。在这项工作中，我们提出了一种 FuseDream 流水线，通过三种关键技术改进了 CLIP+GAN 方法： 1）通过在图像上引入随机增强来使标准的 CLIP 分数更加稳健的AugCLIP 分数。2）一种新颖的初始化和超参数化策略，允许我们有效地在 GAN 空间中的非凸区域进行优化。3）一种组合生成技术，通过利用一种新颖的双层优化公式，可以组合多个图像以扩展 GAN 空间并克服数据偏见。

在受到不同输入文本的推动时，FuseDream 能够生成具有不同对象、背景、艺术风格和新颖的反事实概念的高质量图像，这些概念在我们使用的 GAN 的训练数据中并未出现。在定量方面，FuseDream 生成的图像在 MS COCO 数据集上获得了顶级的 Inception 分数和 FID 分数，而无需额外的架构设计或培训。我们的代码可在 https://github.com/gnobitab/FuseDream 上公开获取。

1. 简介

在多模态机器学习中的一个重要任务是文本到图像生成，即生成与给定文本输入在语义上相关的逼真图像 [9,18,25,26,31,35]。这是一项极具挑战性的任务，因为生成模型需要理解文本、图像以及它们在语义上应该如何关联。最近，[9, 25] 取得了显著的进展，它们使用在大规模数据集上进行自监督损失训练的模型生成了高质量且语义相关的图像。

传统的文本到图像生成方法是使用（文本，图像）对的数据集从头开始训练有条件的生成模型 [18, 22, 25, 26, 31, 35]。然而，这个过程需要收集大量的训练数据，带来高昂的培训成本，并且不容易定制。最近，随着强大的联合文本-图像编码器的出现（特别是 CLIP 模型 [24]），它们提供了文本-图像对的忠实语义相关性得分。结合强大的预训练 GAN（如 [1, 4, 18, 40]），通过在 GAN 的潜在空间中进行优化，创建与输入文本具有高语义相关性的图像已经成为可能。值得注意的例子包括 BigSleep [20] 和 VQGAN+CLIP [6]，它们分别通过在 BigGAN 和 VQGAN 的潜在空间中最大化CLIP 分数来从文本生成引人入胜和艺术性的图像。与传统基准相比，结合 GAN 和 CLIP 的方法是无需训练且 zero-shot 的，不需要专门的训练数据集和训练成本。它还更加灵活和模块化：用户可以轻松替换生成器（GAN）或编码器模型（CLIP）为更强大或定制的模型，以最适合其问题和计算预算。

另一方面，现有的 CLIP+GAN 方法的结果 [6, 10, 20] 在许多情况下仍然令人不满意。例如，虽然BigSleep 能够以不同的风格生成图像并创造有趣的视觉艺术，但在生成清晰和逼真的图像方面存在困难，生成的图像可能只与 query 文本弱相关。如图 1 所示（每个面板的右上角），BigSleep无法为 “蓝色狗” 这个简单概念生成一个清晰可辨认的图像。对于像 “火焰狗” 这样的反事实概念，BigSleep 生成的图像往往以一种不自然的方式纠缠了火焰和狗的概念。在图 1 中（每个面板的左上角），我们实施了另一个基准，使用现成的Adam [17] 优化器在 BigGAN [4] 的输入空间中最大化 CLIP 分数，结果甚至比 BigSleep 更糟糕。

在这项工作中，我们分析了现有 CLIP+GAN 过程中的问题。我们确定了该方法存在的三个关键瓶颈，并通过一系列技术来显著改进这个流程。

稳健分数：我们观察到原始的 CLIP 分数在 GAN 空间中并不适用作为优化的良好目标函数，因为它倾向于生成语义无关的图像，这些图像 “对抗性” 地最大化了 CLIP 分数。我们提出了 AugCLIP分数，通过对输入图像的多个扰动或增强进行平均来稳健 CLIP 分数。
改进的优化策略：在 GAN 空间中最大化 CLIP 分数会产生一个高度非凸的多模态优化问题，现成的优化方法往往会陷入次优的局部最大值。我们通过一种新颖的初始化和过参数化策略来解决这个问题，允许我们更有效地在非凸损失中遍历。
组合生成：CLIP+GAN 方法的图像空间受到我们使用的预训练 GAN 的限制。这使得难以生成在GAN 的训练数据中没有出现的对象的新组合的图像。我们通过提出一种组合生成技术来解决这个问题，该技术共同优化两个图像，使它们可以无缝地组合在一起，产生自然且在语义上相关的图像。我们将组合生成制定为一种新颖的双层优化问题，最大化 AugCLIP 分数，同时将感知一致性分数作为次要目标，并利用一种最近的动态障碍梯度下降算法 [11] 有效地解决它。

我们的流程，我们称之为 FuseDream（名称中的 “fuse” 指的是： 1. 融合 GAN 和 CLIP 以及 2. 我们的组合生成技术），不仅可以从复杂的文本描述中生成清晰的对象，还可以生成类似 MS COCO [19] 中的复杂场景。由于 CLIP 的表征能力，FuseDream 可以创建具有不同背景、纹理、位置、艺术风格甚至反事实对象的图像。借助组合生成技术，FuseDream 可以创建具有在我们使用的 GAN 的原始训练数据中没有出现的对象的新组合的图像。与直接训练大规模文本到图像生成模型相比，我们的方法在保持可比甚至更好的结果的同时更加计算友好。

2. CLIP+GAN 文本到图像生成

首先，我们介绍通过结合预训练图像生成器（特别是 GAN）和联合图像+文本编码器（特别是CLIP）进行文本到图像生成的一般思路。然后，我们分析这种方法的朴素实现的一个关键限制。

GAN：图像生成器 g：R^D → R^(H×W×3) 是一个神经网络，接受一个 D 维潜在编码 ξ，并输出尺寸为 H × W 的彩色图像 I。形式上，I = g(ξ)。

可以通过控制输入的 ξ 生成和操纵不同的图像。在这项工作中，除非另有说明，我们使用 BigGAN [4]，这是一个类别条件的 GAN，其潜在向量 ξ = {z, y} 包括一个高斯噪声向量 z ∈ R^Z 和一个类别嵌入向量 y ∈ R^Y。它是在大规模的 ImageNet数据集 [27] 上训练的，包含来自 1,000 个不同类别的对象。

CLIP：一个联合图像-文本编码器，尤其是对比语言-图像预训练（Contrastive Language-Image Pretraining, CLIP）[24]，由语言编码器 f_text 和图像编码器 f_image 组成，它们将文本 T 和图像 I 映射到一个共同的潜在空间，通过余弦相似性可以评估它们的相关性。

CLIP 模型经过训练，使得语义相关的文本-图像对 T 和 I 具有高相似性分数。

CLIP+GAN：通过结合预训练的 GAN g 和 CLIP {f_text, f_image}，可以合成一个文本到图像的生成器。给定一个输入文本 T，我们可以通过优化潜在编码 ξ 生成一个与 T 在语义上相关的逼真图像 I，使得生成的图像 I = g(ξ) 具有最大的 CLIP 分数 s_CLIP(T, I)。形式上，

这将使输出图像限制在自然图像的空间内，同时最大化与输入文本的语义相关性。在 [20, 39] 中，使用 Adam [17] 解决优化问题。在使用 BigGAN [4, 16] 时，通常的做法是将 z 截断为 [-2, 2]。

2.1 CLIP容易受到攻击并陷入困境

简单地解决（2）不会产生令人满意的图像，如图 1 左上角的图像所示。我们观察到不令人满意的结果可以归因于两个相互关联的原因：

CLIP 分数很容易受到 “攻击”，即在任何图像的小邻域内很容易最大化 CLIP，表明存在具有高CLIP 分数但与输入文本关联性低的 “对抗性” 图像。
在（2）中的优化实际上可以有效地作为对 s_CLIP 的对抗性优化，产生与初始化相似但虚假高 CLIP 分数的图像。

案例研究 1：攻击 CLIP。如图 2 所示，我们对自然图像 I 应用对抗攻击器，使用 Fast Gradient Sign Method（FGSM）[13] 在 sCLIP 上进行操作，即解决 max s_CLIP(I + δ) s.t. ||δ|| ≤ ε，其中小扰动的幅度 ε > 0。我们发现 FGSM 可以轻松找到一个几乎与原始图像相同但具有更高 CLIP 分数的图像。这表明在直接最大化 CLIP 分数时存在 “过拟合” 的危险。

案例研究 2：Dog → Cat。在图 3 中，我们展示了使用输入文本 T = ‘一张猫的照片’ 优化（2）的一个示例，从一个初始化的 ξ^0 开始，其图像 I = g(ξ^0) 是一只狗。我们可以看到尽管成功地最大化了 s_CLIP，图像仍然与初始化相似，并且没有按预期从狗转变为猫。在这种情况下，（2）中的优化表现出对抗性攻击的行为：它在初始化附近被困住，同时虚假地增加了 CLIP 分数。

在上述两种情况中，可以通过使用我们在接下来介绍的 AugCLIP 分数来解决问题。

3. 我们的方法 - FuseDream

我们现在介绍改进 CLIP+GAN 管道的主要技术。第 3.1 节介绍了 AugCLIP 分数，该分数使 CLIP分数更加健壮，以避免对抗性攻击现象。第 3.2 节介绍了一种初始化和过参数化（over-parameterization）技术，以更好地解决非凸优化问题。第 3.3 节介绍了一种组合生成方法，用于生成具有新颖对象和背景组合的分布外图像。

3.1 AugCLIP：避免对抗生成

为了解决 CLIP 分数的对抗性攻击问题，我们提出以下 AugCLIP 分数。

其中 I' 是来自候选数据增强分布 π(· | I) 的输入图像 I 的随机扰动。在我们的工作中，我们采用了 DiffAugment [38] 中考虑的各种数据增强技术，包括随机着色、随机平移、随机调整大小和随机剪裁。

由于 AugCLIP 必须同时攻击大多数随机增强图像上的 s_CLIP，这比攻击单个图像要困难得多，因此 AugCLIP 对抗对攻击更加稳健。对随机增强的平均化还使得攻击更加困难，正如理论和经验证明的那样 [5, 28]。同时，增加增强并不损害由 CLIP 编码的语义关系，因为 CLIP 模型最初是在具有不同着色、视图和平移的图像上训练的，因此与我们的增强策略兼容。

案例研究 1 和 2。如图 3 所示，AugCLIP 分数对抗对攻击更加稳健。图 4 显示，简单地用 s_AugCLIP 替换 s_CLIP 允许我们摆脱对抗生成并产生更具语义相关性的图像。

3.2 优化改进

由于损失的高非凸性，s_AugCLIP 的优化仍然可能受到次优局部极大值的影响。我们引入了一种初始化和过参数化策略来改善优化。与从单一初始化开始的传统方法不同，我们首先采样大量（ M 个）初始化副本

然后我们选择具有最高 AugCLIP 分数的前 k 个初始化，即

并将它们用作后续优化的初始基向量。换句话说，我们将解（solution）重新参数化为

并联合优化基向量和系数，其中 w(i) ∈ R。

其中，{ ξ_(i) } 初始化为选定的 k 个

而 w_(i) 初始化为 1/k。我们设置 M = 10,000（可以并行评估）和相对较小的 k（例如，k ≤ 15）。

尽管等式（4）中的优化等效于等式（2）中的优化，但它配备过参数化，以及更自然的坐标和更好的初始化，因此在使用基于梯度的优化方法时往往会产生更好的结果。特别是，组合权重 {w_(i)} 的更新对应于在基向量

的线性空间中的快速全局移动，使其更容易逃离局部最优点。

在实践中，由于我们使用 BigGAN，潜在编码 ξ = (z, y) 被初始化为 z ~ N(0, I)，而 y 则从 ImageNet 的 1,000 类别的潜在表示中随机选择（这比我们在附录中展示的 y ~ N(0, I) 更好）。

基于梯度或无梯度的优化器？在这项工作中，我们采用了广泛使用的 Adam [17] 优化器。一些最近的工作推荐在 GAN 空间中进行优化时使用无梯度优化器，如 BasinCMA [3, 16, 32]，因为存在很高的非凸性。然而，我们的研究表明，与 Adam 相比，BasinCMA 往往会带来更高的计算成本，因为 BasinCMA 在每次迭代时需要在目标上进行大量前向传递，而 Adam 只需要单次前向和后向传递。经验上，我们发现 Adam 比 BasinCMA 快大约 20 倍。尽管基于梯度的方法比无梯度的方法更容易陷入局部最优点，但在我们的 AugCLIP 损失和提出的初始化和过参数化技术下，这不再是一个问题。我们在附录中包含了更多与 BasinCMA 的讨论和比较。

3.3 组合生成

CLIP+GAN 方法的图像空间受我们使用的 GAN 的表示能力限制。这使得该方法难以生成超出分布范围的图像，并且容易继承来自 GAN 的原始训练集的数据偏差，例如中心、空间和颜色偏差 [2, 16]。我们提出了组合生成，通过将 GAN 生成的两幅图像组合在一起，以增加图像空间并减少数据偏差，获得更高的灵活性。我们的方法共同优化前景图像 I_fg = g( ~ξ_fg) 和背景图像 I_bg = g( ~ξ_bg)，其中 ~ξ_fg 和 ~ξ_bg 是两个过参数化的潜在编码，如公式 4 所示。这两幅图像用于生成融合图像

首先，设置 I_fg 的大小缩放因子为 α ∈ (0,1)，然后将其粘贴在 I_bg 上的九个位置（t ∈ {left, center, right}^2）之一。我们希望选择 ~ξ := {~ξ_fg, ~ξ_bg}，以及 ~α := {α , t}，以最大化 I 的 AugCLIP 分数：

另一方面，由于两个图像 I_fg 和 I_bg 是独立生成的，合成图像可能在边界上具有不自然和人工的不连续性。为了解决这个问题，我们引入了一个额外的损失，强制在 I_fg 和 I_bg 之间保持感知一致性，

其中，_per 代表 LPIPS 度量[37]，这是一种近似人类对图像相似性感知的度量。

因此，我们希望既最大化 AugCLIP 分数，又最小化感知损失 _Fuse。一个朴素的方法是优化它们的线性组合。然而，这将需要在生成每个图像时仔细而逐个案例地调整组合系数。

双层优化：我们提出了一种无调优方法，通过一个简单的双层（或词典）优化问题来组合这两个损失（参见例如 [8, 12]）

在这里，arg max sFuse 表示 s_Fuse 的（局部）极大值的集合。这个公式在 s_Fuse 的最优集合中寻找那些最小化 _Fuse 的点。它优先考虑优化 s_Fuse，同时将 _Fuse 作为次要损失进行考虑。

我们通过在离散集合 α ∈ {0.65, 0.5} 和 t ∈ {left, center, right}^2 上进行蛮力搜索来优化 ~α = {α, t}。对于每个固定的 ~α ，我们使用来自 [12] 的动态障碍梯度下降算法来优化连续向量 ~ξ，这产生了以下简单的迭代规则。

在这里，ε^t > 0 是步长；β 是一个超参数（默认为 1）。直观地说，可以将这个算法视为迭代地最小化线性组合的损失 _Fuse - λ_t·s_Fuse，其中系数 λ_t 动态地由梯度 ▽_Fuse 和 ▽s_Fuse 之间的角度决定，移除 -▽_Fuse 中与 ▽s_Fuse 冲突的成分，以确保 s_Fuse 在作为主要损失时单调递减。有关更多详细信息，请参阅附录和 [11]。

在实践中，我们通过将 v^t 视为梯度方向，将等式（6）与 Adam 结合起来。此外，我们通过在 I_fg 和 I_bg 上应用 Poisson blending 来获得最终的合成图像，从而产生更平滑的图像 I，遵循[16]。我们的算法总结在 Alg. 2 中。

4. 相关工作

在生成对抗网络（GAN）的潜在空间中进行优化的一般思想已被广泛应用作为一个强大的框架，用于生成、编辑和恢复图像；例如，参见 [1, 14, 16, 39] 等。例如，[39] 提出将真实图像投影到GAN 的潜在空间以编辑图像。[14] 把主成分分析（principal component analysis，PCA）应用到 GAN 空间，为图像合成创建可解释的控制。[16] 通过无梯度优化器 BasinCMA [3, 32] 优化潜在编码，将给定图像嵌入到 BigGAN [4] 中，以在 GAN 空间中实现灵活的图像编辑。最近的一项工作[7] 使用逐层优化来提高解决逆问题（inverse problems，例如超分辨率和修复）在 GAN 空间中的性能。大多数这些方法仅专注于图像域上的单一任务，而我们的方法旨在通过利用 CLIP 的能力将图像与文本连接起来。

在另一个方向上，使用 CLIP 分数 [24] 的思想已经在各个方向上得到了探索，包括视频检索 [21]、视觉问答 [30]和语言引导的图像操作/生成 [6, 10, 20, 23] 等。特别地，[23] 采用了 CLIP 和StyleGAN 来引导简单图像（通常是脸部、宠物或汽车的照片）的风格。[6, 10, 20] 是实现了基本GAN+CLIP 过程的开源存储库，我们通过新技术在这个基础上有了显著的改进。

5. 实验

我们将配备 BigGAN-256 的 FuseDream 与一些基线方法进行比较，包括 DM-GAN [40]、Obj-GAN [18]、CogView [9] 等。我们在流行的 MS COCO 数据集 [19] 上测试这些方法，并发现尽管BigGAN 在 ImageNet 上进行了预训练，但 FuseDream 明显优于基线方法。由于 CLIP 带来的丰富表示能力，FuseDream 可以生成具有不同方面的图像，包括艺术风格、天气、背景、纹理等，能够创造不存在的、反事实但合理的对象。此外，通过组合生成技术，我们可以生成具有多个对象的更好图像。请参见附录以查看论文中显示的图像的高分辨率副本。

在 MS COCO 测试集上的定量评估。为了与其他文本到图像生成方法进行比较，我们在从 COCO数据集中采样的 30,000 个标题的子集上评估我们的方法。我们遵循 [18, 31, 35, 40] 中提供的相同标准评估协议，使用 [18] 提供的官方代码。我们使用 Fréchet Inception Distance（FID）、Inception Score（IS）和 R-precision 来评估性能。对于 R-precision，按照 [18, 31, 35, 40] 的方法，我们计算全局图像向量与通过预训练的 CNN-RNN 检索模型 [35] 提取的 100 个候选句向量之间的余弦相似度。候选文本描述包括一个真实标题和 99 个随机选择的不相关句子。 R-precision 计算为所有 30,000 个生成图像的检索精度。我们随机重复该过程 3 次，并报告 R-precision 的均值和标准差。注意，基线 GAN 通常是针对最大化该分数进行训练的。为了公平比较，我们将 [35]中使用的检索模型替换为 CLIP 文本和图像编码器，并报告额外的 CLIP R-precision 分数。

结果如表 1 所示。FuseDream 在 IS 分数上达到了与真实图像相当的水平（34.26 对比 34.88）。与在数十亿互联网图像上进行训练并具有巨大计算成本的 DALL-E [25] 和 CogView [9] 相比，我们显著提高了 IS 分数，从约 18 提高到 34，FID从 27 降低到 21（例如，对于使用 BigGAN-256、k = 5 的 FuseDream，FID 为 21.16）。请注意，我们使用的 BigGAN 是在 ImageNet 上进行训练的，尽管评估是在 COCO 图像上进行的；通过使用在 COCO 数据集上训练的更强大的生成模型，我们可以期望获得更好的结果。

从 COCO 标题生成的图像。我们在图 7 中展示了 FuseDream 根据 COCO 数据集中的输入标题生成的一些图像。FuseDream 生成具有更多细节和目标的图像。例如，对于给定的 “夜晚商业街角上的交通和人群”，FuseDream 可以生成人群、汽车和繁华的街道，灯光璀璨。

变化的艺术风格。尽管 BigGAN 是在 ImageNet 上训练的，其中的图像大多是现实的，但通过CLIP，FuseDream 能够以不同的艺术风格生成有意义的图像，如图 6 中的第一行所示。这些图像具有六种不同的风格，例如照片、单色、版画、绘画、抽象绘画和水墨画。即使输入句子很复杂，我们也可以生成具有许多粒度的有意义的虚假图像。给定来自 Percy Shelley 的《致西风颂》的句子（“古老的宫殿和塔楼在波涛汹涌的日光中颤动”），FuseDream 成功生成了宫殿、塔楼、波涛和日光。

变化的纹理、背景和更多内容： 如 [14, 29] 所示，在标准 GAN 中很难控制纹理和背景。然而，FuseDream 可以通过输入句子很好地控制图像的纹理和背景。如图 6 的第二行和第三行所示，FuseDream 可以轻松将汽车放在不同的背景中（例如水下、夜晚、天空），并具有不同的纹理（例如丰富多彩的光辉、星空、幽灵）。将对象更改为机器人，我们还可以在不同的天气条件下（例如雨天、阳光明媚、雪天）生成有意义但虚假的机器人。此外，通过生成明显不同的餐点，FuseDream 似乎表现出对文化差异的理解：美国的餐点包含玉米、土豆泥和炸鸡；俄罗斯的餐点包含黑面包和俄式红菜汤；中国的餐点包含蛋饺和春卷。

生成反事实内容： 在先前的例子中，我们展示了一些反事实的例子，例如图 1 中的燃烧的狗，图 6 中的天空中的汽车。在这里，我们使用 FuseDream 生成更多具有不同对象、背景和风格的高质量反事实图像。图 8 展示了我们可以生成 “发光发亮的狗”、“天空中的城堡”、“立方体蝴蝶” 和 “水下森林” 等图像。这些图像具有不同的对象、背景和风格，并且在现实世界中不存在，也不在BigGAN 的 ImageNet 训练数据中。令人惊讶的是，尽管我们从未更改 BigGAN 的参数，FuseDream 成功地生成了这些高质量的跨域图像。

FuseDream-Composition 中的多个概念： 通过生成包含两个对象的图像，我们验证了组合生成技术的性能。这两个对象通常不会在正常图像中同时出现，例如猫和蝴蝶，狗和教堂等。如图 9 所示，FuseDream（使用单个图像生成）可能将两个对象缠绕在一起，或者遗漏其中一个对象。例如，“一只狗靠近一艘船” 生成了一艘带有狗状帆的船。“一只蝴蝶靠近一艘船” 只生成了一只蝴蝶，而忽略了船。然而，通过使用组合生成，我们可以生成包含两个对象的图像。即使对于更复杂的句子，我们也可以生成有意义且高质量的图像（见图 9 中的第二行）。

为验证我们的方法对随机种子的鲁棒性，我们在图 10 中为 “一只色彩斑斓的机器人在月光下走在冰冻的湖面上” 生成了更多的图像；我们获得了与句子相关的多样化的图像集。

6. 结论

我们提出了 FuseDream，利用 CLIP 引导的 GAN 实现高质量、最先进的文本到图像生成。与传统的基于训练的方法相比，我们的方法无需训练，零样本，易于定制，因此易于访问计算资源有限或有特殊需求的用户。我们的新颖技术，如 AugCLIP 分数、过参数化优化（over-parameterized optimization）和组合生成（composed generation），具有独立的兴趣，并在其他潜在空间优化问题中具有用处。

S. 总结

S.1 主要贡献

相比于传统的从头训练的文本到图像生成，CLIP+GAN 是无需训练的、zero-shot 的，并且可以轻松定制以适应不同的生成器。

本文提出了一种 FuseDream，通过三种关键技术改进了 CLIP+GAN 方法： 1）提出 AugCLIP 分数：通过在图像上引入随机增强，来避免 CLIP 分数的对抗攻击现象。2）利用新颖的初始化和过参数化（over-parameterization）策略，从而可在 GAN 空间中的非凸区域进行优化。3）利用双层优化，组合多个图像以扩展 GAN 空间。

S.2 方法

AugCLIP。CLIP 分数存在对抗性攻击问题：一张图像与原始图像相同，但具有更高 CLIP 分数。为解决这个问题，提出了 AugCLIP 分数：

其中 I' 是来自候选数据增强分布 π(· | I) 的输入图像 I 的随机扰动。本文采用了 DiffAugment 中考虑的各种数据增强技术，包括随机着色、随机平移、随机调整大小和随机剪裁。

初始化和过参数化。

由于损失的高非凸性，s_AugCLIP 的优化仍然可能受到次优局部极大值的影响。本文引入了一种初始化和过参数化策略来改善优化。
与从单一初始化开始的传统方法不同，本文首先采样大量（ M 个）初始化副本，然后选择具有最高 AugCLIP 分数的前 k 个初始化，并将它们用作后续优化的初始基向量。
因为它有过参数化，以及更自然的坐标和更好的初始化，因此在使用基于梯度的优化方法时往往会产生更好的结果。

组合生成和双层优化。

通过将 GAN 生成的两幅图像组合在一起，以生成超出分布范围的图像。
该方法共同优化前景图像和背景图像，然后用这两幅图像生成融合图像。
为避免合成图像可能在边界上具有不自然和人工的不连续性，引入了一个额外的感知损失，强制前景和背景之间保持感知一致性。
最终目标是最大化 AugCLIP 分数，并最小化感知损失。一个朴素的方法是优化它们的线性组合。然而，这将需要在生成每个图像时仔细而逐个案例地调整组合系数。本文提出了一种无调优方法，通过一个简单的双层（或词典）优化问题来组合这两个损失。

你可能感兴趣的:(论文笔记,生成对抗网络,人工智能,神经网络)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR