whiteboy1999

深度?|?如何在TensorFlow?中用深度学习修复图像？（附论文）

选自bamos.github.io

作者：Brandon Amos

机器之心编译

参与：quantum Cheese、杜夏德

设计师和摄影师用内容自动填补来补充图像中不想要的或缺失的部分。与之相似的技术还有图像完善和修复。实现内容自动填补，图像完善和修复的方法有很多。本文介绍的是 Raymond Yeh 和 Chen Chen 等人的论文「Semantic Image Inpainting with Perceptual and Contextual Losses」中的方法，此论文于 2016年 7月 26日在 arXiv 上发表。这篇论文演示了如何通过一个 DCGAN 用深度学习进行图像修复。本文面向一般的技术读者，有部分深度内容针对有机器学习基础的人。加 [ML-Heavy] 这个标记的部分如果你不想知道太多细节就可以跳过。本文案例用的是修补人脸图片缺失像素。

介绍
第一步：把图像解析成概率分布中的样本点
第二步：快速生成伪造图像
第三步：找到修复图像的最佳伪造图片
结论

完成图像修复需要三步。

1. 我们首先要把图像解析成概率分布中的样本点

2. 这种解析让我们学习如何产生伪图像

3. 接着我们就能找到补全修复所需的最佳伪图像

　　例如 PS中自动抹去图像中不想要的部分（图像来源：CC）

　　第一步：把图像解析成概率分布中的样本点

如何填补缺失的信息呢？

在上面的例子中，想象你要构建一个填补缺失碎片的系统。你该怎么做呢？你认为人脑是如何做到的呢？你用到的是何种信息？在本文中我们主要关注两种类型的信息：

1. 环境信息：你可以通过周围像素点的信息推断出缺失的像素点是什么。

2. 知觉信息：你会填补一些你认为是「正常」的内容，比如你在现实生活中或其他图像中可能看到的东西。

这两类信息都很重要。没有环境信息，你如何知道该填补什么东西呢？而没有知觉信息的话，那合适的填充内容就太多了。那些机器认为是「正常」的东西也许对人类来说并不正常。

有一个能同时抓住这两点特性的准确又直观的算法是很棒的，这个算法能够逐步展示如何修复一个图像。对特定情形创造这样一个算法也许是可能的，但没有人知道如何写出一个通用的算法。今天最好的方法用的是统计学，并通过机器学习去学习一个接近的技术。

但统计学怎么能用在这里呢？这些是图像啊！

为了解决这个问题，让我们从一种概率分布入手，这种分布已经为人熟知并且可以简洁地用封闭的形式表示：正态分布。这里是正态分布的概率密度函数（probability density function ，PDF）的。PDF函数可以这样解释：沿着输入空间的水平方向，纵坐标轴显示的是某个输入出现的概率。（如果你感兴趣，画出这种曲线的代码在 https://github.com/bamos/dcgan-completion.tensorflow/blob/master/simple-distributions.py）

　　一个正态分布的概率密度函数（PDF）

让我们从这个分步中取样以获取一些数据。要确保你理解了PDF 和这些样本的联系。

　　一个正态分布中取出的样本

这是一个一维概率分布，因为输入只有一个维度。我们可以对二维分布做同样的事情。

一个二维正态分布的 PDF 和样本。PDF 用等值线表示，样本覆盖在它上方。

图像和统计学之间的关键联系在于，我们可以把图像解析成一个高维概率分布中的样本点。想象一下你正拿着相机拍照。这张照片上有数量有限的像素点。你可以认为你刚拍下的这张照片上的像素点的概率组成了一个概率分布。当你用相机拍这张照片时，你就是在从这个复杂的概率分布中取样。这种分布就是我们用来判断什么样的内容正常或不正常的依据。在本文中，我们要用的是用 RGB 颜色模式表示的彩色图片。我们的图像宽度为64像素，高度也为64像素，因此我们的概率分布有 64?64?3≈12k 个维度。图片不像正态分布，我们不知道真正的概率分布，我们只能收集样本点。

　　那么该怎样修复图片呢？

让我们首先考虑下之前的多元动态分布。对于 x=1 ，最有可能的 y 值是多少？我们可以通过 x=1 固定时在所有可能的 y 值上最大化 PDF 的值来找到这个 y 。

　　在一个多元正态分布中当 x 为某些固定值时找到对应最有可能的 y 值

当我们知道一些值并想修复所有缺失值时，这个概念很自然地就延伸到了图像概率分布中。我们在寻找所有可能的缺失值时，就把它当作了一个最大化问题来讨论。修复得到的就是可能性最大的图像。如果直接观察正态分布中那些样本点，只从样本点中找到 PDF 似乎是合理的。挑选你最喜欢的统计模型并且用它来拟合数据就可以了。

虽然很容易能从样本分布中复原出 PDF，但对于图像这种更复杂的分布这其实很困难，而且通常都很棘手。这种复杂性部分来自于复杂的条件相关性：一个像素点的值是由图像中其他点的值决定的。而且在通用 PDF 上进行最大化是一个极其困难而且几乎是难解型非凸优化问题。

第二步：快速生成伪造图像

学习如何从一个未知概率分布中产生新样本点

我们不学习如何计算 PDF，另一种充分研究过的统计学概念是学习如何用一个生成模型（generative model）产生新的（随机）样本点。生成模型一般很难训练或难解，但最近深度学习领域在这方面取得了很大进展。Yann LeCun 在这篇 Quora 博文中对如何训练生成模型给出了很好的介绍，把它描述成机器学习近十年来最有意思的理念：

Yann LeCun 在这篇Quora 博文中介绍了对抗性训练。(博文地址：_https://www.quora.com/What-are-some-recent-and-potentially-upcoming-breakthroughs-in-deep-learning/answer/Yann-LeCun?srid=nZuy_ (https://www.quora.com/What-are-some-recent-and-potentially-upcoming-breakthroughs-in-deep-learning/answer/Yann-LeCun?srid=nZuy)）

EyeScream 博文中的对抗训练的街头霸王游戏类比（Street Fighter analogy for adversarial networks）。（博文地址：http://soumith.ch/eyescream/）这些网络互相争斗并且一起发展进步，就像两个玩对战游戏的人类。

[ML-Heavy] 生成对抗网络（Generative Adversarial Net ，GAN）的架构

这个理念起初是在 Ian Goodfellow 等人的开创性论文「Generative Adversarial Nets（GANs）」中提出的，论文于2014年的神经信息处理系统会议（Neural Information Processing Systems，NIPS）上发表。我们定义一个样本和一个大家都熟知的分布，把它表示为 pz。这篇博文剩下的部分，我们都会用pz来表示一个－1到1（包括－1和1）之间的均匀分布。我们用 z~ pz 来表示从这个分布中取样出一个数字。如果 pz 是五维的，我们可以通过 numpy 用一行 Python 代码表示：

z = np.random.uniform(-1, 1, 5)array([ 0.77356483, 0.95258473, -0.18345086, 0.69224724, -0.34718733])

现在我们就有了一个可以轻松从中取样的简单分布了，我们可以定义一个函数G(z)，这个函数可以从原始概率分布中生成样本点。

def G(z):

...

return imageSamplez = np.random.uniform(-1, 1, 5)imageSample = G(z)

所以我们怎么来定义G(z)以让它一个输入向量，并返回一个图像？我们将使用一个深度神经网络。有许多很棒的介绍深神经网络的基础知识，所以我不在这里说了。我的推荐是斯坦福的 CS231n （http://cs231n.github.io/）课程，Ian Goodfellow 等人的深度学习相关书籍（http://www.deeplearningbook.org/），图像内核可视化解释（http://setosa.io/ev/image-kernels/）和卷积算法指南（ convolution arithmetic guide ）

有很多通过深度学习构建G(z)的方法。最早那篇生成对抗网络论文提出了这个理念，一个训练流程，和初步的实验性结果。后续很多研究都建立在这个理念上，现在有了很大进展。最近一篇论文「用深度卷积生成对抗网络进行非监督表征学习（Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks）」中就提出了一个新方法，该论文由 Radford, Luke Metz, 和 Soumith Chintala 在2016年的学习表示国际会议（International Conference on Learning Representations）上发表。它提出了用微步幅（fractionally-strided）卷积进行图像上采样（upsample）的卷积生成对抗网络（ DCGAN）。

什么是微步幅卷积，它们又是如何进行图像上采样的呢？Vincent Dumoulin 和 Francesco Visin 的论文「深度学习的卷积算法指南（A guide to convolution arithmetic for deep learning）」和 conv_arithmetic（https://github.com/vdumoulin/conv_arithmetic）是一个写的很好的对深度学习卷积算法的介绍。这个可视化做的非常棒，很直观的展现了微步幅卷积是如何工作的。首先，确保你能理解一个正常的卷积是如何在输入空间（蓝色）滑过一个内核并产生输出空间（绿色）的。这里，输出比输入小。（如果不理解，请参阅 the CS231n CNN section (http://cs231n.github.io/convolutional-networks/) 章节或卷积算法指南。

　　一个从输入（蓝色）到输出（绿色）的卷积示意图。图像来源： vdumoulin/conv_arithmetic

接下来，假设你有一个 3x3 的输入。我们的目标是上采样，因此输出更大些。你可以把为步幅卷积解释成扩展像素点，这样像素点之间就填充了很多0。然后在这个扩大后的空间上卷积，就会导致更大的输出。这里，输出是 5x5。

从输入（蓝）到输出（绿）的微步幅卷积示意图。图像来源：vdumoulin/conv_arithmetic

这里写一个边注，上采样的卷积层有很多名字：全卷积（full convolution），网络内上采样（ in-network upsampling），微步幅卷积（fractionally-strided convolution），反向卷积（backwards convolution），去卷积（deconvolution），上卷积（upconvolution），以及转置卷积（transposed convolution）。用「去卷积」这个术语是非常不推荐的，因为这是一个过载的术语：在数学运算或计算机视觉中的其他应用有着完全不同的含义。

现在我们有了微步幅卷积作为积木，我们终于可以表示 G(z) 了，它用一个向量 z~ p_z 作为输入，并输出一个 64x64x3 的RGB图像。

　　一种用 DCGAN 构建生成器 G(z) 的方法。图像来源：DCGAN paper

DCGAN 论文还展现了其他的技巧，还有对 DCGAN 训练的调节方法，比如用批归一化（batch normalization）或 leaky ReLU。

用 G(z) 产生伪图像

让我们暂停，感激一下这个 G(z) 方程有多强大吧。那篇 DCGAN 论文解释了如何在一个卧室图像数据集中训练 DCGAN。接着对 G(z）取样，就可以产生出伪图片—生成器认为的卧室样貌。这些图片都不在原始数据集中！

用 DCGAN 生成卧室图像。图片来源：DCGAN paper

而且你也可以在 z 输入空间中进行向量算法。接下来是在一个被训练得可以生成脸部图像的网络上。

用 DCGAN 的脸部算法。图片来源：DCGAN paper

[ML-Heavy]训练DCGANs

现在我们已经定义了 G(z)，并且见识到了这个方程有多强大，我们该如何训练它呢？我们需要找到很多潜在变量。这就是需要用到对抗网络理念的地方了。

首先让我们定义一些标识符。把我们数据的（未知）概率分布定义成 pdata。我们也可以把 G(z) （z~pz）解释成从一个概率分布中提取样本点，让我们把它叫做生成概率分布，pg。

鉴别器网络 D(x) 输入某个图像 x，并返回图像 x 从 pdata 中取样的概率。当图像是来自于pdata 时，鉴别器应该能返回一个接近1的值，而如果图像时伪造的，比如从 pg 取样的图像，鉴别器应该能返回一个接近 0 的值。在 DCGAN 中，D(x) 是一个传统卷积网络。

　　鉴别器卷积网络。图像来源：inpainting paper

训练鉴别器 D(x) 的目标是：

　　1. 对于真实数据分布 x~ pdata中的每个图像最大化 D(x)。

2. 对于来自非真实数据分布 x? pdata 的每个图像把 D(x) 最小化。

　　训练生成器 G(z) 的目标是生成那些可以欺骗 D 的样本。生成器输出的是一个图像，而且可以用作鉴别器的输入。因此生成器想要最大化 D(G(z))，或者同样的最小化（1-D(G(z)），因为 D 是估值范围在 0 和 1 之间的概率分布。

正如那篇论文中展示的，对抗网络的训练是通过以下的极大极小游戏完成的。第一个条件的期望遍历了真实数据分布和的样本，第二个条件的期望遍历 G(z)~pg 中的样本。

　　我们对D 和 G 的训练将通过取得期望值梯度并考虑它们的参数进行。我们知道如何快速计算这个表达式的每个部分。期望值是在尺寸m的微型批次中计算的，内部最大值可以用梯度步估算出来。k=1 被证明有利于训练。

把 θd 作为鉴别器的参数，θg 作为生成器的参数。θd 和 θg 的梯度可以通过反向传播计算出来，因为 D 和 G 是用容易理解的神经元网络成分定义的。这是 GAN 中的训练算法。理想情况下一旦这一步完成后，pg=pdata，因此 G(z) 就能从 pdata中产生出新的样本点。

GAN paper里的GAN训练算法

已有的GAN和 DCGAN实现方法

GitHub 上有很多好的 GAN 和 DCGAN 实现方法：

goodfeli/adversarial (https://github.com/goodfeli/adversarial): GAN 论文作者放出的 Theano GAN 实现方法。tqchen/mxnet-gan (https://github.com/tqchen/mxnet-gan): 非正式MXNet GAN实现。
Newmu/dcgan_code (https://github.com/Newmu/dcgan_code): DCGAN 论文作者放出的Theano DCGAN 实现方法。
soumith/dcgan.torch (https://github.com/soumith/dcgan.torch): DCGAN 论文作者之一（Soumith Chintala）放出的Torch DCGAN 实现方法。
carpedm20/DCGAN-tensorflow (https://github.com/carpedm20/DCGAN-tensorflow): 非正式 TensorFlow DCGANU 实现。
openai/improved-gan (https://github.com/openai/improved-gan): OpenAI (https://arxiv.org/abs/1606.03498)第一篇论文背后的代码。大幅修正了carpedm20/DCGAN-tensorflow。
mattya/chainer-DCGAN (https://github.com/mattya/chainer-DCGAN):非正式 Chainer DCGAN 实现。
jacobgil/keras-dcgan (https://github.com/jacobgil/keras-dcgan): 非正式（也不完整）Keras DCGAN 实现。

接着，我们将在 carpedm20/DCGAN-tensorflow (https://github.com/carpedm20/DCGAN-tensorflow)进行构建。

[ML-Heavy]TensorFlow上的 DCGANs

这部分的实现方法在我的GitHub资源库中（bamos/dcgan-completion.tensorflow (https://github.com/bamos/dcgan-completion.tensorflow) ）我在这里着重强调这部分的代码来自Taehoon Kim 的资源库（ carpedm20/DCGAN-tensorflow (https://github.com/carpedm20/DCGAN-tensorflow) ）。在这里用我的资源库，这样在下个环节我们就能轻松运用图片修复的部分了。

这个过程大部分都在一个叫做 DCGAN 的 Python 类（class）中（model.py (https://github.com/bamos/dcgan-completion.tensorflow/blob/master/model.py)）。像这样把所有东西都放在一个类中非常有用，因为训练后中间状态可以被保存起来，以便后面使用。

首先让我们定义生成器和鉴别器。linear, conv2d_transpose, conv2d, 和 lrelu 函数都是在 ops.py (https://github.com/bamos/dcgan-completion.tensorflow/blob/master/ops.py) 中定义的。

　　def generator(self, z, y=None):

　　self.z_, self.h0_w, self.h0_b = linear(z, self.gf_dim*8*4*4,

　　'g_h0_lin', with_w=True)

　　self.h0 = tf.reshape(self.z_, [-1, 4, 4, self.gf_dim * 8])

　　h0 = tf.nn.relu(self.g_bn0(self.h0))

　　self.h1, self.h1_w, self.h1_b = conv2d_transpose(h0,

　　[self.batch_size, 8, 8, self.gf_dim*4], name='g_h1', with_w=True)

　　h1 = tf.nn.relu(self.g_bn1(self.h1))

　　h2, self.h2_w, self.h2_b = conv2d_transpose(h1,

　　[self.batch_size, 16, 16, self.gf_dim*2], name='g_h2', with_w=True)

　　h2 = tf.nn.relu(self.g_bn2(h2))

　　h3, self.h3_w, self.h3_b = conv2d_transpose(h2,

　　[self.batch_size, 32, 32, self.gf_dim*1], name='g_h3', with_w=True)

　　h3 = tf.nn.relu(self.g_bn3(h3))

　　h4, self.h4_w, self.h4_b = conv2d_transpose(h3,

　　[self.batch_size, 64, 64, 3], name='g_h4', with_w=True)

　　return tf.nn.tanh(h4) def discriminator(self, image, reuse=False, y=None):

　　if reuse:

　　tf.get_variable_scope().reuse_variables()

　　h0 = lrelu(conv2d(image, self.df_dim, name='d_h0_conv'))

　　h1 = lrelu(self.d_bn1(conv2d(h0, self.df_dim*2, name='d_h1_conv')))

　　h2 = lrelu(self.d_bn2(conv2d(h1, self.df_dim*4, name='d_h2_conv')))

　　h3 = lrelu(self.d_bn3(conv2d(h2, self.df_dim*8, name='d_h3_conv')))

　　h4 = linear(tf.reshape(h3, [-1, 8192]), 1, 'd_h3_lin')

　　return tf.nn.sigmoid(h4), h4

当我们初始化这个类时，我们就用这些函数创造了模型。我们需要两种版本的鉴别器，他们共享（或再使用）同样的参数。一个用于来自数据分布的小批图像，另一个用于来自生成器的小批图像。

self.G = self.generator(self.z)self.D, self.D_logits = self.discriminator(self.images)self.D_, self.D_logits_ = self.discriminator(self.G, reuse=True)

接着，我们将定义损失函数。在这里不用求和（sums），我们用D的预测和我想让它更好地工作而对它的期望之间的交叉熵（ cross entropy (https://en.wikipedia.org/wiki/Cross_entropy)）。鉴别器想让来自真实数据的预测都为1，而来自生成器的假造数据都为0。生成器想让鉴别器的所有预测都为1.

　　self.d_loss_real = tf.reduce_mean(

　　tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits,

　　tf.ones_like(self.D)))self.d_loss_fake = tf.reduce_mean(

　　tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits_,

　　tf.zeros_like(self.D_)))self.d_loss = self.d_loss_real + self.d_loss_fakeself.g_loss = tf.reduce_mean(

　　tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits_,

　　tf.ones_like(self.D_)))

分别从每个模型中收集变量，让它们可以被分开训练。

t_vars = tf.trainable_variables()self.d_vars = [var for var in t_vars if 'd_' in var.name]self.g_vars = [var for var in t_vars if 'g_' in var.name]

现在我们准备好优化参数了，我们要用的是 ADAM (https://arxiv.org/abs/1412.6980)，这是一种适应的非凸优化方法，通常用于现代深度学习中。ADAM 经常会与 SGD 竞争，而且通常不需要手动调节学习速率，动量，及其他超参数（hyper-parameter）。

　　d_optim = tf.train.AdamOptimizer(config.learning_rate, beta1=config.beta1) \

　　.minimize(self.d_loss, var_list=self.d_vars)g_optim = tf.train.AdamOptimizer(config.learning_rate, beta1=config.beta1) \

　　.minimize(self.g_loss, var_list=self.g_vars)

我们准备好遍历数据了。在每一个时期，我们在一个小批图片中取样，运行优化器升级网络。有趣的是，如果 G 只更新了一次，鉴别器的损耗就不会为零。而且，我认为最后对 d_loss_fake 和 d_loss_real 函数的额外调用引发了一点不必要的计算，而且是多余的，因为这些值已经作为 d_optim 和 g_optim 的一部分计算过了。作为 TensorFlow 中的一项练习，你可以试着用这个部分去优化，并给原始 repo 发送一个 PR 。

　　for epoch in xrange(config.epoch):

　　...

　　for idx in xrange(0, batch_idxs):

　　batch_images = ...

　　batch_z = np.random.uniform(-1, 1, [config.batch_size, self.z_dim]) \

　　.astype(np.float32)

　　# Update D network

　　＃更新一个 D 网络

　　_, summary_str = self.sess.run([d_optim, self.d_sum],

　　feed_dict={ self.images: batch_images, self.z: batch_z })

　　# Update G network

　　＃更新一个 G 网络

　　_, summary_str = self.sess.run([g_optim, self.g_sum],

　　feed_dict={ self.z: batch_z })

　　# Run g_optim twice to make sure that d_loss does not go to zero*

　　# (different from paper)

　　＃运行两次*g_optim 以确保 d_loss 不会变成0

　　＃（与论文里不一样）

　　_, summary_str = self.sess.run([g_optim, self.g_sum],

　　feed_dict={ self.z: batch_z })

　　errD_fake = self.d_loss_fake.eval({self.z: batch_z})

　　errD_real = self.d_loss_real.eval({self.images: batch_images})

　　errG = self.g_loss.eval({self.z: batch_z})

这就完成了！当然完整代码有更多注释，你可以在 model.py (https://github.com/bamos/dcgan-completion.tensorflow/blob/master/model.py) 上查看。

在你自己的图像上运行 DCGAN

这部分的实现方法在我的GitHub资源库中（bamos/dcgan-completion.tensorflow (https://github.com/bamos/dcgan-completion.tensorflow) ）我在这里着重强调这部分的代码来自Taehoon Kim 的资源库（ carpedm20/DCGAN-tensorflow (https://github.com/carpedm20/DCGAN-tensorflow) ）。我们在这里用我的资源库，这样在下个环节我们就能轻松运用图片修复的部分了。这里有一点警告，如果你没有装载了 CUDA 的 GPU，用这个部分的代码训练神经网络可能会非常慢。

如果下面的部分你用不起来请发信息给我！

　　首先让我们把我的 bamos/dcgan-completion.tensorflow (https://github.com/bamos/dcgan-completion.tensorflow) 和 OpenFace (http://cmusatyalab.github.io/openface) 资源库复制过来。我们要用 OpenFace 的 Python-only 部分预处理图像。不要担心，你不需要安装 OpenFace 的 Torch 附属。为这个创造一个新的工作目录，并复制资源库：

git clone https://github.com/cmusatyalab/openface.git

　　git clone https://github.com/bamos/dcgan-completion.tensorflow.git

下一步，安装 OpenFace 的 Python 库，这样我们就可以预处理图像了。OpenFace 现在用的是 Python 2,但如果你感兴趣的话，你把它做成 Python 3 可兼容的话我也很开心，别忘了发送一个这里提到的 PR。如果你用的不是虚拟环境，你应该在运行 setup.py 时用 sudo 去全局安装 OpenFace。

　　cd openface

　　pip2 install -r requirements.txt

　　python2 setup.py installcd ..

接着下载一个脸部图像数据集。你有没有标签都无所谓，我们会扔掉它们的。这里列出部分可选择的：: MS-Celeb-1M , CelebA ，CASIA-WebFace , FaceScrub, LFW (http://vis-www.cs.umass.edu/lfw/), 以及 MegaFace 。把数据集放入 dcgan-completion.tensorflow/data/your-dataset/raw 中，表明这个数据集是未经加工的图片。现在我们就用 OpenFace 的排列工具把图像与处理成 64x64 的。

./openface/util/align-dlib.py data/dcgan-completion.tensorflow/data/your-dataset/raw align innerEyesAndBottomLip data/dcgan-completion.tensorflow/data/your-dataset/aligned --size 64

最后我们就把排列好的图像目录平铺，这样它就只会包含图像而没有子目录了。

　　cd dcgan-completion.tensorflow/data/your-dataset/aligned

　　find . -name ' .png' -exec mv {} . \;

　　find . -type d -empty -deletecd ../../..

我们准备好训练 DCGAN 了。在安装了 TensorFlow 以后，开始训练。

./train-dcgan.py --dataset ./data/your-dataset/aligned --epoch 20

　　你可以在 samples 目录中查看来自生成器的随机取样图像看起来是什么样子。我在 CASIA-WebFace 和 FaceScrub 数据集上训练，因为我手头就有它们。在14个迭代周期后，我的图像看起来是这样的：

　　训练14个迭代周期后，我的DCGAN 中的样本，数据集结合了 CASIA-WebFace 和 FaceScrub。

　　TensorBoard 损耗的可视化，将在训练中实时更新。

　　DCGAN 网络的 TensorBoard 可视化。

第三步：找到修复图像的最佳伪造图片

用 DCGANs 修复图像

现在我们就有了一个训练好的鉴别器 D(x) 和生成器 G(z)，那如何用它们来修复图像呢？这个环节我要介绍的是 Raymond Yeh 和 Chen Chen 等人的论文「知觉和环境缺失下对图像的语义修复（Semantic Image Inpainting with Perceptual and Contextual Losses）」中提出的技术，这篇论文刚刚于2016年7月26日在 arXiv 上发表。

对于有些图像的修复，在像素点上进行 D(y) 最大化确实是一种合理但却不管用的方法。这会产生一些既不是来自数据分布 pdata也不是来自生成的分布 pg 中的结果。我们想要的是 y 在生成分布上的合理映射。

(a): y 在生成分布（蓝色）上的理想重建

(b): 试图只通过最大化 D(y) 重建 y 的失败例子。图像来源：inpainting paper

[ML-Heavy] pg上映射的损失函数

一个二进制标记的示意说明图

接下来，假设我们找到了一张来自生成器 G(z? ) （对某些 z? 的）的图像，它给出了一种对缺失部分的合理重构。那么补全后的像素点 (1?M)⊙G(z? )(1?M)⊙G(z? ) 就可以被加到原始像素点中，生成出重构后的图像：

　　现在我们所需要寻找的就是一些能够很好修复图像的z? 。为了找到z? ，让我们重新审视下本文一开始（在 DCGAN 那部分写到的）我们想要复原环境和感知信息的目标。我们将通过对一个任意的 z~ p_z 定义损耗函数做到这点。这些损耗函数的值更小就意味着 z 对于修复图像更合适。

环境缺失：为了保持与输入图像同样的环境信息，要确保已知输入图像 y 中的已知像素位置与 G(z) 中的像素位置相近。如果 G(z) 没有产生出一个与已知像素点相似的图像，我们就要惩罚它。正式的方法是从 G(z) 中 element-wise 减去 y 中的像素点，然后观察它们有多大差别：

||x||1=∑i|xi|||x||1=∑i|xi| 是某些向量 x 的 ?t 标准。 ?2 标准是另一个合理的选择，但那篇图像修复论文说 ?1 标准在实际应用中效果更好。在这个理想的情况下，所有已知位置的像素点在 y 和 G(z) 之间都是一样的。所以对已知像素点

G(z)i?yi= 0，因而Lcontextual(z)=0。

知觉缺失：为了复原出一张看起来很真实的图像，我们要让鉴别器确信这张图像看起来是真的。我们要用的是与训练 DCGAN 时同样的标准：

　　最终我们就会准备好用环境缺失和直觉缺失的结合来寻找 z? 了：

　　λ 是一个控制输入环节缺失如何与直觉缺失相联系的超参数。（我用了默认的 λ=0.1，而且还没有太多改变它。）接着就跟前面一样，重构后的图像用 y （G(z? )）填补了缺失值：

　　那篇图像修复论文也用了泊松混合使重构后的图像变得平滑。

用 DCGAN 修复图像的 Tensorflow 部署

这一环节展示了我添加到 bamos/dcgan-completion.tensorflow (https://github.com/bamos/dcgan-completion.tensorflow) ，修正了Kim 图像修复的 carpedm20/DCGAN-tensorflow (https://github.com/carpedm20/DCGAN-tensorflow)。

　　我们可以重新把很多已存在的变量用于修复。唯一加入的新变量就是一个修复标记：

　　self.mask = tf.placeholder(tf.float32, [None] + self.image_shape, name='mask')

我们要通过梯度下降法（gradient descent）迭代地解决argminzL(z)，梯度为?zL(z)。 TensorFlow 的自动分化可以自动为我们计算出这个，一旦我们定义了损耗函数！所以这整个用 DCGANs 修复的理念可以通过在已有的 DCGAN 上加入四行 TensorFlow 代码来实现。（当然我们还需要一些非TensorFlow 代码。）

　　self.contextual_loss = tf.reduce_sum(

　　tf.contrib.layers.flatten(

　　tf.abs(tf.mul(self.mask, self.G) - tf.mul(self.mask, self.images))), 1)self.perceptual_loss = self.g_lossself.complete_loss = self.contextual_loss + self.lam*self.perceptual_lossself.grad_complete_loss = tf.gradients(self.complete_loss, self.z)

接着，让我们定义一个标记。我已经在图像中心位置加了一个，但你可以自由添加其他的，比如一个随机标记，并把提出一个 pull 请求。

　　if config.maskType == 'center':

　　scale = 0.25

　　asser (scale <= 0.5)

　　mask = np.ones(self.image_shape)

　　sz = self.image_size

　　l = int(self.image_size*scale)

　　u = int(self.image_size*(1.0-scale))

　　mask[l:u, l:u, :] = 0.0

我们要用 minibatche 和动量把 z 映射到 [-1,1]范围内来进行梯度下降。

　　for idx in xrange(0, batch_idxs):

　　batch_images = ...

　　batch_mask = np.resize(mask, [self.batch_size] + self.image_shape)

　　zhats = np.random.uniform(-1, 1, size=(self.batch_size, self.z_dim))

　　v = 0

　　for i in xrange(config.nIter):

　　fd = {

　　self.z: zhats,

　　self.mask: batch_mask,

　　self.images: batch_images,

　　}

　　run = [self.complete_loss, self.grad_complete_loss, self.G]

　　loss, g, G_imgs = self.sess.run(run, feed_dict=fd)

　　v_prev = np.copy(v)

　　v = config.momentum v - config.lrg[0]

　　zhats += -config.momentum v_prev + (1+config.momentum)*v

　　np.clip(zhats, -1, 1)

修复你的图像

选择一些要修复的图像，然后把它们放到dcgan-completion.tensorflow/your-test-data/raw 中。在 asdcgan-completion.tensorflow/your-test-data/aligned 之前把它们排列好。我随机从 LFW 中选取了一些图像来做。

你可以用以下代码运行修复指令：

./complete.py ./data/your-test-data/aligned/***** --outDir outputImages

　　这会运行起来并周期性的输出修复过的图像给 —outDir。你可以用 ImageMagick 从中生成一个 gif 图像：

　　cd outputImages

　　convert -delay 10 -loop 0 before.png completed/ .png completion.gif

　　最终的图像修复。这些图像的中心都是自动生成的。相关源代码在 https://github.com/bamos/dcgan-completion.tensorflow 。这些并没有被监管！我是从LFW 数据集中随机选取了一个图像子集。

　　结论

本文讲述了修复图像的方法：

1. 把图像解析成一个概率分布中的样本点

2. 生成伪图像

3. 找到修复所需的最佳伪图像

　　本文用的例子是脸部图像，但 DCGANs也可以被训练做其他类型的图像修复。一般来说训练 GAN 有困难，现在还不知道如何在特定对象类上训练它们，也不知道如何在大图片上训练。但这是一个很有前景的模式，非常期待 GAN 研究日后的新进展。

ImageNet 上的 DCGAN 样本（左）和改进后的 GAN 样本（右，本文中为涉及到），表明我们还没有理解如何对每种类型图像运用 GAN 。图像来源：improved GAN paper 。

你可能感兴趣的:(深度?|?如何在TensorFlow?中用深度学习修复图像？（附论文）)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
直抒《紫罗兰永恒花园外传》雷姆的黑色童话
没看过《紫罗兰永恒花园》的我莫名的看完了《紫罗兰永恒花园外传》，又莫名的被故事中的姐妹之情狠狠地感动了的一把。感动何在：困苦中相依为命的姐妹二人被迫分离，用一个人的自由换取另一个人的幸福。之后，虽相隔不知几许依旧心心念念彼此牵挂。这种深深的姐妹情谊就是令我为之动容的所在。贝拉和泰勒分别影片开始，海天之间一个孩童凭栏眺望，手中拿着折旧的信纸。镜头一转，挑灯伏案的薇尔莉特正在打字机前奋笔疾书。这些片段
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
2020-12-16 长寿富贵
9：56不知今天哪位亲来说说话呀？成萌：尽尽皆是道。道道皆相同。不解呀？成萌：郁郁不得志，混混过日子。哦……说谁的呀？成萌：说自己呀……还能说谁呢？那如何办呢？成萌：回头……如何回头？成萌：回见心源。如何回见心源？成萌：不追不随诸相迁，如如不动在心田。啊？成萌：慢慢守心吧。
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
4招写出高价值文章 zhiliner
文章写得泛泛是因为思考得不够深，思考得越深文章会越有价值。拿到一个主题一定要去深入挖掘事件背后的东西，比如人物困境以及趋势性的东西。写作过程中有几个深度思考的方法一、解剖，让旧素材焕发新意作为一个写作者，我们能够做的最大贡献，就是给出自己看世界的角度。解剖其实就是把这个话题相关的信息都列出来，详细的列出来，看清楚它的内部。我们看到一个老话题或者一段旧素材的时候，不要只看这个素材或者话题本身，一定要
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
诡谲的一夜乔三鳞
门缝里有一些眼睛，我再熟悉不过了，眼睛总和门有关。上次开门的时候，母亲的义眼骨碌碌地滚到我的脚边，顺着滚动的轨迹看过去，原来是父亲又打了母亲。父亲常这样殴打母亲，抓着她的头，往墙上，重重地砸。母亲的眼睛会掉下来，地上有灰，所以总要洗洗才能装回眼窝里。我想，装回去的时候会疼的——很疼，因为母亲总是流出血泪。所以，在我的认知里，门和眼睛的关系是紧密的，现在也一样，门缝里那些如葡萄般一串串的眼睛，摘一个
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
安徽省这个湖,比西湖大8倍,称是安徽的北戴河, 合肥的后花园旅游小号角
旅游爱好者都知道，安徽省是一个旅游资源十分丰富的省份，且不说黄山、九华山、天柱山这三大名山，单说湖泊就不比其它省份少，今天我们一起走遍世界将为大家说说一个号称安徽北戴河，合肥后花园的湖泊，看看到底是哪个湖泊？话说，这个湖泊位于安徽省六安市舒城县境内，东距合肥50千米，大约一个小时左右的车程，它号称是合肥的后花园，安徽的北戴河。相传，湖畔石壁之上有一奇石神似观音临湖，湖中漂动众多小岛栩栩如佛子，宛若
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人北京大数据苏焕之
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人原创——莫转载粘贴有人选择昙花一现，如大理的花海，有人选择细水长流，如雨夜的浪漫。都说，五分喜欢的人恨不得将他挂在嘴边，十分喜欢的人却只舍得放在心里边了，在爱情眼里，对方说的每一句话都在乎你的感受，TA的眼里也只有你，我想也是这样！说起我的爱情，我也喜欢过一个忧郁的女孩，她喜欢的男孩不喜欢她，于是我成了她倾诉的朋友＋备胎，一年来我们互相推荐伤感的歌曲
xilinx vivado PULLMODE 设置思路坚持每天写程序 fpga开发
1.xilinx引脚分类XilinxIO的分类：以XC7A100TFGG484为例，其引脚分类如下：1.UserIO(用户IO)：用户使用的普通IO1.1专用(Dedicated)IO：命名为IO_LXXY_#、IO_XX_#的引脚，有固定的特定用途，多为底层特定功能的直接实现，如差分对信号、关键控制信号等，不能随意变更。1.2多功能(Multi-Function)IO：命名为IO_LXXY_ZZ
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，