c2a2o2

TensorFlow实现基于深度学习的图像补全

第一步：将图像理解为一个概率分布的样本
- 你是怎样补全缺失信息的呢？
- 但是怎样着手统计呢？这些都是图像啊。
- 那么我们怎样补全图像？
第二步：快速生成假图像
- 在未知概率分布情况下，学习生成新样本
- [ML-Heavy] 生成对抗网络(Generative Adversarial Net, GAN) 的架构
- 使用G(z)生成伪图像
- [ML-Heavy] 训练DCGAN
- 现有的GAN和DCGAN实现
- [ML-Heavy] 在Tensorflow上构建DCGANs
- 在图片集上跑DCGAN
第三步：找到用于图像补全最好的伪图像
- 使用 DCGAN 进行图像补全
- [ML-Heavy] 到 pgpg 的投影的损失函数
- [ML-Heavy] 使用tensorflow来进行DCGAN图像补全
- 补全图像
结论

简介

内容识别填充(译注: Content-aware fill ,是 photoshop 的一个功能)是一个强大的工具，设计师和摄影师可以用它来填充图片中不想要的部分或者缺失的部分。在填充图片的缺失或损坏的部分时，图像补全和修复是两种密切相关的技术。有很多方法可以实现内容识别填充，图像补全和修复。在这篇博客中，我会介绍 Raymond Yeh 和 Chen Chen 等人的一篇论文，“基于感知和语境损失的图像语义修补（Semantic Image Inpainting with Perceptual and Contextual Losses）”。

论文在2016年7月26号发布于 arXiv 上，介绍了如何使用 DCGAN 网络来进行图像补全。博文面向一般技术背景的读者，部分内容需要有机器学习的背景。我在相关章节标注了[ML-Heavy]标签，如果你不想了解太多细节，可以跳过这些章节。我们只会涉及到填充人脸图像缺失部分的情况。博文相关 Tensorflow 代码已经发布到 GitHub 上：bamos/dcgan-completion.tensorflow 。

图像补全分为三个步骤。

首先我们将图像理解为一个概率分布的样本。
基于这种理解，学习如何生成伪图片。
然后我们找到最适合填充回去的伪图片。

使用photoshop来对图像缺失部分补全

原文地址：http://bamos.github.io/2016/08/09/deep-completion/

译文地址：http://blog.csdn.net/han_xiaoyang/article/details/70214565

使用photoshop自动删除不要的部分

下文将要介绍到的图像补全。图像的中心是自动生成的。源码可以从此处下载。这些图像是我从 LFW 数据集中取得的一个随机样本。

第一步：将图像理解为一个概率分布的样本

你是怎样补全缺失信息的呢？

在上面的例子中，想象你正在构造一个可以填充缺失部分的系统。你会怎么做呢？你觉得人类大脑是怎么做的呢？你使用了什么样的信息呢？

在博文中，我们会关注两种信息：

语境信息：你可以通过周围的像素来推测缺失像素的信息。
感知信息：你会用“正常”的部分来填充，比如你在现实生活中或其它图片上看到的样子。

两者都很重要。没有语境信息，你怎么知道填充哪一个进去？没有感知信息，通过同样的上下文可以生成无数种可能。有些机器学习系统看起来“正常”的图片，人类看起来可能不太正常。

如果有一种确切的、直观的算法，可以捕获前文图像补全步骤介绍中提到的两种属性，那就再好不过了。对于特定的情况，构造这样的算法是可行的。但是没有一般的方法。目前最好的解决方案是通过统计和机器学习来得到一个近似的技术。

但是怎样着手统计呢？这些都是图像啊。

为了激发大家的思考，我们从一个很好理解、可以写成简洁形式的概率分布开始：一个正态分布。这是正态分布的概率密度函数（PDF）。你可以将PDF理解成在输入空间横向移动，纵轴表示某个值出现的概率。

如果你感兴趣，绘制这幅图的代码可以从 bamos/dcgan-completion.tensorflow:simple-distributions.py 下载。

从这个分布中采样，就可以得到一些数据。需要搞清楚的是PDF和样本之间的联系。

从正态分布中的采样

2维图像的PDF和采样。 PDF 用等高线图表示，样本点画在上面。

这是1维分布，因为输入只能沿着一个维度。在两个维度上也可以这么做。

在图像和统计学之间，最关键的联系就是，我们可以将图像看作是从一个高维概率分布中得到的采样。概率分布对应的是图像的像素。想象你在用相机拍照。得到的图像是由有限个数的像素组成。当你通过相机拍照的时候，你就在从这个复杂的概率分布中进行采样。这个概率分布就决定了我们判断一张图片是正常的，还是不正常的。对于图片而言，与正态分布不同的是，我们无法得知真实的概率分布，我们只能去收集样本。

在这篇文章中，我们会使用彩色图像，它用 RGB颜色表示。我们的图像宽64像素，高64像素，所以我们的概率分布是 64⋅64⋅3≈12k 维的。

那么我们怎样补全图像？

首先考虑多变量正态分布，以求得到一些启发。给定 x=1 , 那么 y 最可能的值是什么？我们可以固定x的值，然后找到使PDF最大的 y。

在多维正态分布中，给定x，得到最大可能的y

这个概念可以很自然地推广到图像概率分布。我们已知一些值，希望补全缺失值。这可以简单理解成一个最大化问题。我们搜索所有可能的缺失值，用于补全的图像就是可能性最大的值。

从正态分布的样本来看，只通过样本，我们就可以得出PDF。只需挑选你喜欢的

统计模型，然后拟合数据即可。

然而，我们实际上并没有使用这种方法。对于简单分布来说，PDF很容易得出来。但是对于更复杂的图像分布来说，就十分困难，难以处理。之所以复杂，一部分原因是复杂的条件依赖：一个像素的值依赖于图像中其它像素的值。另外，最大化一个一般的PDF是一个非常困难和棘手的非凸优化问题。

第二步：快速生成假图像

在未知概率分布情况下，学习生成新样本。

除了学习如何计算PDF之外，统计学中另一个成熟的想法是学习怎样用生成模型生成新的（随机）样本。生成模型一般很难训练和处理，但是后来深度学习社区在这个领域有了一个惊人的突破。Yann LeCun 在这篇 Quora 回答中对如何进行生成模型的训练进行了一番精彩的论述，并将它称为机器学习领域近10年来最有意思的想法。

生成模型

https://en.wikipedia.org/wiki/Generative_model

Yann LeCun 对生成对抗网络的介绍

将生成对抗网络类比为街机游戏。两个网络相互对抗，共同进步。就像两个人类在游戏中对抗一样。

其它的深度学习方法，比如 Variational Autoencoders(VAEs)，也可以用来训练生成模型。在这篇博文中，我们用的是生成对抗网络(Generative Adversarial Nets，GANs)。

[ML-Heavy] 生成对抗网络(Generative Adversarial Net, GAN) 的架构

这个想法是 Ian Goodfellow 等人在2014年Neural Information Processing Systems (NIPS) 研讨会上发表的里程碑式论文“生成对抗网络”(Generative Adversarial Nets，GANs)中提出的。主要思想是，我们定义一个简单、常用的分布，用pz表示。在下文中，我们使用pz来表示在-1到1闭区间上的均匀分布。我们将从分布中的一个采样记作 z∼pz 。若 pz 是五维的，我们可以通过一行Python的 numpy 代码来进行采样：

z = np.random.uniform(-1, 1, 5)

array([ 0.77356483, 0.95258473, -0.18345086, 0.69224724, -0.34718733])

现在有了一个用于采样的简单分布，我们定义一个函数 G(z) 来从我们的原始概率分布中采样。

def G(z):

...

return imageSample

z = np.random.uniform(-1, 1, 5)

imageSample = G(z)

那么我们怎样定义G(z)，可以使它输入一个向量，输出一张图像？我们将使用深度神经网络。神经网络基础有很多教程，所以我不会在此介绍。推荐一些不错的参考，斯坦福CS231n课程，Ian Goodfellow 等人的 deep learning book 、Image Kernels Explained Visually，以及 convolution arithmetic guide。

Deep Learning Book

http://www.deeplearningbook.org/

Image Kernels Explained Visually

http://setosa.io/ev/image-kernels/

convolution arithmetic guide

https://arxiv.org/abs/1603.07285

构造一个基于深度学习的 G(z)有很多种方式。原始的 GAN 论文提出了一个想法，一个训练过程，以及一个初步的实验结果。这个想法已经被极大地发扬了，其中一个想法在论文“基于深度卷积生成对抗网络的无监督表征学习（Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks）”中提出，作者是 Alec Radford, Luke Metz, 和 Soumith Chintala，发表在 2016 International Conference on Learning Representations (ICLR, 读作 “eye-clear”)上。这篇论文提出了深度卷积GANS（叫做DCGANs），使用微步长卷积来对图像进行上采样。

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

https://arxiv.org/abs/1511.06434

International Conference on Learning Representations

http://www.iclr.cc/

那么什么是微步长卷积，以及它是怎样对图像进行上采样的呢？ Vincent Dumoulin 和 Francesco Visin 的论文“深度学习卷积运算指南（A guide to convolution arithmetic for deep learning）”和卷积运算项目是对深度学习中的卷积运算的一个非常好的介绍。图例非常棒，可以让我们对微步长卷积的工作方式有一个直观的理解。首先，确保你搞懂了一般卷积如何将内核滑过输入空间（蓝色），得到输出空间（绿色）。此处，输出比输入要小。（如果不理解，参阅 CS231n CNN section 或 the convolution arithmetic guide）

CS231n CNN section

http://cs231n.github.io/convolutional-networks/

卷积运算图示，蓝色是输入，绿色是输出。

接下来，假设你有一个3X3的输入。我们的目标是进行上采样（upsample），这样，得到一个更大的输出。你可以将微步长卷积理解为将输入图像放大，然后在像素间插入0。然后在这个放大后的图像上进行卷积操作，得到一个较大的输出。此处，输出为5X5。

微步长卷积运算图示，蓝色是输入，绿色是输出。

插一段边注：进行上采样的卷积层有很多名字：全卷积( full convolution), 网内上采样（in-network upsampling）, 微步长卷积（fractionally-strided convolution），反向卷积（backwards convolution），反卷积（deconvolution）,上卷积（upconvolution），或者转置卷积（transposed convolution）。非常不推荐使用术语“反卷积”，因为这个术语已经有其他含义了：在某种数学运算，以及计算机视觉的其它应用中，这个术语有完全不同的含义。

现在我们有了微步长卷积结构，可以得到G(z)的表达，以一个向量z∼pz 作为输入，输出一张 64x64x3 的RGB图像。

使用 DCGAN 构造生成器的一种方法。图像来自DCGAN论文。

DCGAN论文

https://arxiv.org/abs/1511.06434

DCGAN 论文也提出了其他的在训练 DCGANs 时的技巧和调整，比如批量正则化（batch normalization）以及 leaky RELUs。

使用G(z)生成伪图像

让我们先停下来欣赏一下 G(z) 多么强大吧！DCGAN 论文给出了DCGAN在卧室数据集训练出来的样子。然后 G(z) 可以给出下面的伪图像，生成器认为的卧室是什么样子的。下面的图片都不在原始数据集里哦！

另外，你也可以在输入空间z进行代数运算。下面是一个生成人脸的网络。

基于DCGAN的人脸代数运算 DCGAN论文。

[ML-Heavy] 训练DCGAN

现在我们已经定义了G(z)，并见识了它多么强大。那么我们怎么训练它呢？我们有很多未知的变量（参数），需要找到它们。此时，我们就要用到对抗网络了。

首先我们要定义一些符号。数据的概率分布（未知的）记作pdata。那么G(z)，（其中z∼pz ）可以理解为从一个概率分布中的采样。让我们把这个概率分布记作pg。

概率分布

符号pzpdatapg含义z的概率分布，简单、已知图像的概率分布(未知)，是图像数据样本的来源生成器G用来采样的概率分布，我们希望pg==pdata

判别器网络D(x)输入图像x，返回图像x是从pdata的分布中采样的概率。理论上，当输入图像是从pdata中采样得到时，判别器输出一个接近1的值，当输入图像是伪图像，比如pg采样得到的图像时，判别器输出一个接近0的值。在DCGANs中，D(x)是一个传统的卷积神经网络。

判别器卷积神经网络，图片来自图像恢复论文

图像恢复论文

https://arxiv.org/abs/1607.07539

训练判别器的目标是：

1、对于真实数据分布x∼pdata的每一张图片，最大化D(x)。
2、对于不是真实数据分布x≁pdata的每一张图片，最小化D(x)。

生成器G(z)的训练目标是生成可以迷惑D的样本。输出是一张图像，可以作为判别器的输入。因此，生成器希望最大化D(G(z)),也就是最小化(1-D(G(z)))，因为D是一个概率，取值在0和1之间。

论文中提出，对抗网络是通过下面的最小最大策略实现的。第一项中的数学期望遍历了真实数据分布，第二项的数学期望遍历了pz中的样本，也就是遍历了G(z)∼pg。

通过这个表达式关于D和G的参数的梯度，可以训练它们。我们知道如何快速计算这个表达式的每一个部分。数学期望可以通过大小为m的小批数据来估计，内侧的最大化可以通过k步梯度来估计。已经证明，k=1是比较适合训练的值。

我们用θd来表示判别器的参数，用θg来表示生成器的参数。关于用θd和θg的损失的梯度可以通过反向传播来计算，因为D和G都是由成熟的神经网络模块组成的。下面是GAN论文中的训练策略。理论上，训练结束后，pg==pdata。所以G(z)可以生成服从pdata分布的样本。

GAN 论文中的训练算法

现有的GAN和DCGAN实现

在 Github 上，你可以看到很多极棒的 GAN 和 DCGAN 实现。

goodfeli/adversarial: GAN论文作者写的 Theano GAN 实现。

https://github.com/goodfeli/adversarial

tqchen/mxnet-gan: 非官方 MXNet GAN 实现。

https://github.com/tqchen/mxnet-gan

Newmu/dcgan_code: DCGAN论文作者写的 Theano GAN 实现。

https://github.com/Newmu/dcgan_code

soumith/dcgan.torch: DCGAN论文作者之一 (Soumith Chintala) 的 Torch DCGAN 实现。

https://github.com/soumith/dcgan.torch

carpedm20/DCGAN-tensorflow: 非官方 TensorFlow DCGAN 实现。

https://github.com/carpedm20/DCGAN-tensorflow

openai/improved-gan: OpenAI 第一篇论文背后的代码。在 carpedm20/DCGAN-tensorflow 基础上进行了大量的修改。

https://arxiv.org/abs/1606.03498

mattya/chainer-DCGAN: 非官方 Chainer DCGAN 实现。

https://github.com/mattya/chainer-DCGAN

jacobgil/keras-dcgan:非官方 (未完成) Keras DCGAN 实现。

https://github.com/jacobgil/keras-dcgan

我们会在 carpedm20/DCGAN-tensorflow 的基础上构造模型。

[ML-Heavy] 在Tensorflow上构建DCGANs

这部分的实现在我的 bamos/dcgan-completion.tensorflow Github库中。我需要强调的是，这部分的代码来自Taehoon Kim 的 carpedm20/DCGAN-tensorflow 。在我自己的库中使用它，方便我们在下一部分图像补全中使用。

bamos/dcgan-completion.tensorflow Github库

https://github.com/bamos/dcgan-completion.tensorflow

Taehoon Kim 的 carpedm20/DCGAN-tensorflow

https://github.com/carpedm20/DCGAN-tensorflow

大部分实现代码在model.py中的一个python类，DCGAN中。把所有东西放进一个类中是有很多好处的，这样我们可以在训练结束后保留住中间过程，并在之后的使用中加载。

首先我们定义生成器和判别器结构。linear, conv2d_transpose, conv2d, 和 lrelu 函数在 ops.py 中定义。

def generator(self, z):

self.z_, self.h0_w, self.h0_b = linear(z, self.gf_dim*8*4*4,

'g_h0_lin', with_w=True)

self.h0 = tf.reshape(self.z_, [-1, 4, 4, self.gf_dim * 8])

h0 = tf.nn.relu(self.g_bn0(self.h0))

self.h1, self.h1_w, self.h1_b = conv2d_transpose(h0,

[self.batch_size, 8, 8, self.gf_dim*4], name='g_h1', with_w=True)

h1 = tf.nn.relu(self.g_bn1(self.h1))

h2, self.h2_w, self.h2_b = conv2d_transpose(h1,

[self.batch_size, 16, 16, self.gf_dim*2], name='g_h2', with_w=True)

h2 = tf.nn.relu(self.g_bn2(h2))

h3, self.h3_w, self.h3_b = conv2d_transpose(h2,

[self.batch_size, 32, 32, self.gf_dim*1], name='g_h3', with_w=True)

h3 = tf.nn.relu(self.g_bn3(h3))

h4, self.h4_w, self.h4_b = conv2d_transpose(h3,

[self.batch_size, 64, 64, 3], name='g_h4', with_w=True)

return tf.nn.tanh(h4)

def discriminator(self, image, reuse=False):

if reuse:

tf.get_variable_scope().reuse_variables()

h0 = lrelu(conv2d(image, self.df_dim, name='d_h0_conv'))

h1 = lrelu(self.d_bn1(conv2d(h0, self.df_dim*2, name='d_h1_conv')))

h2 = lrelu(self.d_bn2(conv2d(h1, self.df_dim*4, name='d_h2_conv')))

h3 = lrelu(self.d_bn3(conv2d(h2, self.df_dim*8, name='d_h3_conv')))

h4 = linear(tf.reshape(h3, [-1, 8192]), 1, 'd_h3_lin')

return tf.nn.sigmoid(h4), h4

当我们初始化这个类的时候，将要用到这两个函数来构建模型。我们需要两个判别器，它们共享（复用）参数。一个用于来自数据分布的小批图像，另一个用于生成器生成的小批图像。

self.G = self.generator(self.z)

self.D, self.D_logits = self.discriminator(self.images)

self.D_, self.D_logits_ = self.discriminator(self.G, reuse=True)

接下来，我们定义损失函数。这里我们不用求和，而是用D的预测值和真实值之间的交叉熵（cross entropy），因为它更好用。判别器希望对所有“真”数据的预测都是1，对所有生成器生成的“伪”数据的预测都是0。生成器希望判别器对两者的预测都是1 。

self.d_loss_real = tf.reduce_mean(

tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits,

tf.ones_like(self.D)))

self.d_loss_fake = tf.reduce_mean(

tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits_,

tf.zeros_like(self.D_)))

self.d_loss = self.d_loss_real + self.d_loss_fake

self.g_loss = tf.reduce_mean(

tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits_,

tf.ones_like(self.D_)))

将每个模型的变量汇总到一起，这样，它们可以分别训练。

t_vars = tf.trainable_variables()

self.d_vars = [var for var in t_vars if 'd_' in var.name]

self.g_vars = [var for var in t_vars if 'g_' in var.name]

现在我们开始优化参数，使用 ADAM 优化。它是一种自适应非凸优化方法，在SGD面前很有竞争力，一般不需要手动调整学习率 (learning rate), 动量(momentum)，以及其他超参数。

d_optim = tf.train.AdamOptimizer(config.learning_rate, beta1=config.beta1)

.minimize(self.d_loss, var_list=self.d_vars)

g_optim = tf.train.AdamOptimizer(config.learning_rate, beta1=config.beta1)

.minimize(self.g_loss, var_list=self.g_vars)

下面我们遍历数据。每一次迭代，我们采样一个小批数据，然后使用优化器来更新网络。有趣的是，如果G只更新一次，鉴别器的损失不会变成0。另外，我认为最后调用 d_loss_fake 和 d_loss_real 进行了一些不必要的计算，因为这些值在 d_optim 和 g_optim 中已经计算过了。作为Tensorflow 的一个联系，你可以试着优化这一部分，并发送PR到原始的repo。

for epoch in xrange(config.epoch):

...

for idx in xrange(0, batch_idxs):

batch_images = ...

batch_z = np.random.uniform(-1, 1, [config.batch_size, self.z_dim])

.astype(np.float32)

# Update D network

_, summary_str = self.sess.run([d_optim, self.d_sum],

feed_dict={ self.images: batch_images, self.z: batch_z })

# Update G network

_, summary_str = self.sess.run([g_optim, self.g_sum],

feed_dict={ self.z: batch_z })

# Run g_optim twice to make sure that d_loss does not go to zero

# (different from paper)

_, summary_str = self.sess.run([g_optim, self.g_sum],

feed_dict={ self.z: batch_z })

errD_fake = self.d_loss_fake.eval({self.z: batch_z})

errD_real = self.d_loss_real.eval({self.images: batch_images})

errG = self.g_loss.eval({self.z: batch_z})

搞定！当然，完整的代码会有更多的注释，可以在 model.py 中查看。

在图片集上跑DCGAN

如果你跳过了上一节，但是想跑跑代码，这部分代码在 bamos/dcgan-completion.tensorflow Github 库中。我要再次强调这个代码来自 Taehoon Kim 的 carpedm20/DCGAN-tensorflow 。在这里我们用我的库，是因为进行下一步比较方便。警告，如果你没有支持CUDA的GPU，这部分网络的训练会非常慢。

下面部分如果执行失败，请通知我.

首先，clone 我的 bamos/dcgan-completion.tensorflow Github库和 OpenFace 到本地。我们要用到 OpenFace 的 Python-Only 部分来进行图像预处理。别担心，你不需要安装OpenFace 的 Torch 依赖。创建新目录， clone 下面的资源库。

git clone https://github.com/cmusatyalab/openface.git

git clone https://github.com/bamos/dcgan-completion.tensorflow.git

接下来，安装 OpenCV 和支持python2 的 dlib。如果你感兴趣，可以尝试实现 dlib 对 python3 的支持。安装时候有一些小技巧，我写了一些笔记，在 OpenFace setup guide ，包括我安装的是那个版本、如何安装。接下来，安装 OpenFace 的python 库，这样我们可以对图像进行预处理。如果你不是用虚拟环境，在运行 setup.py 时你需要用 sudo 来进行全局安装。（如果对你来说这部分比较困难，也可以使用 OpenFace 的 Docker 安装。）

cd openface

pip2 install -r requirements.txt

python2 setup.py install

models/get-models.sh

cd ..

下面下载一个人脸图像数据集。数据集中有没有标注不重要，我们会删掉它。不完全列表如下：MS-Celeb-1M, CelebA, CASIA-WebFace, FaceScrub, LFW, 和 MegaFace。将图片放在目录 dcgan-completion.tensorflow/data/your-dataset/raw 下，表明它是数据集的原始数据。

现在我们用 OpenFace 的 alignment 工具将图像预处理为 64X64 的数据。

./openface/util/align-dlib.py data/dcgan-completion.tensorflow/data/your-dataset/raw align innerEyesAndBottomLip data/dcgan-completion.tensorflow/data/your-dataset/aligned --size 64

最后我们将处理好图像的目录展平，这样目录下只有图像，没有子文件夹。

cd dcgan-completion.tensorflow/data/your-dataset/aligned

find . -name '*.png' -exec mv {} . ;

find . -type d -empty -delete

cd ../../..

现在我们可以训练 DCGAN 了。安装 Tensorflow ，开始训练。

./train-dcgan.py --dataset ./data/your-dataset/aligned --epoch 20

你可以在 sample 文件夹中查看从生成器中随机抽样出来的样本发图像是什么样子。我在 CASIA-WebFace 数据集和 FaceScrub 数据集上训练，因为我手头就有这两个数据集。 14轮训练之后，我的样本是这样的。

在 CASIA-WebFace 和 FaceScrub 上训练14轮后的 DCGAN 的样本

你也可以在 TensorBoard 上查看 Tensorflow 图像，以及损失函数。

tensorboard --logdir ./logs

TensorBoard 损失可视化图像。在训练过程中实时更新。

DCGAN 网络的TensorBoard可视化

该图为动图，图片地址：

第三步：找到用于图像补全最好的伪图像

使用 DCGAN 进行图像补全

既然我们已经有了鉴别器 D(x) 和生成器 G(z)，我们怎么把它用在图像补全上呢？在这章我要介绍的是 Raymond Yeh 和 Chen Chen 等人的一篇论文，“基于感知和语境损失的图像语义修补（Semantic Image Inpainting with Perceptual and Contextual Losses）”。论文在2016年7月26号发布于 arXiv 上。

Semantic Image Inpainting with Perceptual and Contextual Losses

https://arxiv.org/abs/1607.07539

对于某个图片y进行图像补全，一个有道理但是不可行的方案是，对于缺失的像素，最大化D(y)。结果既不是数据分布（pdata），也不是生成分布(pg)。我们期望的是，将y投影到生成分布上。

(a): 生成分布的 y 的理想重建（蓝色曲面）。（b）:尝试通过对 D(y) 最大化来重建 y 的一个失败的例子。图像来自图像修复论文。

[ML-Heavy] 到 pg的投影的损失函数

为了给投影一个合理的定义，我们先为图像补全定义一些符号。我们使用一个二值掩码 M(mask), 也就是只有0、1两个值。值为1表示图像这部分我们想要保留，值为0表示这部分我们需要补全。现在我们可以定义，在给定了二值掩码M之后如何对y进行补全。将y中的元素和M中的元素相乘。两个矩阵对应位置元素相乘也叫做 Hadamard 积，用 M⊙y 表示。M⊙y 表示图像的原始部分。

二值掩码图例

接下来，假设我们已经找到了一个 z^, 可以生成一个对缺失值进行重构的合理的G(z^)。补全的像素 (1−M)⊙G(z^) 可以加到原始像素上，得到重构的图像：

现在我们要做的事情，就是找到一个适于补全图像的 G(z^)。为了找到 z^ ，我们回顾一下文章开头提到的语境和感知，将它们作为DCGANs的上下文。为此，我们定义了对于任意z∼pz的损失函数。损失函数越小，说明 z^ 越合适。

语境损失：为了得到和输入图像相同的上下文，需要确保y已知像素对应位置的G(z)尽可能相似。所以，当 G(z) 的输出和 y 已知位置图像不相似的时候，需要对 G(z) 进行惩罚。为此，我们用 G(z) 减去 y 中对应位置的像素，然后得到它们不相似的程度:

其中||x||1=∑i|xi|是某个向量x的l1 范数。l2 范数也是可取的，但是论文指出，实践表明l1 范数效果更好。

理想情况下，已知部分的 y 和 G(z) 的像素是相等的。也就是对于已知位置的像素i,

感知损失：为了重建一个看起来真实的图像，需要确保判别器判定图像看起来是真实的。为此，我们进行和训练 DCGAN 中相同的步骤。

最后，将语境损失和感知损失组合起来，就可以找到 z^ 了;

其中 λ 是超参数，用来控制相比于感知损失，语境损失重要的程度。（我用的是默认的λ=0.1，并没有对这个值进行深入研究。）然后如前所述，使用 G(z) 来重建y中缺失的部分。

图像也使用了 poisson blending 来使图像变得平滑。

[ML-Heavy] 使用tensorflow来进行DCGAN图像补全

这一章给出了我对于 Taehoon Kim 的 carpedm20/DCGAN-tensorflow 代码的修改，用于图像补全。

self.mask = tf.placeholder(tf.float32, [None] + self.image_shape, name='mask')

我们通过对梯度∇zL(z)进行梯度下降，可以迭代地求出 argminzL(z) 。我们定义了损失函数之后，Tensorflow 的 automatic differentiation 可以自动地为我们计算出这个值！所以，完整的基于DCGANs的实现可以通过在现有的DCGAN实现上添加4行Tensorflow代码来完成。（当然，实现它还需要一些非 Tensorflow 代码。）

self.contextual_loss = tf.reduce_sum(

tf.contrib.layers.flatten(

tf.abs(tf.mul(self.mask, self.G) - tf.mul(self.mask, self.images))), 1)

self.perceptual_loss = self.g_loss

self.complete_loss = self.contextual_loss + self.lam*self.perceptual_loss

self.grad_complete_loss = tf.gradients(self.complete_loss, self.z)

接下来，我们定义掩码。我只是在图像的中央区域加了一个，你可以加一些别的，比如随机掩码，然后发一个pull请求。

if config.maskType == 'center':

scale = 0.25

assert(scale <= 0.5)

mask = np.ones(self.image_shape)

l = int(self.image_size*scale)

u = int(self.image_size*(1.0-scale))

mask[l:u, l:u, :] = 0.0

梯度下降方面，我们对于z在[-1, 1]上的投影，使用小批量、含动量的投影梯度下降。

for idx in xrange(0, batch_idxs):

batch_images = ...

batch_mask = np.resize(mask, [self.batch_size] + self.image_shape)

zhats = np.random.uniform(-1, 1, size=(self.batch_size, self.z_dim))

v = 0

for i in xrange(config.nIter):

fd = {

self.z: zhats,

self.mask: batch_mask,

self.images: batch_images,

}

run = [self.complete_loss, self.grad_complete_loss, self.G]

loss, g, G_imgs = self.sess.run(run, feed_dict=fd)

v_prev = np.copy(v)

v = config.momentum*v - config.lr*g[0]

zhats += -config.momentum * v_prev + (1+config.momentum)*v

zhats = np.clip(zhats, -1, 1）

补全图像

选择一些用于图像补全的图片，将它们放到 dcgan-completion.tensorflow/your-test-data/raw 。然后像之前 dcgan-completion.tensorflow/your-test-data/aligned 那样排列整齐。这里我从LFW中随机抽出一些图像。我的DCGAN没有使用LFW的图像来训练。

你可以这样补全图像：

./complete.py ./data/your-test-data/aligned/* --outDir outputImages

这段代码会生成图像，并周期性地将图像输出在 —outDir 文件夹中。你可以使用ImageMagick来生成一个gif：

cd outputImages

convert -delay 10 -loop 0 completed/*.png completion.gif

最后的图像补全。图像的中心是自动生成的。源代码从此处下载。这是我随机从 LFW 中挑出的样本。

结论

感谢阅读，现在我们成功了！在文章中，我们涉及了图像补全的一种方法：

将图像理解为概率的分布。
生成伪图像。
找到用于补全最好的伪图像。

我的例子是人脸，但是DCGANs也可以在其他类型的图像上使用。总体而言，GANs 训练比较困难，我们尚不清楚如何在一个特定种类的物体上进行训练，也不清楚如何在大图像上训练。然而，这是一个很有潜力的模型，我很期待GAN将为我们创造什么样的未来！

你可能感兴趣的:(gans)

SPGAN: Siamese projection Generative Adversarial Networks 这张生成的图像能检测吗优质GAN模型训练自己的数据集人工智能生成对抗网络计算机视觉深度学习神经网络算法
简介简介：该论文针对传统GANs中鉴别器采用硬边际分类导致的误分类问题，提出了基于Siameseprojection网络的SPGAN方法。主要创新点包括：（1）设计Siameseprojection网络来测量特征相似性；（2）提出相似特征对抗学习框架，将相似性测量融入生成器和鉴别器的损失函数；（3）通过相似特征对抗学习，鉴别器能最大化真实图像和生成图像特征的差异性，生成器能合成包含更多真实图像特征
《扩散模型：AI图像生成革命背后的魔法》 Liudef06小白人工智能人工智能
文章目录摘要引言一、扩散模型的基本概念与发展历程二、扩散模型的数学原理与工作机制三、扩散模型在图像生成中的革命性突破四、扩散模型面临的挑战与未来发展方向五、结论摘要本文系统阐述了扩散模型在AI图像生成领域的革命性作用及其核心原理。首先，梳理了扩散模型的基本概念、发展脉络及其相较于GANs、VAEs等传统生成模型的优势。其次，深入解析了其基于马尔可夫链和变分推断的数学基础，以及前向扩散/反向生成的核
CHAIN（GAN的一种）训练自己的数据集这张生成的图像能检测吗优质GAN模型训练自己的数据集生成对抗网络人工智能神经网络深度学习 pytorch 算法
简介简介：作者针对数据有限场景下GANs训练中的判别器过拟合问题，提出了CHAIN（Lipschitz连续性约束归一化）方法。作者首先从理论角度分析了GAN泛化误差，发现减少判别器权重梯度范数对提升泛化能力至关重要。然后深入研究了批归一化（BN）在GAN判别器中应用困难的根本原因，通过理论分析证明BN的中心化和缩放步骤会导致梯度爆炸。基于这些发现，CHAIN设计了两个核心模块：用零均值正则化替代中
深度探索：机器学习中的条件生成对抗网络（Conditional GAN, CGAN）算法原理及其应用
目录1.引言与背景2.CGAN定理3.算法原理4.算法实现5.优缺点分析优点：缺点：6.案例应用7.对比与其他算法8.结论与展望1.引言与背景生成对抗网络（GenerativeAdversarialNetworks,GANs）作为一种深度学习框架，在无监督学习领域展现出强大的能力，特别在图像、音频、文本等复杂数据的生成任务中取得了显著成果。然而，原始GAN模型在生成过程中缺乏对生成样本特定属性的直
Python Day53 别勉. python机器学习 python 开发语言
Task：1.对抗生成网络的思想：关注损失从何而来2.生成器、判别器3.nn.sequential容器：适合于按顺序运算的情况，简化前向传播写法4.leakyReLU介绍：避免relu的神经元失活现象1.对抗生成网络的思想：关注损失从何而来这是理解GANs的关键！传统的神经网络训练中，我们通常会直接定义一个损失函数（如均方误差MSE、交叉熵CE），然后通过反向传播来优化这个损失。这个损失的“来源”
双指针算法-day12（判断子序列）拾零吖力扣算法 leetcode 数据结构
1.判断子序列题目解析字符相等：双指针一起动，不相等：长字符串指针动；代码classSolution{public:boolisSubsequence(strings,stringt){//时间复杂度：O(m)//空间复杂度：O(1)intn=s.size(),m=t.size();inti=0,j=0;while(i&dictionary){stringans="";intn=ans.size(
[2025CVPR]DE-GANs:一种高效的生成对抗网络清风AI 深度学习算法详解及代码复现生成对抗网络人工智能神经网络
目录引言：数据高效GAN的困境核心原理：动态质量筛选机制1.判别器拒绝采样（DRS）的再思考2.质量感知动态拒绝公式（1）质量感知阶段（2）动态拒绝阶段模型架构：轻量化设计技术突破：三大创新点1.首创训练阶段DRS2.动态拒绝机制3.质量重加权策略实验验证：全面性能提升1.数据集与指标2.对比实验结果（1）低样本数据集（2）FFHQ数据集代码解析：关键实现细节对比结果：全面超越现有方法1.低样本数
LeetCode 2762.不间断子数组吃着火锅x唱着歌 LeetCode leetcode 算法数据结构
给你一个下标从0开始的整数数组nums。nums的一个子数组如果满足以下条件，那么它是不间断的：i，i+1，…，j表示子数组中的下标。对于所有满足i&nums){longlongans=0;intleft=0;mapcnt;for(inti=0;ifirst-cnt.begin()->first>2){if(--cnt[nums[left]]==0){cnt.erase(nums[left]);}
中国各省英文缩写后会无期77 通用资源配置
数据对照来源：中国各省的英文及简写-豆丁网安徽，皖：Anhui，简称AH北京，京：Beijing，简称BJ福建，闽：Fujian，简称FJ甘肃，甘：Gansu，简称GS广东，粤：Guangdong，简称GD广西，桂：Guangxi，简称GX贵州，黔：Guizhou，简称GZ海南，琼：Hainan，简称HI河北，冀：Hebei，简称HE河南，豫：Henan，简称HA黑龙江，黑：Heilongjian
**深度学习框架与生成对抗网络：探索前沿技术的融合之美**摘要：本文将深入探讨深度学习框架在生成对抗网络（GANs）中的应用，分析大模型训练的实践，并展望联邦学习在未来技术趋势中的位置。我们将通过实例 2401_89451588 深度学习生成对抗网络人工智能 python
深度学习框架与生成对抗网络：探索前沿技术的融合之美摘要：本文将深入探讨深度学习框架在生成对抗网络（GANs）中的应用，分析大模型训练的实践，并展望联邦学习在未来技术趋势中的位置。我们将通过实例和代码片段展示相关技术细节，帮助读者更好地理解这些前沿技术。一、引言随着人工智能（AI）技术的飞速发展，深度学习框架作为实现AI的重要工具，已经成为研究的热点。生成对抗网络（GANs）作为深度学习领域的一个重
P10423题解 _皓月星辉_ 题解蓝桥杯算法 c++
P10423[蓝桥杯2024省B]填空问题先贴上答案#includeusingnamespacestd;intmain(){stringans[]={"1204","1100325199.77",};charT;cin>>T;cout<
R3GAN利用配置好的Pytorch训练自己的数据集这张生成的图像能检测吗优质GAN模型训练自己的数据集 pytorch 人工智能 python 生成对抗网络计算机视觉深度学习机器学习
简介简介：这篇论文挑战了"GANs难以训练"的广泛观点，通过提出一个更稳定的损失函数和现代化的网络架构，构建了一个简洁而高效的GAN基线模型R3GAN。作者证明了通过合适的理论基础和架构设计，GANs可以稳定训练并达到优异性能。论文题目：TheGANisdead;longlivetheGAN!AModernBaselineGAN会议：NeurIPS2024源码地址：https://www.gith
力扣题型总汇——字符串相合_vinegar 力扣专题总汇 leetcode 算法职场和发展
字符串总结：1.熟练Sring常用API：①split（如果两个单词之间有x>1个空格，那么有x-1个空格会变成空字符串传入数组里面）Stringans[]=s.split("");//如果两个单词之间有x>1个空格，那么有x-1个空格会变成空字符串传入数组里面，因为是空字符串传入数组，所以该空字符串长度是0if(ans[i].length()>0){进行操作}②trim()③substring(
梦熊联盟：202505基础语法-题解 C-DHEnry 算法 c++开发语言
202505基础语法-题解T1-九的倍数解法：对于9的倍数，只需要判定其各位的数码和是否为9的倍数即可。例如判断一个数是不是9的倍数，只要判断其各位数字之和是不是9的倍数，因为一个数能被9整除当且仅当它的各位数字之和能被9整除。因此将输入的数当作字符串读入，把每一位的数码和相加，判断是否为9的倍数即可。Code：#includeusingnamespacestd;longlongans;intma
生成式AI与多模态技术深度解析小赖同学啊人工智能人工智能
生成式AI与多模态技术深度解析一、核心概念与技术框架生成式AI（GenerativeAI）定义：通过模型学习数据分布，生成与训练数据相似的新内容（文本、图像、音频、视频等）。关键技术：生成对抗网络（GANs）：生成器与判别器对抗优化，用于图像生成（如StyleGAN生成人脸）。Transformer架构：基于自注意力机制，支持长序列生成（如GPT-4生成文本、Sora生成视频）。扩散模型（Diff
生成对抗网络（Generative Adversarial Networks GANs）嘿丨嘿生成对抗网络人工智能神经网络深度学习机器学习大数据
生成对抗网络（GenerativeAdversarialNetworks，GANs）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN由两个神经网络组成：生成器（Generator）和判别器（Discriminator），它们通过对抗训练的方式进行优化。以下是详细介绍：1.基本概念生成器（G）：生成器试图生成逼真的假样本（如图像），其输入通常是随机噪声（如高斯噪声或均匀噪
Ansible for Windows hosts(ansible.windows 模块介绍) peanutfish Linux ansible windows
Ansible具有许多专为Windows操作系统设计的模块，它使得自动化Windows任务变得简单。下面我将介绍一些常用的AnsibleWindows模块，以及如何配置Ansible以管理Windows主机。更详细的用法请参考：UsingAnsibleandWindows—AnsibleCommunityDocumentation配置Ansible以管理Windows在开始使用Ansible管理W
Education Codeforces Round 178 (Rated for Div2) A-E题解 W_Sherlock_Henry Codeforces 做题总结算法 c++
前言这次Education相较之前反倒是比较简单的一场，以前看到Education都只能做两题，顶多三题，没想到这次能够把前五题都做出来了（后悔没上大号打了）。这场的E是一个挺有意思的DP，用我的话来讲的话就是链式前向星优化DP（之前想用这样的思路做结果wronganswer过，这次这个思路总算能过了）题解部分A.ThreeDecks给定三个数字a,b,c,保证ausingnamespacestd
视频生成对抗网络（Video GAN） deepdata_cn 视频生成人工智能生成对抗网络人工智能
生成对抗网络（GANs,GenerativeAdversarialNetworks）是图像生成领域中极为重要的工具。近年来，科研工作者们的探索目光并未仅仅停留在静态图像范畴，而是开始向更具动态性和复杂性的视频生成领域拓展。经过不懈努力，视频生成对抗网络（VideoGAN）应运而生。相较于传统的静态图像生成，视频生成所面临的技术挑战截然不同。由于视频本身具备时间维度，这就要求生成的内容不仅要在每一帧
Python与图像处理：从基础操作到智能应用的全面解析傻啦嘿哟 python 图像处理开发语言
目录一、Python图像处理的三大核心优势1.1生态库矩阵支撑1.2开发效率革命1.3跨领域协同能力二、六大核心处理技术详解2.1图像基础操作2.2图像增强技术2.3特征提取算法2.4目标检测技术2.5图像分割技术2.6图像生成技术三、实战案例：智能相册管理系统3.1系统架构3.2关键代码实现3.3性能优化策略四、前沿技术展望4.1生成对抗网络（GANs）4.2神经架构搜索（NAS）4.3边缘计算
探秘AIGC生成艺术的独特魅力 master_chenchengg AI技术探讨 AI 人工智能 AIGC 行业分析
探秘AIGC生成艺术的独特魅力引言-掀开AIGC神秘面纱从零到一：AIGC概念起源与演变当艺术遇上科技：AIGC如何重塑创作边界艺术家的新伙伴：AIGC在创意产业中的角色AIGC的魔法笔触-创意与技术的融合代码画布：算法如何理解并创造艺术数据驱动的艺术：大数据在AIGC中的应用模型与灵感：机器学习如何激发创意火花超越人类想象的边界-AIGC的创新实例数字梦境：生成式对抗网络(GANs)构建的虚拟现
思维与算法共舞：AIGC语言模型的艺术与科学云边有个稻草人热门文章算法开发语言什么是语言模型？多任务学习与多模态生成客户服务与聊天机器人自适应生成与定制化文本预训练与微调
云边有个稻草人-个人主页热门文章_云边有个稻草人的博客-本篇文章所属专栏~目录引言：AIGC与文本生成概述一、AIGC基础：语言模型的基本原理1.什么是语言模型？2.预训练与微调二、AIGC的应用领域：文本生成的具体应用1.内容创作2.客户服务与聊天机器人3.自动摘要4.翻译与语言转换三、前沿突破：AIGC文本生成技术的最新进展与未来方向1.多任务学习与多模态生成2.生成对抗网络（GANs）与文本
AI图像生成 born-stubborn 人工智能
要通过代码实现AI图像生成，可以使用深度学习框架如TensorFlow、PyTorch或GANs等技术。下面是一个简单的示例代码，演示如何使用GANs生成手写数字图像：importtorchimporttorchvisionimporttorchvision.transformsastransformsimporttorch.nnasnnimporttorch.optimasoptimfromto
第十届蓝桥杯补题 smile_keep looking 算法
第十届蓝桥杯C/C++容易看出来，这个是进制转换的思路把十进制转换成26进制。满26进一个‘A’可以把’A’当作0，‘Z’当作25代码是越简单越好。#includeusingnamespacestd;intmain(){stringans="";intn=0;cin>>n;while(n){if(n%26==0)ans+='Z';else{ans+='A'+n%26-1;}n--;n=n/26;}
虚拟世界的AI魔法：AIGC引领元宇宙创作革命云边有个稻草人热门文章 AIGC 元宇宙与虚拟世界概述 AIGC生成虚拟世界环境 AIGC在虚拟世界的技术 AI驱动的动态世界计算机视觉与物理引擎 AIGC创造虚拟物品与资产
云边有个稻草人-CSDN博客——个人主页热门文章_云边有个稻草人的博客-CSDN博客——本篇文章所属专栏~欢迎订阅~目录1.引言2.元宇宙与虚拟世界概述2.1什么是元宇宙？2.2虚拟世界的构建3.AIGC在元宇宙中的应用3.1AIGC生成虚拟世界环境3.2AIGC生成虚拟角色与NPC3.3AIGC创造虚拟物品与资产4.AIGC在虚拟世界与元宇宙的技术实现4.1生成式对抗网络（GANs）在元宇宙中的
深度探索：机器学习中的WGAN-GP算法原理及其应用生瓜蛋子机器学习机器学习算法人工智能
目录1.引言与背景2.Wasserstein距离与WGAN定理3.WGAN-GP算法原理4.WGAN-GP算法实现5.WGAN-GP优缺点分析优点：缺点：6.案例应用7.对比与其他算法8.结论与展望1.引言与背景在机器学习领域，生成对抗网络（GenerativeAdversarialNetworks,GANs）作为一种强大的无监督学习模型，已广泛应用于图像生成、视频合成、语音转换、数据增强等众多领
生成对抗网络（GAN）详解 frostmelody 深度学习小知识点 PyTorch小知识点机器学习小知识点生成对抗网络人工智能神经网络
GANs的基本概念Thisframeworkcanyieldspecifictrainingalgorithmsformanykindsofmodelandoptimizationalgorithm.Inthisarticle,weexplorethespecialcasewhenthegenerativemodelgeneratessamplesbypassingrandomnoisethrou
关于反卷积（转置卷积）小记文弱_书生乱七八糟人工智能深度学习反卷积
反卷积（TransposedConvolution）详解1.反卷积概述反卷积（TransposedConvolution），又称转置卷积、反向卷积，在深度学习中主要用于上采样（upsampling），常见于**生成对抗网络（GANs）、语义分割（SemanticSegmentation）、超分辨率重建（Super-Resolution）**等任务。误解：反卷积不是普通卷积的数学逆操作，而是一种特定
P3406 海底高铁（差分） _qz c++算法
题目描述分析差分求出每段路程的经过次数，在根据a,b,c求出哪种方案便宜for(inti=1;i#include#include#include#include#includeusingnamespacestd;constintmaxn=1e5+50;longlongn,m,a[maxn],b[maxn],t1,t2,t3;longlongans;intmain(){//freopen("a.tx
蓝桥大使【算法赛】----贪心算法 wyshh119 算法学习贪心算法
这里比较的难点在于sort排序的根据是什么，为什么是两人的报酬差，我的理解是当两人报酬差越大，那么总报酬的损失就越大，其实是缺少具体的证明的，但是通过就说明确实是这样。也就不深究证明了。#include#includeusingnamespacestd;longlongans=0;constintN=100005;structnode{//结构体inta;intb;};nodea[N];intma
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s