寒小阳

深度学习与计算机视觉(12)_tensorflow实现基于深度学习的图像补全

原文地址：Image Completion with Deep Learning in TensorFlow by Brandon Amos
原文翻译与校对：@MOLLY && 寒小阳 ([email protected])
时间：2017年4月。
出处：http://blog.csdn.net/han_xiaoyang/article/details/70214565
声明：版权所有，转载请联系作者并注明出

简介
第一步：将图像理解为一个概率分布的样本
- 你是怎样补全缺失信息的呢？
- 但是怎样着手统计呢？这些都是图像啊。
- 那么我们怎样补全图像？
第二步：快速生成假图像
- 在未知概率分布情况下，学习生成新样本
- [ML-Heavy] 生成对抗网络(Generative Adversarial Net, GAN) 的架构
- 使用G(z)生成伪图像
- [ML-Heavy] 训练DCGAN
- 现有的GAN和DCGAN实现
- [ML-Heavy] 在Tensorflow上构建DCGANs
- 在图片集上跑DCGAN
第三步：找到用于图像补全最好的伪图像
- 使用 DCGAN 进行图像补全
- [ML-Heavy] 到 pgpg 的投影的损失函数
- [ML-Heavy] 使用tensorflow来进行DCGAN图像补全
- 补全图像
结论

简介

内容识别填充(译注: Content-aware fill ,是 photoshop 的一个功能)是一个强大的工具，设计师和摄影师可以用它来填充图片中不想要的部分或者缺失的部分。在填充图片的缺失或损坏的部分时，图像补全和修复是两种密切相关的技术。有很多方法可以实现内容识别填充，图像补全和修复。在这篇博客中，我会介绍 Raymond Yeh 和 Chen Chen 等人的一篇论文，“基于感知和语境损失的图像语义修补（Semantic Image Inpainting with Perceptual and Contextual Losses）”。论文在2016年7月26号发布于 arXiv 上，介绍了如何使用 DCGAN 网络来进行图像补全。博文面向一般技术背景的读者，部分内容需要有机器学习的背景。我在相关章节标注了[ML-Heavy]标签，如果你不想了解太多细节，可以跳过这些章节。我们只会涉及到填充人脸图像缺失部分的情况。博文相关 Tensorflow 代码已经发布到 GitHub 上：bamos/dcgan-completion.tensorflow 。
图像补全分为三个步骤。

首先我们将图像理解为一个概率分布的样本。
基于这种理解，学习如何生成伪图片。
然后我们找到最适合填充回去的伪图片。

使用photoshop来对图像缺失部分补全

使用photoshop自动删除不要的部分

下文将要介绍到的图像补全。图像的中心是自动生成的。源码可以从此处下载。
这些图像是我从 LFW 数据集中取得的一个随机样本。

第一步：将图像理解为一个概率分布的样本

你是怎样补全缺失信息的呢？

在上面的例子中，想象你正在构造一个可以填充缺失部分的系统。你会怎么做呢？你觉得人类大脑是怎么做的呢？你使用了什么样的信息呢？
在博文中，我们会关注两种信息：
语境信息：你可以通过周围的像素来推测缺失像素的信息。
感知信息：你会用“正常”的部分来填充，比如你在现实生活中或其它图片上看到的样子。
两者都很重要。没有语境信息，你怎么知道填充哪一个进去？没有感知信息，通过同样的上下文可以生成无数种可能。有些机器学习系统看起来“正常”的图片，人类看起来可能不太正常。
如果有一种确切的、直观的算法，可以捕获前文图像补全步骤介绍中提到的两种属性，那就再好不过了。对于特定的情况，构造这样的算法是可行的。但是没有一般的方法。目前最好的解决方案是通过统计和机器学习来得到一个近似的技术。

但是怎样着手统计呢？这些都是图像啊。

为了激发大家的思考，我们从一个很好理解、可以写成简洁形式的概率分布开始：一个正态分布。这是正态分布的概率密度函数（PDF）。你可以将PDF理解成在输入空间横向移动，纵轴表示某个值出现的概率。（如果你感兴趣，绘制这幅图的代码可以从 bamos/dcgan-completion.tensorflow:simple-distributions.py 下载。）

从这个分布中采样，就可以得到一些数据。需要搞清楚的是PDF和样本之间的联系。

从正态分布中的采样

2维图像的PDF和采样。 PDF 用等高线图表示，样本点画在上面。

这是1维分布，因为输入只能沿着一个维度。在两个维度上也可以这么做。
在图像和统计学之间，最关键的联系就是，我们可以将图像看作是从一个高维概率分布中得到的采样。概率分布对应的是图像的像素。想象你在用相机拍照。得到的图像是由有限个数的像素组成。当你通过相机拍照的时候，你就在从这个复杂的概率分布中进行采样。这个概率分布就决定了我们判断一张图片是正常的，还是不正常的。对于图片而言，与正态分布不同的是，我们无法得知真实的概率分布，我们只能去收集样本。
在这篇文章中，我们会使用彩色图像，它用 RGB颜色表示。我们的图像宽64像素，高64像素，所以我们的概率分布是 64⋅64⋅3≈12k 维的。

那么我们怎样补全图像？

首先考虑多变量正态分布，以求得到一些启发。给定 x=1 , 那么 y 最可能的值是什么？我们可以固定x的值，然后找到使PDF最大的 y。

在多维正态分布中，给定x，得到最大可能的y

这个概念可以很自然地推广到图像概率分布。我们已知一些值，希望补全缺失值。这可以简单理解成一个最大化问题。我们搜索所有可能的缺失值，用于补全的图像就是可能性最大的值。
从正态分布的样本来看，只通过样本，我们就可以得出PDF。只需挑选你喜欢的统计模型，然后拟合数据即可。
然而，我们实际上并没有使用这种方法。对于简单分布来说，PDF很容易得出来。但是对于更复杂的图像分布来说，就十分困难，难以处理。之所以复杂，一部分原因是复杂的条件依赖：一个像素的值依赖于图像中其它像素的值。另外，最大化一个一般的PDF是一个非常困难和棘手的非凸优化问题。

第二步：快速生成假图像

在未知概率分布情况下，学习生成新样本

除了学习如何计算PDF之外，统计学中另一个成熟的想法是学习怎样用生成模型生成新的（随机）样本。生成模型一般很难训练和处理，但是后来深度学习社区在这个领域有了一个惊人的突破。Yann LeCun 在这篇 Quora 回答中对如何进行生成模型的训练进行了一番精彩的论述，并将它称为机器学习领域近10年来最有意思的想法。

Yann LeCun 对生成对抗网络的介绍

将生成对抗网络类比为街机游戏。两个网络相互对抗，共同进步。就像两个人类在游戏中对抗一样。

其它的深度学习方法，比如 Variational Autoencoders(VAEs)，也可以用来训练生成模型。在这篇博文中，我们用的是生成对抗网络(Generative Adversarial Nets，GANs)。

[ML-Heavy] 生成对抗网络(Generative Adversarial Net, GAN) 的架构

这个想法是 Ian Goodfellow 等人在2014年Neural Information Processing Systems (NIPS) 研讨会上发表的里程碑式论文“生成对抗网络”(Generative Adversarial Nets，GANs)中提出的。主要思想是，我们定义一个简单、常用的分布，用 pz 表示。在下文中，我们使用 pz 来表示在-1到1闭区间上的均匀分布。我们将从分布中的一个采样记作 z∼pz 。若 pz 是五维的，我们可以通过一行python的 numpy 代码来进行采样：

z = np.random.uniform(-1, 1, 5)
array([ 0.77356483,  0.95258473, -0.18345086,  0.69224724, -0.34718733])

现在有了一个用于采样的简单分布，我们定义一个函数 G(z) 来从我们的原始概率分布中采样。

def G(z):
   ...
   return imageSample
z = np.random.uniform(-1, 1, 5)
imageSample = G(z)

那么我们怎样定义G(z)，可以使它输入一个向量，输出一张图像？我们将使用深度神经网络。神经网络基础有很多教程，所以我不会在此介绍。推荐一些不错的参考，斯坦福CS231n课程，Ian Goodfellow 等人的 deep learning book 、Image Kernels Explained Visually，以及 convolution arithmetic guide。

构造一个基于深度学习的 G(z)有很多种方式。原始的 GAN 论文提出了一个想法，一个训练过程，以及一个初步的实验结果。这个想法已经被极大地发扬了，其中一个想法在论文“基于深度卷积生成对抗网络的无监督表征学习（Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks）”中提出，作者是 Alec Radford, Luke Metz, 和 Soumith Chintala，发表在 2016 International Conference on Learning Representations (ICLR, 读作 “eye-clear”)上。这篇论文提出了深度卷积GANS（叫做DCGANs），使用微步长卷积来对图像进行上采样。

那么什么是微步长卷积，以及它是怎样对图像进行上采样的呢？ Vincent Dumoulin 和 Francesco Visin 的论文“深度学习卷积运算指南（A guide to convolution arithmetic for deep learning）”和卷积运算项目是对深度学习中的卷积运算的一个非常好的介绍。图例非常棒，可以让我们对微步长卷积的工作方式有一个直观的理解。首先，确保你搞懂了一般卷积如何将内核滑过输入空间（蓝色），得到输出空间（绿色）。此处，输出比输入要小。（如果不理解，参阅 CS231n CNN section 或 the convolution arithmetic guide）

卷积运算图示，蓝色是输入，绿色是输出。

接下来，假设你有一个3X3的输入。我们的目标是进行上采样（upsample），这样，得到一个更大的输出。你可以将微步长卷积理解为将输入图像放大，然后在像素间插入0。然后在这个放大后的图像上进行卷积操作，得到一个较大的输出。此处，输出为5X5。

微步长卷积运算图示，蓝色是输入，绿色是输出。

插一段边注：进行上采样的卷积层有很多名字：全卷积( full convolution), 网内上采样（in-network upsampling）, 微步长卷积（fractionally-strided convolution），反向卷积（backwards convolution），反卷积（deconvolution）,上卷积（upconvolution），或者转置卷积（transposed convolution）。非常不推荐使用术语“反卷积”，因为这个术语已经有其他含义了：在某种数学运算，以及计算机视觉的其它应用中，这个术语有完全不同的含义。

现在我们有了微步长卷积结构，可以得到G(z)的表达，以一个向量 z∼pz 作为输入，输出一张 64x64x3 的RGB图像。

使用 DCGAN 构造生成器的一种方法。图像来自DCGAN论文。

DCGAN 论文也提出了其他的在训练 DCGANs 时的技巧和调整，比如批量正则化（batch normalization）以及 leaky RELUs。

使用G(z)生成伪图像

让我们先停下来欣赏一下 G(z) 多么强大吧！DCGAN 论文给出了DCGAN在卧室数据集训练出来的样子。然后 G(z) 可以给出下面的伪图像，生成器认为的卧室是什么样子的。下面的图片都不在原始数据集里哦！

另外，你也可以在输入空间z进行代数运算。下面是一个生成人脸的网络。

基于DCGAN的人脸代数运算 DCGAN论文。

[ML-Heavy] 训练DCGAN

现在我们已经定义了G(z)，并见识了它多么强大。那么我们怎么训练它呢？我们有很多未知的变量（参数），需要找到它们。此时，我们就要用到对抗网络了。
首先我们要定义一些符号。数据的概率分布（未知的）记作 pdata 。那么G(z)，（其中 z∼pz ）可以理解为从一个概率分布中的采样。让我们把这个概率分布记作 pg 。

概率分布

符 号 p z p d a t a p g 含 义 z 的 概 率 分 布 ， 简 单 、 已 知 图 像 的 概 率 分 布 (未 知) ， 是 图 像 数 据 样 本 的 来 源 生 成 器 G 用 来 采 样 的 概 率 分 布 ， 我 们 希 望 p g = = p d a t a

判别器网络D(x)输入图像x，返回图像x是从 pdata 的分布中采样的概率。理论上，当输入图像是从 pdata 中采样得到时，判别器输出一个接近1的值，当输入图像是伪图像，比如 pg 采样得到的图像时，判别器输出一个接近0的值。在DCGANs中，D(x)是一个传统的卷积神经网络。

判别器卷积神经网络，图片来自图像恢复论文

训练判别器的目标是：

1、对于真实数据分布 x∼pdata 的每一张图片，最大化D(x)。
2、对于不是真实数据分布 x≁pdata 的每一张图片，最小化D(x)。

生成器G(z)的训练目标是生成可以迷惑D的样本。输出是一张图像，可以作为判别器的输入。因此，生成器希望最大化D(G(z)),也就是最小化(1-D(G(z)))，因为D是一个概率，取值在0和1之间。

论文中提出，对抗网络是通过下面的最小最大策略实现的。第一项中的数学期望遍历了真实数据分布，第二项的数学期望遍历了 pz 中的样本，也就是遍历了 G(z)∼pg 。

min G max D E x \sim p d a t a l o g (D (x) + E z \sim p z [l o g (1 - D (G (z)))]

通过这个表达式关于D和G的参数的梯度，可以训练它们。我们知道如何快速计算这个表达式的每一个部分。数学期望可以通过大小为m的小批数据来估计，内侧的最大化可以通过k步梯度来估计。已经证明，k=1是比较适合训练的值。

我们用 θd 来表示判别器的参数，用 θg 来表示生成器的参数。关于用 θd 和 θg 的损失的梯度可以通过反向传播来计算，因为D和G都是由成熟的神经网络模块组成的。下面是GAN论文中的训练策略。理论上，训练结束后， pg==pdata 。所以G(z)可以生成服从 pdata 分布的样本。

GAN 论文中的训练算法

现有的GAN和DCGAN实现

在 Github 上，你可以看到很多极棒的 GAN 和 DCGAN 实现。
goodfeli/adversarial: GAN论文作者写的 Theano GAN 实现。
tqchen/mxnet-gan: 非官方 MXNet GAN 实现。
Newmu/dcgan_code: DCGAN论文作者写的 Theano GAN 实现。
soumith/dcgan.torch: DCGAN论文作者之一 (Soumith Chintala) 的 Torch DCGAN 实现。
carpedm20/DCGAN-tensorflow: 非官方 TensorFlow DCGAN 实现。
openai/improved-gan: OpenAI 第一篇论文背后的代码。在 carpedm20/DCGAN-tensorflow 基础上进行了大量的修改。
mattya/chainer-DCGAN: 非官方 Chainer DCGAN 实现。
jacobgil/keras-dcgan: 非官方 (未完成) Keras DCGAN 实现。

我们会在 carpedm20/DCGAN-tensorflow 的基础上构造模型。

[ML-Heavy] 在Tensorflow上构建DCGANs

这部分的实现在我的 bamos/dcgan-completion.tensorflow Github库中。我需要强调的是，这部分的代码来自Taehoon Kim 的 carpedm20/DCGAN-tensorflow 。在我自己的库中使用它，方便我们在下一部分图像补全中使用。

大部分实现代码在model.py中的一个python类，DCGAN中。把所有东西放进一个类中是有很多好处的，这样我们可以在训练结束后保留住中间过程，并在之后的使用中加载。

首先我们定义生成器和判别器结构。linear, conv2d_transpose, conv2d, 和 lrelu 函数在 ops.py 中定义。

def generator(self, z):
    self.z_, self.h0_w, self.h0_b = linear(z, self.gf_dim*8*4*4, 'g_h0_lin', with_w=True)

    self.h0 = tf.reshape(self.z_, [-1, 4, 4, self.gf_dim * 8])
    h0 = tf.nn.relu(self.g_bn0(self.h0))

    self.h1, self.h1_w, self.h1_b = conv2d_transpose(h0,
        [self.batch_size, 8, 8, self.gf_dim*4], name='g_h1', with_w=True)
    h1 = tf.nn.relu(self.g_bn1(self.h1))

    h2, self.h2_w, self.h2_b = conv2d_transpose(h1,
        [self.batch_size, 16, 16, self.gf_dim*2], name='g_h2', with_w=True)
    h2 = tf.nn.relu(self.g_bn2(h2))

    h3, self.h3_w, self.h3_b = conv2d_transpose(h2,
        [self.batch_size, 32, 32, self.gf_dim*1], name='g_h3', with_w=True)
    h3 = tf.nn.relu(self.g_bn3(h3))

    h4, self.h4_w, self.h4_b = conv2d_transpose(h3,
        [self.batch_size, 64, 64, 3], name='g_h4', with_w=True)

    return tf.nn.tanh(h4)

def discriminator(self, image, reuse=False):
    if reuse:
        tf.get_variable_scope().reuse_variables()

    h0 = lrelu(conv2d(image, self.df_dim, name='d_h0_conv'))
    h1 = lrelu(self.d_bn1(conv2d(h0, self.df_dim*2, name='d_h1_conv')))
    h2 = lrelu(self.d_bn2(conv2d(h1, self.df_dim*4, name='d_h2_conv')))
    h3 = lrelu(self.d_bn3(conv2d(h2, self.df_dim*8, name='d_h3_conv')))
    h4 = linear(tf.reshape(h3, [-1, 8192]), 1, 'd_h3_lin')

    return tf.nn.sigmoid(h4), h4

当我们初始化这个类的时候，将要用到这两个函数来构建模型。我们需要两个判别器，它们共享（复用）参数。一个用于来自数据分布的小批图像，另一个用于生成器生成的小批图像。

self.G = self.generator(self.z)
self.D, self.D_logits = self.discriminator(self.images)
self.D_, self.D_logits_ = self.discriminator(self.G, reuse=True)

接下来，我们定义损失函数。这里我们不用求和，而是用D的预测值和真实值之间的交叉熵（cross entropy），因为它更好用。判别器希望对所有“真”数据的预测都是1，对所有生成器生成的“伪”数据的预测都是0。生成器希望判别器对两者的预测都是1 。

self.d_loss_real = tf.reduce_mean(
    tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits,
                                            tf.ones_like(self.D)))
self.d_loss_fake = tf.reduce_mean(
    tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits_,
                                            tf.zeros_like(self.D_)))
self.g_loss = tf.reduce_mean(
    tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits_,
                                            tf.ones_like(self.D_)))
self.d_loss = self.d_loss_real + self.d_loss_fake

将每个模型的变量汇总到一起，这样，它们可以分别训练。

t_vars = tf.trainable_variables()

self.d_vars = [var for var in t_vars if 'd_' in var.name]
self.g_vars = [var for var in t_vars if 'g_' in var.name]

现在我们开始优化参数，使用 ADAM 优化。它是一种自适应非凸优化方法，在SGD面前很有竞争力，一般不需要手动调整学习率 (learning rate), 动量(momentum)，以及其他超参数。

d_optim = tf.train.AdamOptimizer(config.learning_rate, beta1=config.beta1) \
                  .minimize(self.d_loss, var_list=self.d_vars)
g_optim = tf.train.AdamOptimizer(config.learning_rate, beta1=config.beta1) \
                  .minimize(self.g_loss, var_list=self.g_vars)

下面我们遍历数据。每一次迭代，我们采样一个小批数据，然后使用优化器来更新网络。有趣的是，如果G只更新一次，鉴别器的损失不会变成0。另外，我认为最后调用 d_loss_fake 和 d_loss_real 进行了一些不必要的计算，因为这些值在 d_optim 和 g_optim 中已经计算过了。作为Tensorflow 的一个联系，你可以试着优化这一部分，并发送PR到原始的repo。

for epoch in xrange(config.epoch):
    ...
    for idx in xrange(0, batch_idxs):
        batch_images = ...

        batch_z = np.random.uniform(-1, 1, [config.batch_size, self.z_dim]) \
                    .astype(np.float32)

        # Update D network
        _, summary_str = self.sess.run([d_optim, self.d_sum],
            feed_dict={ self.images: batch_images, self.z: batch_z })


        # Update G network
        _, summary_str = self.sess.run([g_optim, self.g_sum],
            feed_dict={ self.z: batch_z })


        # Run g_optim twice to make sure that d_loss does not go to zero (different from paper)
        _, summary_str = self.sess.run([g_optim, self.g_sum],
            feed_dict={ self.z: batch_z })


        errD_fake = self.d_loss_fake.eval({self.z: batch_z})
        errD_real = self.d_loss_real.eval({self.images: batch_images})
        errG = self.g_loss.eval({self.z: batch_z})

搞定！当然，完整的代码会有更多的注释，可以在 model.py 中查看。

在图片集上跑DCGAN

如果你跳过了上一节，但是想跑跑代码，这部分代码在 bamos/dcgan-completion.tensorflow Github 库中。我要再次强调这个代码来自 Taehoon Kim 的 carpedm20/DCGAN-tensorflow 。在这里我们用我的库，是因为进行下一步比较方便。警告，如果你没有支持CUDA的GPU，这部分网络的训练会非常慢。

下面部分如果执行失败，请通知我

首先，clone 我的 bamos/dcgan-completion.tensorflow Github库和 OpenFace 到本地。我们要用到 OpenFace 的 Python-Only 部分来进行图像预处理。别担心，你不需要安装OpenFace 的 Torch 依赖。创建新目录， clone 下面的资源库。

git clone https://github.com/cmusatyalab/openface.git
git clone https://github.com/bamos/dcgan-completion.tensorflow.git

接下来，安装 OpenCV 和支持python2 的 dlib。如果你感兴趣，可以尝试实现 dlib 对 python3 的支持。安装时候有一些小技巧，我写了一些笔记，在 OpenFace setup guide ，包括我安装的是那个版本、如何安装。接下来，安装 OpenFace 的python 库，这样我们可以对图像进行预处理。如果你不是用虚拟环境，在运行 setup.py 时你需要用 sudo 来进行全局安装。（如果对你来说这部分比较困难，也可以使用 OpenFace 的 Docker 安装。）

下面下载一个人脸图像数据集。数据集中有没有标注不重要，我们会删掉它。不完全列表如下：MS-Celeb-1M, CelebA, CASIA-WebFace, FaceScrub, LFW, 和 MegaFace。将图片放在目录 dcgan-completion.tensorflow/data/your-dataset/raw 下，表明它是数据集的原始数据。

现在我们用 OpenFace 的 alignment 工具将图像预处理为 64X64 的数据。

./openface/util/align-dlib.py data/dcgan-completion.tensorflow/data/your-dataset/raw align innerEyesAndBottomLip data/dcgan-completion.tensorflow/data/your-dataset/aligned --size 64

最后我们将处理好图像的目录展平，这样目录下只有图像，没有子文件夹。

cd dcgan-completion.tensorflow/data/your-dataset/aligned
find . -name '*.png' -exec mv {} . \;
find . -type d -empty -delete
cd ../../..

现在我们可以训练 DCGAN 了。安装 Tensorflow ，开始训练。

./train-dcgan.py --dataset ./data/your-dataset/aligned --epoch 20

你可以在 sample 文件夹中查看从生成器中随机抽样出来的样本发图像是什么样子。我在 CASIA-WebFace 数据集和 FaceScrub 数据集上训练，因为我手头就有这两个数据集。 14轮训练之后，我的样本是这样的。

在 CASIA-WebFace 和 FaceScrub 上训练14轮后的 DCGAN 的样本

你也可以在 TensorBoard 上查看 Tensorflow 图像，以及损失函数。

tensorboard --logdir ./logs

TensorBoard 损失可视化图像。在训练过程中实时更新。

DCGAN 网络的TensorBoard可视化

第三步：找到用于图像补全最好的伪图像

使用 DCGAN 进行图像补全

既然我们已经有了鉴别器 D(x) 和生成器 G(z)，我们怎么把它用在图像补全上呢？在这章我要介绍的是 Raymond Yeh 和 Chen Chen 等人的一篇论文，“基于感知和语境损失的图像语义修补（Semantic Image Inpainting with Perceptual and Contextual Losses）”。论文在2016年7月26号发布于 arXiv 上。

对于某个图片y进行图像补全，一个有道理但是不可行的方案是，对于缺失的像素，最大化D(y)。结果既不是数据分布（ pdata ），也不是生成分布( pg )。我们期望的是，将y投影到生成分布上。

(a): 生成分布的 y 的理想重建（蓝色曲面）。（b）:尝试通过对 D(y) 最大化来重建 y 的一个失败的例子。图像来自图像修复论文。

[ML-Heavy] 到 pg 的投影的损失函数

为了给投影一个合理的定义，我们先为图像补全定义一些符号。我们使用一个二值掩码 M(mask), 也就是只有0、1两个值。值为1表示图像这部分我们想要保留，值为0表示这部分我们需要补全。现在我们可以定义，在给定了二值掩码M之后如何对y进行补全。将y中的元素和M中的元素相乘。两个矩阵对应位置元素相乘也叫做 Hadamard 积，用 M⊙y 表示。 M⊙y 表示图像的原始部分。

二值掩码图例

接下来，假设我们已经找到了一个 ẑ , 可以生成一个对缺失值进行重构的合理的 G(ẑ ) 。补全的像素 (1−M)⊙G(ẑ ) 可以加到原始像素上，得到重构的图像：

x r e c o n s t r u c t e d = M ⊙ y + (1 - M) ⊙ G (z ̂)

现在我们要做的事情，就是找到一个适于补全图像的 G(ẑ ) 。为了找到 ẑ ，我们回顾一下文章开头提到的语境和感知，将它们作为DCGANs的上下文。为此，我们定义了对于任意 z∼pz 的损失函数。损失函数越小，说明 ẑ 越合适。

语境损失：为了得到和输入图像相同的上下文，需要确保y已知像素对应位置的 G(z) 尽可能相似。所以，当 G(z) 的输出和 y 已知位置图像不相似的时候，需要对 G(z) 进行惩罚。为此，我们用 G(z) 减去 y 中对应位置的像素，然后得到它们不相似的程度:

 c o n t e x t u a l (z) = | | M ⊙ G (z) - M ⊙ y | |

其中

||x||1=∑i|xi| 是某个向量x的

l1 范数。

l2 范数也是可取的，但是论文指出，实践表明

l1 范数效果更好。

理想情况下，已知部分的 y 和 G(z) 的像素是相等的。也就是对于已知位置的像素i, ||M⊙G(z)i−M⊙yi||=0 , contextual(z)=0 。

感知损失：为了重建一个看起来真实的图像，需要确保判别器判定图像看起来是真实的。为此，我们进行和训练 DCGAN 中相同的步骤。

 p e r c e p t u a l (z) = l o g (1 - D (G (z)))

最后，将语境损失和感知损失组合起来，就可以找到 ẑ 了;

 (z) =  c o n t e x t u a l (z) + λ  p e r c e p t u a l (z) z ̂ = arg min z  (z)

其中 λ 是超参数，用来控制相比于感知损失，语境损失重要的程度。（我用的是默认的 λ=0.1 ，并没有对这个值进行深入研究。）然后如前所述，使用 G(z) 来重建y中缺失的部分。

 c o n t e x t u a l (z) = | | M ⊙ G (z) - M ⊙ y | |

图像也使用了 poisson blending 来使图像变得平滑。

[ML-Heavy] 使用tensorflow来进行DCGAN图像补全

这一章给出了我对于 Taehoon Kim 的 carpedm20/DCGAN-tensorflow 代码的修改，用于图像补全。

self.mask = tf.placeholder(tf.float32, [None] + self.image_shape, name='mask')

我们通过对梯度 ∇z(z) 进行梯度下降，可以迭代地求出 argminz(z) 。我们定义了损失函数之后，Tensorflow 的 automatic differentiation 可以自动地为我们计算出这个值！所以，完整的基于DCGANs的实现可以通过在现有的DCGAN实现上添加4行Tensorflow代码来完成。（当然，实现它还需要一些非 Tensorflow 代码。）

self.contextual_loss = tf.reduce_sum(
tf.contrib.layers.flatten(
    tf.abs(tf.mul(self.mask, self.G) - tf.mul(self.mask, self.images))), 1)
self.perceptual_loss = self.g_loss
self.complete_loss = self.contextual_loss + self.lam*self.perceptual_loss
self.grad_complete_loss = tf.gradients(self.complete_loss, self.z)

接下来，我们定义掩码。我只是在图像的中央区域加了一个，你可以加一些别的，比如随机掩码，然后发一个pull请求。

if config.maskType == 'center':
    scale = 0.25
    assert(scale <= 0.5)
    mask = np.ones(self.image_shape)
    l = int(self.image_size*scale)
    u = int(self.image_size*(1.0-scale))
    mask[l:u, l:u, :] = 0.0

梯度下降方面，我们对于z在[-1, 1]上的投影，使用小批量、含动量的投影梯度下降。

for idx in xrange(0, batch_idxs):
    batch_images = ...
    batch_mask = np.resize(mask, [self.batch_size] + self.image_shape)
    zhats = np.random.uniform(-1, 1, size=(self.batch_size, self.z_dim))

    v = 0
    for i in xrange(config.nIter):
        fd = {
            self.z: zhats,
            self.mask: batch_mask,
            self.images: batch_images,
        }
        run = [self.complete_loss, self.grad_complete_loss, self.G]
        loss, g, G_imgs = self.sess.run(run, feed_dict=fd)

        v_prev = np.copy(v)
        v = config.momentum*v - config.lr*g[0]
        zhats += -config.momentum * v_prev + (1+config.momentum)*v
        zhats = np.clip(zhats, -1, 1)

补全图像

选择一些用于图像补全的图片，将它们放到 dcgan-completion.tensorflow/your-test-data/raw 。然后像之前 dcgan-completion.tensorflow/your-test-data/aligned 那样排列整齐。这里我从LFW中随机抽出一些图像。我的DCGAN没有使用LFW的图像来训练。

你可以这样补全图像：

./complete.py ./data/your-test-data/aligned/* --outDir outputImages

这段代码会生成图像，并周期性地将图像输出在 —outDir 文件夹中。你可以使用ImageMagick来生成一个gif：

cd outputImages
convert -delay 10 -loop 0 completed/*.png completion.gif

最后的图像补全。图像的中心是自动生成的。源代码从此处下载。这是我随机从 LFW 中挑出的样本。

结论

感谢阅读，现在我们成功了！在文章中，我们涉及了图像补全的一种方法：

1、将图像理解为概率的分布。
2、生成伪图像。
3、找到用于补全最好的伪图像。

我的例子是人脸，但是DCGANs也可以在其他类型的图像上使用。总体而言，GANs 训练比较困难，我们尚不清楚如何在一个特定种类的物体上进行训练，也不清楚如何在大图像上训练。然而，这是一个很有潜力的模型，我很期待GAN将为我们创造什么样的未来！

你可能感兴趣的:(计算机视觉)

python机器学习方安乐 python python 机器学习人工智能
Python机器学习是当前最为热门的机器学习领域之一，其简洁、易用、高效的特点，让越来越多的开发者开始探索其应用。本文将从以下几个方面介绍Python机器学习的基础知识和实践案例，帮助读者更好地理解和应用机器学习技术。前提Python机器学习的应用领域A.图像识别和计算机视觉B.自然语言处理和文本分析C.数据挖掘和推荐系统深度学习A.神经网络的基本原理B.常用的深度学习框架和算法C.深度学习在图像
计算机视觉：卷积核每天五分钟玩转人工智能计算机视觉计算机视觉深度学习人工智能机器学习卷积神经网络
本文重点卷积神经网络（ConvolutionalNeuralNetwork，CNN）是一种深度学习模型，广泛应用于图像识别、自然语言处理、语音识别等领域。在卷积神经网络中，卷积核是网络的核心组件之一。通过不断堆叠卷积层和池化层，可以逐渐提取出更高级别的特征，从而实现更复杂的任务。卷积神经网络中的卷积核可以通过反向传播算法进行训练和优化，使其能够自适应地学习输入数据中的特征。因此，卷积神经网络在图像
4-2 计算机视觉-卷积神经网络-基本网络组件沉睡的小卡比兽 AI基础知识 cnn 卷积核端到端训练计算机视觉卷积神经网络
1、为什么卷积核一般都是奇数？2、由哪些层组成了基本的卷积神经网络，作用分别是什么？3、卷积层和池化层有什么区别？4、什么是端到端学习end-to-end？1、为什么卷积核一般都是奇数？（1）保护位置信息：保证锚点刚好在中间，方便以模块中心为标准进行滑动卷积，避免了位置信息发生偏移（2）padding时的对称性：保证padding时图像的两边依然对齐（3）一些历史尝试的经验，如边缘检测等，还有pa
国内的AI大模型有可能超过ChatGPT吗？ AIWritePaper官方账号 Prompt ChatGPT AIWritePaper chatgpt 人工智能深度学习 AI写作 AIGC
这是一个非常有前瞻性和现实意义的问题。要回答国内AI是否有可能超过ChatGPT，我们需要从多个方面来分析，包括技术基础、数据资源、应用场景、政策支持以及人才储备等。以下是对这一问题的详细探讨：1.技术基础（1）现状国内AI技术：国内的AI技术发展迅速，尤其在深度学习、自然语言处理（NLP）和计算机视觉等领域已经取得了显著进展。例如，百度的文心一言、阿里的通义千问等大语言模型（LLM）已经在技术上
基于深度学习的鸟类识别系统详解（UI界面 + YOLOv10 + 数据集） 2025年数学建模美赛深度学习 ui YOLO 人工智能 python 计算机视觉
引言鸟类识别是计算机视觉领域中一个独具挑战性的任务，尤其是在复杂的自然环境中，识别不同种类的鸟类需要非常强大的模型和丰富的数据集。随着深度学习技术的发展，基于YOLO（YouOnlyLookOnce）系列模型的目标检测系统展现了卓越的性能，特别是在速度和精度上的平衡方面。本博客将详细讲解如何利用YOLOv10模型来构建一个基于深度学习的鸟类识别系统。该系统会结合自定义鸟类数据集，设计一个简洁直观的
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
李开复：苹果发布AI应用的未来 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
苹果,AI,应用,未来,深度学习,自然语言处理,计算机视觉1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，并开始渗透到人们生活的方方面面。从智能手机的语音助手到自动驾驶汽车，AI正在改变着我们的世界。作为科技巨头，苹果也积极布局AI领域，并将其融入到其产品和服务中。2017年，苹果发布了其首款AI芯片A11Bionic，并将其应用于iPhoneX等产品。该芯片拥有强大的神经网络处理能力，为
【CV】25.1.7 arxiv更新速递 hinmer arxiv CV每日更新 python 人工智能计算机视觉 chatgpt 目标检测 ai AIGC
—第1篇----关键词:手势识别,计算机视觉,低光照条件,机器学习,RaspberryPi,OpenCV论文链接-摘要:手势识别是一种基于计算机视觉技术的感知用户界面，允许计算机将人类动作解释为命令，使用户无需使用手与计算机交流，从而使鼠标和键盘变得多余。手势识别的主要弱点是光线条件，因为手势控制依赖于摄像头。摄像头用于在2D和3D中解释手势，因此提取的信息可能因光源而异。系统的限制是无法在黑暗环
基于Hough变换与分数阶变分PDE的图像去雨算法实现（附带Matlab源码）心之飞翼算法 matlab 计算机视觉 Matlab
基于Hough变换与分数阶变分PDE的图像去雨算法实现（附带Matlab源码）图像去雨是计算机视觉领域的一个重要问题，它的目标是从雨滴造成的图像中恢复出原始的清晰图像。本文将介绍一种基于Hough变换和分数阶变分PDE（PartialDifferentialEquation）的图像去雨算法，并提供相应的Matlab源代码。算法步骤如下：导入图像首先，我们需要导入包含雨滴的图像。可以使用Matlab
PyTorch深度学习实战（43）——手写文本识别盼小辉丶深度学习 pytorch 人工智能
PyTorch深度学习实战（43）——手写文本识别0.前言1.手写文本识别1.1基本概念1.2输入和输出格式1.3CTC损失值2.模型与数据集分析2.1数据集分析2.2模型分析3.实现手写文本识别模型小结系列链接0.前言手写文本识别，也称为手写文本的光学字符识别(OpticalCharacterRecognition,OCR)，是计算机视觉和自然语言处理中的一项具有挑战性的任务。与印刷文本不同，手
【揭秘】图像算法工程师岗位如何进入？认识祂人工智能算法图像算法工程师
“图像算法工程师，主要专注于开发图像处理和计算机视觉算法，广泛应用于各行业。本文，我们来揭秘一下他们的日常工作，以及如何成为这一领域的专业人才。”01图像算法工程师的日常工作算法设计与开发图像算法工程师的核心任务是设计和开发算法，以解决特定的图像处理或计算机视觉问题。常见的任务包括：图像分类：使用卷积神经网络（CNN）对图像进行分类，常见算法如ResNet、VGG。目标检测：在图像中定位并标注物体
双足机器人开源项目广州深情Yangy_Jiaojiao 机器人
双足机器人（也称为人形机器人或仿人机器人）是一个复杂的领域，涉及机械设计、电子工程、控制理论、计算机视觉等多个学科。对于想要探索或开发双足机器人的开发者来说，有许多开源项目可以提供帮助。这些项目通常包括硬件设计文件、固件代码以及高级软件框架，以实现运动控制、导航、感知等功能。双足机器人开源项目推荐1.OpenHumanoids简介：由GeorgiaTech的AMBER实验室开发的开源双足机器人平台
【机器学习实战入门】使用OpenCV进行性别和年龄检测精通代码大仙数据挖掘深度学习 python 机器学习 python opencv 数据挖掘人工智能
GenderandAgeDetectionPython项目首先，向您介绍用于此高级Python项目的性别和年龄检测中的术语：什么是计算机视觉？计算机视觉是一门让计算机能够像人类一样观察和识别数字图像和视频的学科。它面临的挑战大多源于对生物视觉有限的了解。计算机视觉涉及获取、处理、分析和理解数字图像，旨在从现实世界中提取高维数据，从而生成可用来做决策的符号或数值信息。该过程通常包括物体识别、视频跟踪
机器学习笔记 - 机器学习/深度学习实战案例合集坐望云起深度学习从入门到精通机器学习深度学习人工智能案例应用神经网络
一、简述如何学习机器学习/深度学习，理论和实践都很重要，理论上的内容需要看课程、读教材。但是实践需要自己动手，实践之后自然会对理论有更深入的理解。怎么实践？借用欧阳修《卖油翁》的话”无他，但手熟尔“。就是多看多写多跑。下面创建这个github的目的是为了存放一些图像处理/计算机视觉/机器学习/深度学习的示例代码集合，不定期会添加新的示例，可供参考。GitHub-bashendixie/ml_too
Python自动化运维：一键掌控服务器的高效之道蒙娜丽宁 Python杂谈运维 python 自动化
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在互联网和云计算高速发展的今天，服务器数量的指数增长使得手动运维和管理变得异常繁琐。Python凭借其强大的可读性和丰富的生态系统，成为实现自动化运维的理想语言。本文以“Python自动化运维：编写自动化脚本进行服务器管理”为主题，深入探讨了如何利用Py
基于C++和ONNX Runtime的YOLOv5目标检测实战浪浪山小白兔 c++YOLO 目标检测
1.前言在计算机视觉领域，目标检测是一项关键任务，其应用广泛，涵盖了安防监控、自动驾驶、工业检测等众多领域。YOLOv5作为一种先进的目标检测算法，以其速度快、精度高的特点备受关注。本文将详细介绍如何使用C++结合ONNXRuntime推理引擎来部署YOLOv5模型，实现高效的目标检测。2.ONNX与YOLOv52.1ONNX简介ONNX（OpenNeuralNetworkExchange）是一种
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
卷积调制空间自注意力SPATIALatt模型详解及代码复现清风AI 深度学习人工智能 python 神经网络 conda
背景与意义SPATIALaTT模型的提出源于对自注意力机制和卷积神经网络（CNN）的深入研究。在计算机视觉领域，CNN长期占据主导地位，而自注意力机制的引入为视觉任务带来了新的思路。SPATIALaTT模型的意义在于融合了这两种强大的特征提取方法，充分发挥了它们的优势。这种融合不仅提高了模型的性能，还为设计更高效的视觉模型提供了新的思路，推动了计算机视觉技术的发展。通过结合自注意力机制和卷积神经网
基于YOLOv5、YOLOv8和YOLOv10的机场安检行李检测：深度学习应用与实现 2025年数学建模美赛 YOLO 深度学习人工智能目标跟踪目标检测
引言随着全球航空运输业的持续增长，机场的安全性变得越来越重要。机场安检作为航空安全的重要组成部分，主要负责对乘客和行李进行检查，防止危险物品进入机场或飞行器。传统的安检方式多依赖人工检查，效率低下且容易出错。因此，基于深度学习的自动化行李检测系统应运而生，通过计算机视觉技术，自动识别和分类行李中的物品，大大提高了安检的效率与准确性。YOLO（YouOnlyLookOnce）系列算法，由于其高效的目
【Python】深入探讨Python中的单例模式：元类与装饰器实现方式分析与代码示例蒙娜丽宁 Python杂谈 python 单例模式开发语言
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界单例模式（SingletonPattern）是一种常见的设计模式，它确保一个类只有一个实例，并提供一个全局访问点。在Python中，实现单例模式的方式多种多样，包括基于装饰器、元类和模块级别的单例实现。本文将详细探讨这些实现方式，并通过大量代码示例进行演
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
机器视觉在医疗影像分析中的应用：助力放射科医生精准诊断人工智能专属驿站大数据人工智能计算机视觉
在现代医疗领域，影像学检查如X光、CT扫描和MRI等是诊断疾病的重要手段。随着技术的不断发展，机器视觉算法在医疗影像分析中的应用日益广泛，为放射科医生提供了强大的辅助工具，极大地提高了诊断的准确性和效率。本文将探讨机器视觉在医疗影像分析中的具体应用及其对医疗诊断带来的变革。一、机器视觉算法简介机器视觉是一种模拟人类视觉的科学技术，通过图像处理、模式识别和计算机视觉等技术，使计算机能够“看”懂图像中
【计算机视觉】人脸识别油泼辣子多加计算机视觉计算机视觉 opencv 人工智能
一、简介人脸识别是将图像或者视频帧中的人脸与数据库中的人脸进行对比，判断输入人脸是否与数据库中的某一张人脸匹配，即判断输入人脸是谁或者判断输入人脸是否是数据库中的某个人。人脸识别属于1：N的比对，输入人脸身份是1，数据库人脸身份数量为N，一般应用在办公室门禁，疑犯追踪；人脸验证属于1:1的比对，输入人脸身份为1，数据库中为同一人的数据，在安全领域应用比较多。一个完整的人脸识别流程主要包括人脸检测、
Python从0到100（七十三）：Python OpenCV-OpenCV实现手势虚拟拖拽是Dream呀 python opencv 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
ACNet：深度学习中的自适应卷积网络新星郎轶诺
ACNet：深度学习中的自适应卷积网络新星项目地址:https://gitcode.com/gh_mirrors/ac/ACNet在深度学习领域，卷积神经网络（CNN）一直是图像处理和计算机视觉任务的核心技术。然而，传统的固定大小的卷积核无法灵活适应不同区域的信息密度。针对这一问题，ACNet（AdaptiveConvolutionNetwork）项目应运而生，它引入了一种新型的自适应卷积层，旨在
【论文投稿】探秘计算机视觉算法：开启智能视觉新时代小周不想卷艾思科蓝学术会议投稿计算机视觉
目录引言一、计算机视觉算法基石：图像基础与预处理二、特征提取：视觉信息的精华萃取三、目标检测：从图像中精准定位目标四、图像分类：识别图像所属类别五、语义分割：理解图像的像素级语义六、计算机视觉算法前沿趋势与挑战引言在当今数字化浪潮中，计算机视觉宛如一颗璀璨的明珠，正深刻地改变着我们与世界的交互方式。从安防监控中的精准识别，到自动驾驶汽车的智能导航；从医疗影像的辅助诊断，到工业生产中的缺陷检测，计算
使用Llama 3.2-Vision多模态LLM与您的图像聊天 AI程序猿人 llama transformer pytorch 深度学习大模型应用人工智能大模型
介绍将视觉能力与大型语言模型（LLMs）结合的多模态LLM（MLLM）正在通过多模态LLM革命性地改变计算机视觉领域。这些模型结合了文本和视觉输入，展示了在图像理解和推理方面的出色能力。虽然这些模型以前只能通过API访问，但最近的开源选项现在允许本地执行，使其在生产环境中更具吸引力。在此教程中，我们将学习如何使用开源的Llama3.2-Vision模型与图像进行聊天，你会对其OCR、图像理解和推理
AI大模型如何赋能电商行业，引领变革虞书欣的C 人工智能开发语言
•个性化推荐：利用机器学习算法分析用户的历史购买记录、浏览行为和喜好，生成个性化的产品推荐列表，提升用户的购买意愿和满意度。•优化用户体验：•智能搜索引擎：运用自然语言处理技术，优化搜索引擎，让用户能够通过自然语言进行搜索。•虚拟客服：通过聊天机器人和语音助手，提供24/7的客户支持，快速解答用户咨询。•图像识别：利用计算机视觉技术，用户可以通过拍照识别商品，快速找到相似商品或进行排版搭配推荐。•
3d系统误差分析 Ai智享结构光 3d 数码相机计算机视觉
系统标定重投影误差预估在计算机视觉和三维重建领域中，评估一个相机系统标定精度的重要指标。通过比较真实的三维点在图像中的投影位置与标定模型计算出的投影位置之间的差异，来衡量标定的准确性。以下是对这一概念的详细解析：什么是系统标定？系统标定(SystemCalibration)是指对一个视觉系统（例如单目相机、双目相机系统或结构光系统）进行参数标定的过程，包括：内参标定：相机的内部参数（如焦距、光心、
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo