普通网友

计算机视觉与深度学习（12）

原文地址：Image Completion with Deep Learning in TensorFlow by Brandon Amos
原文翻译与校对：@MOLLY && 寒小阳 ([email protected])
时间：2017年4月。
出处：http://blog.csdn.net/han_xiaoyang/article/details/70214565
声明：版权所有，转载请联系作者并注明出

简介
第一步：将图像理解为一个概率分布的样本
- 你是怎样补全缺失信息的呢？
- 但是怎样着手统计呢？这些都是图像啊。
- 那么我们怎样补全图像？
第二步：快速生成假图像
- 在未知概率分布情况下，学习生成新样本
- [ML-Heavy] 生成对抗网络(Generative Adversarial Net, GAN) 的架构
- 使用G(z)生成伪图像
- [ML-Heavy] 训练DCGAN
- 现有的GAN和DCGAN实现
- [ML-Heavy] 在Tensorflow上构建DCGANs
- 在图片集上跑DCGAN
第三步：找到用于图像补全最好的伪图像
- 使用 DCGAN 进行图像补全
- [ML-Heavy] 到 pgpg 的投影的损失函数
- [ML-Heavy] 使用tensorflow来进行DCGAN图像补全
- 补全图像
结论

简介

内容识别填充(译注: Content-aware fill ,是 photoshop 的一个功能)是一个强大的工具，设计师和摄影师可以用它来填充图片中不想要的部分或者缺失的部分。在填充图片的缺失或损坏的部分时，图像补全和修复是两种密切相关的技术。有很多方法可以实现内容识别填充，图像补全和修复。在这篇博客中，我会介绍 Raymond Yeh 和 Chen Chen 等人的一篇论文，“基于感知和语境损失的图像语义修补（Semantic Image Inpainting with Perceptual and Contextual Losses）”。论文在2016年7月26号发布于 arXiv 上，介绍了如何使用 DCGAN 网络来进行图像补全。博文面向一般技术背景的读者，部分内容需要有机器学习的背景。我在相关章节标注了[ML-Heavy]标签，如果你不想了解太多细节，可以跳过这些章节。我们只会涉及到填充人脸图像缺失部分的情况。博文相关 Tensorflow 代码已经发布到 GitHub 上：bamos/dcgan-completion.tensorflow 。
图像补全分为三个步骤。

首先我们将图像理解为一个概率分布的样本。
基于这种理解，学习如何生成伪图片。
然后我们找到最适合填充回去的伪图片。

使用photoshop来对图像缺失部分补全

使用photoshop自动删除不要的部分

下文将要介绍到的图像补全。图像的中心是自动生成的。源码可以从此处下载。
这些图像是我从 LFW 数据集中取得的一个随机样本。

第一步：将图像理解为一个概率分布的样本

你是怎样补全缺失信息的呢？

在上面的例子中，想象你正在构造一个可以填充缺失部分的系统。你会怎么做呢？你觉得人类大脑是怎么做的呢？你使用了什么样的信息呢？
在博文中，我们会关注两种信息：
语境信息：你可以通过周围的像素来推测缺失像素的信息。
感知信息：你会用“正常”的部分来填充，比如你在现实生活中或其它图片上看到的样子。
两者都很重要。没有语境信息，你怎么知道填充哪一个进去？没有感知信息，通过同样的上下文可以生成无数种可能。有些机器学习系统看起来“正常”的图片，人类看起来可能不太正常。
如果有一种确切的、直观的算法，可以捕获前文图像补全步骤介绍中提到的两种属性，那就再好不过了。对于特定的情况，构造这样的算法是可行的。但是没有一般的方法。目前最好的解决方案是通过统计和机器学习来得到一个近似的技术。

但是怎样着手统计呢？这些都是图像啊。

为了激发大家的思考，我们从一个很好理解、可以写成简洁形式的概率分布开始：一个正态分布。这是正态分布的概率密度函数（PDF）。你可以将PDF理解成在输入空间横向移动，纵轴表示某个值出现的概率。（如果你感兴趣，绘制这幅图的代码可以从 bamos/dcgan-completion.tensorflow:simple-distributions.py 下载。）

从这个分布中采样，就可以得到一些数据。需要搞清楚的是PDF和样本之间的联系。

从正态分布中的采样

2维图像的PDF和采样。 PDF 用等高线图表示，样本点画在上面。

这是1维分布，因为输入只能沿着一个维度。在两个维度上也可以这么做。
在图像和统计学之间，最关键的联系就是，我们可以将图像看作是从一个高维概率分布中得到的采样。概率分布对应的是图像的像素。想象你在用相机拍照。得到的图像是由有限个数的像素组成。当你通过相机拍照的时候，你就在从这个复杂的概率分布中进行采样。这个概率分布就决定了我们判断一张图片是正常的，还是不正常的。对于图片而言，与正态分布不同的是，我们无法得知真实的概率分布，我们只能去收集样本。
在这篇文章中，我们会使用彩色图像，它用 RGB颜色表示。我们的图像宽64像素，高64像素，所以我们的概率分布是 64⋅64⋅3≈12k 维的。

那么我们怎样补全图像？

首先考虑多变量正态分布，以求得到一些启发。给定 x=1 , 那么 y 最可能的值是什么？我们可以固定x的值，然后找到使PDF最大的 y。

在多维正态分布中，给定x，得到最大可能的y

这个概念可以很自然地推广到图像概率分布。我们已知一些值，希望补全缺失值。这可以简单理解成一个最大化问题。我们搜索所有可能的缺失值，用于补全的图像就是可能性最大的值。
从正态分布的样本来看，只通过样本，我们就可以得出PDF。只需挑选你喜欢的统计模型，然后拟合数据即可。
然而，我们实际上并没有使用这种方法。对于简单分布来说，PDF很容易得出来。但是对于更复杂的图像分布来说，就十分困难，难以处理。之所以复杂，一部分原因是复杂的条件依赖：一个像素的值依赖于图像中其它像素的值。另外，最大化一个一般的PDF是一个非常困难和棘手的非凸优化问题。

第二步：快速生成假图像

在未知概率分布情况下，学习生成新样本

除了学习如何计算PDF之外，统计学中另一个成熟的想法是学习怎样用生成模型生成新的（随机）样本。生成模型一般很难训练和处理，但是后来深度学习社区在这个领域有了一个惊人的突破。Yann LeCun 在这篇 Quora 回答中对如何进行生成模型的训练进行了一番精彩的论述，并将它称为机器学习领域近10年来最有意思的想法。

Yann LeCun 对生成对抗网络的介绍

将生成对抗网络类比为街机游戏。两个网络相互对抗，共同进步。就像两个人类在游戏中对抗一样。

其它的深度学习方法，比如 Variational Autoencoders(VAEs)，也可以用来训练生成模型。在这篇博文中，我们用的是生成对抗网络(Generative Adversarial Nets，GANs)。

[ML-Heavy] 生成对抗网络(Generative Adversarial Net, GAN) 的架构

这个想法是 Ian Goodfellow 等人在2014年Neural Information Processing Systems (NIPS) 研讨会上发表的里程碑式论文“生成对抗网络”(Generative Adversarial Nets，GANs)中提出的。主要思想是，我们定义一个简单、常用的分布，用符号pzpdatapg含义z的概率分布，简单、已知图像的概率分布(未知)，是图像数据样本的来源生成器G用来采样的概率分布，我们希望pg==pdata 是五维的，我们可以通过一行python的 numpy 代码来进行采样：

z = np.random.uniform(-1, 1, 5)
array([ 0.77356483,  0.95258473, -0.18345086,  0.69224724, -0.34718733])

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3

现在有了一个用于采样的简单分布，我们定义一个函数 G(z) 来从我们的原始概率分布中采样。

def G(z):
   ...
   return imageSample
z = np.random.uniform(-1, 1, 5)
imageSample = G(z)

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6

那么我们怎样定义G(z)，可以使它输入一个向量，输出一张图像？我们将使用深度神经网络。神经网络基础有很多教程，所以我不会在此介绍。推荐一些不错的参考，斯坦福CS231n课程，Ian Goodfellow 等人的 deep learning book 、Image Kernels Explained Visually，以及 convolution arithmetic guide。

构造一个基于深度学习的 G(z)有很多种方式。原始的 GAN 论文提出了一个想法，一个训练过程，以及一个初步的实验结果。这个想法已经被极大地发扬了，其中一个想法在论文“基于深度卷积生成对抗网络的无监督表征学习（Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks）”中提出，作者是 Alec Radford, Luke Metz, 和 Soumith Chintala，发表在 2016 International Conference on Learning Representations (ICLR, 读作 “eye-clear”)上。这篇论文提出了深度卷积GANS（叫做DCGANs），使用微步长卷积来对图像进行上采样。

那么什么是微步长卷积，以及它是怎样对图像进行上采样的呢？ Vincent Dumoulin 和 Francesco Visin 的论文“深度学习卷积运算指南（A guide to convolution arithmetic for deep learning）”和卷积运算项目是对深度学习中的卷积运算的一个非常好的介绍。图例非常棒，可以让我们对微步长卷积的工作方式有一个直观的理解。首先，确保你搞懂了一般卷积如何将内核滑过输入空间（蓝色），得到输出空间（绿色）。此处，输出比输入要小。（如果不理解，参阅 CS231n CNN section 或 the convolution arithmetic guide）

卷积运算图示，蓝色是输入，绿色是输出。

接下来，假设你有一个3X3的输入。我们的目标是进行上采样（upsample），这样，得到一个更大的输出。你可以将微步长卷积理解为将输入图像放大，然后在像素间插入0。然后在这个放大后的图像上进行卷积操作，得到一个较大的输出。此处，输出为5X5。

微步长卷积运算图示，蓝色是输入，绿色是输出。

插一段边注：进行上采样的卷积层有很多名字：全卷积( full convolution), 网内上采样（in-network upsampling）, 微步长卷积（fractionally-strided convolution），反向卷积（backwards convolution），反卷积（deconvolution）,上卷积（upconvolution），或者转置卷积（transposed convolution）。非常不推荐使用术语“反卷积”，因为这个术语已经有其他含义了：在某种数学运算，以及计算机视觉的其它应用中，这个术语有完全不同的含义。

现在我们有了微步长卷积结构，可以得到G(z)的表达，以一个向量z∼pz 作为输入，输出一张 64x64x3 的RGB图像。

使用 DCGAN 构造生成器的一种方法。图像来自DCGAN论文。

DCGAN 论文也提出了其他的在训练 DCGANs 时的技巧和调整，比如批量正则化（batch normalization）以及 leaky RELUs。

使用G(z)生成伪图像

让我们先停下来欣赏一下 G(z) 多么强大吧！DCGAN 论文给出了DCGAN在卧室数据集训练出来的样子。然后 G(z) 可以给出下面的伪图像，生成器认为的卧室是什么样子的。下面的图片都不在原始数据集里哦！

另外，你也可以在输入空间z进行代数运算。下面是一个生成人脸的网络。

基于DCGAN的人脸代数运算 DCGAN论文。

[ML-Heavy] 训练DCGAN

现在我们已经定义了G(z)，并见识了它多么强大。那么我们怎么训练它呢？我们有很多未知的变量（参数），需要找到它们。此时，我们就要用到对抗网络了。
首先我们要定义一些符号。数据的概率分布（未知的）记作pdata。

概率分布

符 号 p z p d a t a p g 含 义 z 的 概 率 分 布 ， 简 单 、 已 知 图 像 的 概 率 分 布 (未 知) ， 是 图 像 数 据 样 本 的 来 源 生 成 器 G 用 来 采 样 的 概 率 分 布 ， 我 们 希 望 p g == p d a t a

判别器网络D(x)输入图像x，返回图像x是从pdata采样得到的图像时，判别器输出一个接近0的值。在DCGANs中，D(x)是一个传统的卷积神经网络。

判别器卷积神经网络，图片来自图像恢复论文

训练判别器的目标是：

1、对于真实数据分布x∼pdata的每一张图片，最大化D(x)。
2、对于不是真实数据分布x≁pdata的每一张图片，最小化D(x)。

生成器G(z)的训练目标是生成可以迷惑D的样本。输出是一张图像，可以作为判别器的输入。因此，生成器希望最大化D(G(z)),也就是最小化(1-D(G(z)))，因为D是一个概率，取值在0和1之间。

论文中提出，对抗网络是通过下面的最小最大策略实现的。第一项中的数学期望遍历了真实数据分布，第二项的数学期望遍历了pz。

min G max D E x \sim p d a t a l o g (D (x) + E z \sim p z [l o g (1 - D (G (z)))]

\min_G \max_D E_{x \sim p_{data}} log(D(x)+E_{z∼pz}[log(1−D(G(z)))]

通过这个表达式关于D和G的参数的梯度，可以训练它们。我们知道如何快速计算这个表达式的每一个部分。数学期望可以通过大小为m的小批数据来估计，内侧的最大化可以通过k步梯度来估计。已经证明，k=1是比较适合训练的值。

我们用θd分布的样本。

GAN 论文中的训练算法

现有的GAN和DCGAN实现

在 Github 上，你可以看到很多极棒的 GAN 和 DCGAN 实现。
goodfeli/adversarial: GAN论文作者写的 Theano GAN 实现。
tqchen/mxnet-gan: 非官方 MXNet GAN 实现。
Newmu/dcgan_code: DCGAN论文作者写的 Theano GAN 实现。
soumith/dcgan.torch: DCGAN论文作者之一 (Soumith Chintala) 的 Torch DCGAN 实现。
carpedm20/DCGAN-tensorflow: 非官方 TensorFlow DCGAN 实现。
openai/improved-gan: OpenAI 第一篇论文背后的代码。在 carpedm20/DCGAN-tensorflow 基础上进行了大量的修改。
mattya/chainer-DCGAN: 非官方 Chainer DCGAN 实现。
jacobgil/keras-dcgan: 非官方 (未完成) Keras DCGAN 实现。

我们会在 carpedm20/DCGAN-tensorflow 的基础上构造模型。

[ML-Heavy] 在Tensorflow上构建DCGANs

这部分的实现在我的 bamos/dcgan-completion.tensorflow Github库中。我需要强调的是，这部分的代码来自Taehoon Kim 的 carpedm20/DCGAN-tensorflow 。在我自己的库中使用它，方便我们在下一部分图像补全中使用。

大部分实现代码在model.py中的一个python类，DCGAN中。把所有东西放进一个类中是有很多好处的，这样我们可以在训练结束后保留住中间过程，并在之后的使用中加载。

首先我们定义生成器和判别器结构。linear, conv2d_transpose, conv2d, 和 lrelu 函数在 ops.py 中定义。

def generator(self, z):
    self.z_, self.h0_w, self.h0_b = linear(z, self.gf_dim*8*4*4, 'g_h0_lin', with_w=True)

    self.h0 = tf.reshape(self.z_, [-1, 4, 4, self.gf_dim * 8])
    h0 = tf.nn.relu(self.g_bn0(self.h0))

    self.h1, self.h1_w, self.h1_b = conv2d_transpose(h0,
        [self.batch_size, 8, 8, self.gf_dim*4], name='g_h1', with_w=True)
    h1 = tf.nn.relu(self.g_bn1(self.h1))

    h2, self.h2_w, self.h2_b = conv2d_transpose(h1,
        [self.batch_size, 16, 16, self.gf_dim*2], name='g_h2', with_w=True)
    h2 = tf.nn.relu(self.g_bn2(h2))

    h3, self.h3_w, self.h3_b = conv2d_transpose(h2,
        [self.batch_size, 32, 32, self.gf_dim*1], name='g_h3', with_w=True)
    h3 = tf.nn.relu(self.g_bn3(h3))

    h4, self.h4_w, self.h4_b = conv2d_transpose(h3,
        [self.batch_size, 64, 64, 3], name='g_h4', with_w=True)

    return tf.nn.tanh(h4)

def discriminator(self, image, reuse=False):
    if reuse:
        tf.get_variable_scope().reuse_variables()

    h0 = lrelu(conv2d(image, self.df_dim, name='d_h0_conv'))
    h1 = lrelu(self.d_bn1(conv2d(h0, self.df_dim*2, name='d_h1_conv')))
    h2 = lrelu(self.d_bn2(conv2d(h1, self.df_dim*4, name='d_h2_conv')))
    h3 = lrelu(self.d_bn3(conv2d(h2, self.df_dim*8, name='d_h3_conv')))
    h4 = linear(tf.reshape(h3, [-1, 8192]), 1, 'd_h3_lin')

    return tf.nn.sigmoid(h4), h4

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8
      
      
      
      9
      
      
      
      10
      
      
      
      11
      
      
      
      12
      
      
      
      13
      
      
      
      14
      
      
      
      15
      
      
      
      16
      
      
      
      17
      
      
      
      18
      
      
      
      19
      
      
      
      20
      
      
      
      21
      
      
      
      22
      
      
      
      23
      
      
      
      24
      
      
      
      25
      
      
      
      26
      
      
      
      27
      
      
      
      28
      
      
      
      29
      
      
      
      30
      
      
      
      31
      
      
      
      32
      
      
      
      33
      
      
      
      34
      
      
      
      35

当我们初始化这个类的时候，将要用到这两个函数来构建模型。我们需要两个判别器，它们共享（复用）参数。一个用于来自数据分布的小批图像，另一个用于生成器生成的小批图像。

self.G = self.generator(self.z)
self.D, self.D_logits = self.discriminator(self.images)
self.D_, self.D_logits_ = self.discriminator(self.G, reuse=True)

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

接下来，我们定义损失函数。这里我们不用求和，而是用D的预测值和真实值之间的交叉熵（cross entropy），因为它更好用。判别器希望对所有“真”数据的预测都是1，对所有生成器生成的“伪”数据的预测都是0。生成器希望判别器对两者的预测都是1 。

self.d_loss_real = tf.reduce_mean(
    tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits,
                                            tf.ones_like(self.D)))
self.d_loss_fake = tf.reduce_mean(
    tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits_,
                                            tf.zeros_like(self.D_)))
self.g_loss = tf.reduce_mean(
    tf.nn.sigmoid_cross_entropy_with_logits(self.D_logits_,
                                            tf.ones_like(self.D_)))
self.d_loss = self.d_loss_real + self.d_loss_fake

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8
      
      
      
      9
      
      
      
      10
      
      
      
      11

将每个模型的变量汇总到一起，这样，它们可以分别训练。

t_vars = tf.trainable_variables()

self.d_vars = [var for var in t_vars if 'd_' in var.name]
self.g_vars = [var for var in t_vars if 'g_' in var.name]

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5

现在我们开始优化参数，使用 ADAM 优化。它是一种自适应非凸优化方法，在SGD面前很有竞争力，一般不需要手动调整学习率 (learning rate), 动量(momentum)，以及其他超参数。

d_optim = tf.train.AdamOptimizer(config.learning_rate, beta1=config.beta1) \
                  .minimize(self.d_loss, var_list=self.d_vars)
g_optim = tf.train.AdamOptimizer(config.learning_rate, beta1=config.beta1) \
                  .minimize(self.g_loss, var_list=self.g_vars)

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5

下面我们遍历数据。每一次迭代，我们采样一个小批数据，然后使用优化器来更新网络。有趣的是，如果G只更新一次，鉴别器的损失不会变成0。另外，我认为最后调用 d_loss_fake 和 d_loss_real 进行了一些不必要的计算，因为这些值在 d_optim 和 g_optim 中已经计算过了。作为Tensorflow 的一个联系，你可以试着优化这一部分，并发送PR到原始的repo。

for epoch in xrange(config.epoch):
    ...
    for idx in xrange(0, batch_idxs):
        batch_images = ...

        batch_z = np.random.uniform(-1, 1, [config.batch_size, self.z_dim]) \
                    .astype(np.float32)

        # Update D network
        _, summary_str = self.sess.run([d_optim, self.d_sum],
            feed_dict={ self.images: batch_images, self.z: batch_z })


        # Update G network
        _, summary_str = self.sess.run([g_optim, self.g_sum],
            feed_dict={ self.z: batch_z })


        # Run g_optim twice to make sure that d_loss does not go to zero (different from paper)
        _, summary_str = self.sess.run([g_optim, self.g_sum],
            feed_dict={ self.z: batch_z })


        errD_fake = self.d_loss_fake.eval({self.z: batch_z})
        errD_real = self.d_loss_real.eval({self.images: batch_images})
        errG = self.g_loss.eval({self.z: batch_z})

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8
      
      
      
      9
      
      
      
      10
      
      
      
      11
      
      
      
      12
      
      
      
      13
      
      
      
      14
      
      
      
      15
      
      
      
      16
      
      
      
      17
      
      
      
      18
      
      
      
      19
      
      
      
      20
      
      
      
      21
      
      
      
      22
      
      
      
      23
      
      
      
      24
      
      
      
      25
      
      
      
      26
      
      
      
      27

搞定！当然，完整的代码会有更多的注释，可以在 model.py 中查看。

在图片集上跑DCGAN

如果你跳过了上一节，但是想跑跑代码，这部分代码在 bamos/dcgan-completion.tensorflow Github 库中。我要再次强调这个代码来自 Taehoon Kim 的 carpedm20/DCGAN-tensorflow 。在这里我们用我的库，是因为进行下一步比较方便。警告，如果你没有支持CUDA的GPU，这部分网络的训练会非常慢。

下面部分如果执行失败，请通知我

首先，clone 我的 bamos/dcgan-completion.tensorflow Github库和 OpenFace 到本地。我们要用到 OpenFace 的 Python-Only 部分来进行图像预处理。别担心，你不需要安装OpenFace 的 Torch 依赖。创建新目录， clone 下面的资源库。

git clone https://github.com/cmusatyalab/openface.git
git clone https://github.com/bamos/dcgan-completion.tensorflow.git

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3

接下来，安装 OpenCV 和支持python2 的 dlib。如果你感兴趣，可以尝试实现 dlib 对 python3 的支持。安装时候有一些小技巧，我写了一些笔记，在 OpenFace setup guide ，包括我安装的是那个版本、如何安装。接下来，安装 OpenFace 的python 库，这样我们可以对图像进行预处理。如果你不是用虚拟环境，在运行 setup.py 时你需要用 sudo 来进行全局安装。（如果对你来说这部分比较困难，也可以使用 OpenFace 的 Docker 安装。）

下面下载一个人脸图像数据集。数据集中有没有标注不重要，我们会删掉它。不完全列表如下：MS-Celeb-1M, CelebA, CASIA-WebFace, FaceScrub, LFW, 和 MegaFace。将图片放在目录 dcgan-completion.tensorflow/data/your-dataset/raw 下，表明它是数据集的原始数据。

现在我们用 OpenFace 的 alignment 工具将图像预处理为 64X64 的数据。

./openface/util/align-dlib.py data/dcgan-completion.tensorflow/data/your-dataset/raw align innerEyesAndBottomLip data/dcgan-completion.tensorflow/data/your-dataset/aligned --size 64

   
     
     
     
     
      
      
      
      1
      
      
      
      2

最后我们将处理好图像的目录展平，这样目录下只有图像，没有子文件夹。

cd dcgan-completion.tensorflow/data/your-dataset/aligned
find . -name '*.png' -exec mv {} . \;
find . -type d -empty -delete
cd ../../..

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5

现在我们可以训练 DCGAN 了。安装 Tensorflow ，开始训练。

./train-dcgan.py --dataset ./data/your-dataset/aligned --epoch 20

   
     
     
     
     
      
      
      
      1
      
      
      
      2

你可以在 sample 文件夹中查看从生成器中随机抽样出来的样本发图像是什么样子。我在 CASIA-WebFace 数据集和 FaceScrub 数据集上训练，因为我手头就有这两个数据集。 14轮训练之后，我的样本是这样的。

在 CASIA-WebFace 和 FaceScrub 上训练14轮后的 DCGAN 的样本

你也可以在 TensorBoard 上查看 Tensorflow 图像，以及损失函数。

tensorboard --logdir ./logs

   
     
     
     
     
      
      
      
      1
      
      
      
      2

TensorBoard 损失可视化图像。在训练过程中实时更新。

DCGAN 网络的TensorBoard可视化

第三步：找到用于图像补全最好的伪图像

使用 DCGAN 进行图像补全

既然我们已经有了鉴别器 D(x) 和生成器 G(z)，我们怎么把它用在图像补全上呢？在这章我要介绍的是 Raymond Yeh 和 Chen Chen 等人的一篇论文，“基于感知和语境损失的图像语义修补（Semantic Image Inpainting with Perceptual and Contextual Losses）”。论文在2016年7月26号发布于 arXiv 上。

对于某个图片y进行图像补全，一个有道理但是不可行的方案是，对于缺失的像素，最大化D(y)。结果既不是数据分布（pdata)。我们期望的是，将y投影到生成分布上。

(a): 生成分布的 y 的理想重建（蓝色曲面）。（b）:尝试通过对 D(y) 最大化来重建 y 的一个失败的例子。图像来自图像修复论文。

[ML-Heavy] 到 pg 的投影的损失函数

为了给投影一个合理的定义，我们先为图像补全定义一些符号。我们使用一个二值掩码 M(mask), 也就是只有0、1两个值。值为1表示图像这部分我们想要保留，值为0表示这部分我们需要补全。现在我们可以定义，在给定了二值掩码M之后如何对y进行补全。将y中的元素和M中的元素相乘。两个矩阵对应位置元素相乘也叫做 Hadamard 积，用 M⊙y 表示图像的原始部分。

二值掩码图例

接下来，假设我们已经找到了一个 z^ 可以加到原始像素上，得到重构的图像：

x r e c o n s t r u c t e d = M ⊙ y + (1 - M) ⊙ G (z^)

x_{reconstructed} = M \odot y + (1 - M) \odot G(\hat z)

现在我们要做的事情，就是找到一个适于补全图像的 G(z^) 越合适。

语境损失：为了得到和输入图像相同的上下文，需要确保y已知像素对应位置的G(z)尽可能相似。所以，当 G(z) 的输出和 y 已知位置图像不相似的时候，需要对 G(z) 进行惩罚。为此，我们用 G(z) 减去 y 中对应位置的像素，然后得到它们不相似的程度:

L c o n t e x t u a l (z) = | | M ⊙ G (z) - M ⊙ y | |

\mathcal{L}_{contextual}(z) = || M \odot G(z) - M \odot y ||
其中

||x||1=∑i|xi| 范数效果更好。

理想情况下，已知部分的 y 和 G(z) 的像素是相等的。也就是对于已知位置的像素i, ||M⊙G(z)i−M⊙yi||=0 。

感知损失：为了重建一个看起来真实的图像，需要确保判别器判定图像看起来是真实的。为此，我们进行和训练 DCGAN 中相同的步骤。

L p e r c e p t u a l (z) = l o g (1 - D (G (z)))

\mathcal{L}_{perceptual}(z) = log(1- D(G(z)))

最后，将语境损失和感知损失组合起来，就可以找到 z^ 了;

L (z) = L c o n t e x t u a l (z) + λ L p e r c e p t u a l (z) z^= arg min z L (z)

\mathcal{L}(z) = \mathcal{L}_{contextual}(z) + \lambda\mathcal{L}_{perceptual}(z)\\ \hat z = \arg \min_z \mathcal{L}(z)

其中 λ，并没有对这个值进行深入研究。）然后如前所述，使用 G(z) 来重建y中缺失的部分。

L c o n t e x t u a l (z) = | | M ⊙ G (z) - M ⊙ y | |

\mathcal{L}_{contextual}(z) = || M \odot G(z) - M \odot y ||
图像也使用了 poisson blending 来使图像变得平滑。

[ML-Heavy] 使用tensorflow来进行DCGAN图像补全

这一章给出了我对于 Taehoon Kim 的 carpedm20/DCGAN-tensorflow 代码的修改，用于图像补全。

self.mask = tf.placeholder(tf.float32, [None] + self.image_shape, name='mask')

   
     
     
     
     
      
      
      
      1
      
      
      
      2

我们通过对梯度∇zL(z) 。我们定义了损失函数之后，Tensorflow 的 automatic differentiation 可以自动地为我们计算出这个值！所以，完整的基于DCGANs的实现可以通过在现有的DCGAN实现上添加4行Tensorflow代码来完成。（当然，实现它还需要一些非 Tensorflow 代码。）

self.contextual_loss = tf.reduce_sum(
tf.contrib.layers.flatten(
    tf.abs(tf.mul(self.mask, self.G) - tf.mul(self.mask, self.images))), 1)
self.perceptual_loss = self.g_loss
self.complete_loss = self.contextual_loss + self.lam*self.perceptual_loss
self.grad_complete_loss = tf.gradients(self.complete_loss, self.z)

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7

接下来，我们定义掩码。我只是在图像的中央区域加了一个，你可以加一些别的，比如随机掩码，然后发一个pull请求。

if config.maskType == 'center':
    scale = 0.25
    assert(scale <= 0.5)
    mask = np.ones(self.image_shape)
    l = int(self.image_size*scale)
    u = int(self.image_size*(1.0-scale))
    mask[l:u, l:u, :] = 0.0

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8

梯度下降方面，我们对于z在[-1, 1]上的投影，使用小批量、含动量的投影梯度下降。

for idx in xrange(0, batch_idxs):
    batch_images = ...
    batch_mask = np.resize(mask, [self.batch_size] + self.image_shape)
    zhats = np.random.uniform(-1, 1, size=(self.batch_size, self.z_dim))

    v = 0
    for i in xrange(config.nIter):
        fd = {
            self.z: zhats,
            self.mask: batch_mask,
            self.images: batch_images,
        }
        run = [self.complete_loss, self.grad_complete_loss, self.G]
        loss, g, G_imgs = self.sess.run(run, feed_dict=fd)

        v_prev = np.copy(v)
        v = config.momentum*v - config.lr*g[0]
        zhats += -config.momentum * v_prev + (1+config.momentum)*v
        zhats = np.clip(zhats, -1, 1)

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8
      
      
      
      9
      
      
      
      10
      
      
      
      11
      
      
      
      12
      
      
      
      13
      
      
      
      14
      
      
      
      15
      
      
      
      16
      
      
      
      17
      
      
      
      18
      
      
      
      19
      
      
      
      20

补全图像

选择一些用于图像补全的图片，将它们放到 dcgan-completion.tensorflow/your-test-data/raw 。然后像之前 dcgan-completion.tensorflow/your-test-data/aligned 那样排列整齐。这里我从LFW中随机抽出一些图像。我的DCGAN没有使用LFW的图像来训练。

你可以这样补全图像：

./complete.py ./data/your-test-data/aligned/* --outDir outputImages

   
     
     
     
     
      
      
      
      1
      
      
      
      2

这段代码会生成图像，并周期性地将图像输出在 —outDir 文件夹中。你可以使用ImageMagick来生成一个gif：

cd outputImages
convert -delay 10 -loop 0 completed/*.png completion.gif

   
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3

最后的图像补全。图像的中心是自动生成的。源代码从此处下载。这是我随机从 LFW 中挑出的样本。

结论

感谢阅读，现在我们成功了！在文章中，我们涉及了图像补全的一种方法：

1、将图像理解为概率的分布。
2、生成伪图像。
3、找到用于补全最好的伪图像。

我的例子是人脸，但是DCGANs也可以在其他类型的图像上使用。总体而言，GANs 训练比较困难，我们尚不清楚如何在一个特定种类的物体上进行训练，也不清楚如何在大图像上训练。然而，这是一个很有潜力的模型，我很期待GAN将为我们创造什么样的未来！

你可能感兴趣的:(计算机视觉与深度学习,计算机视觉,深度学习)

JavaScript 性能优化实战：优化循环结构提升效率 deying0865423 javascript 开发语言
目录一、理解循环的性能损耗二、减少循环迭代次数（一）缓存数组长度（二）提前终止循环三、优化循环内部操作（一）避免在循环内执行复杂计算（二）减少DOM操作四、选择合适的循环类型（一）for循环与while循环的选择（二）for...in与for...of的使用场景在JavaScript编程中，循环结构是实现重复执行任务的基础工具。然而，不当的循环使用常常会导致性能瓶颈，特别是在处理大量数据时，循环的
SAP-ABAP：ABAP内存使用详细说明爱喝水的鱼丶 ABAP开发之必须知道的 VIP详情查看专栏 SAP-ABAP开发基础详解 SAP 运维 ABAP 开发语言 ERP
在SAPABAP中，ABAP内存（ABAPMemory）是一种临时存储机制，用于在同一内部会话（InternalSession）中共享数据。ABAP内存的数据生命周期与当前程序及其调用的子程序相关，程序结束后数据会自动清除。以下是关于ABAP内存的详细说明：—##1.ABAP内存的特点-作用范围:仅在当前内部会话中有效。-生命周期:数据在当前程序及其调用的子程序中有效，程序结束后数据丢失。-共享范
2025年入职/转行网络安全，该如何规划？网络安全职业规划教网络安全的毛老师 web安全安全网络运维云计算
网络安全是一个日益增长的行业，对于打算进入或转行进入该领域的人来说，制定一个清晰且系统的职业规划非常重要。2025年，网络安全领域将继续发展并面临新的挑战，包括不断变化的技术、法规要求以及日益复杂的威胁环境。以下是一个关于网络安全职业规划的详细指南，涵盖了从入门到高级岗位的成长路径、技能要求、资源获取等方面的内容。第一部分：网络安全行业概述1.1网络安全的现状与未来网络安全已经成为全球企业和政府的
2025年入职/转行网络安全，该如何规划？网络安全职业规划教网络安全的毛老师 web安全安全网络安全渗透测试漏洞挖掘
网络安全是一个日益增长的行业，对于打算进入或转行进入该领域的人来说，制定一个清晰且系统的职业规划非常重要。2025年，网络安全领域将继续发展并面临新的挑战，包括不断变化的技术、法规要求以及日益复杂的威胁环境。以下是一个关于网络安全职业规划的详细指南，涵盖了从入门到高级岗位的成长路径、技能要求、资源获取等方面的内容。第一部分：网络安全行业概述1.1网络安全的现状与未来网络安全已经成为全球企业和政府的
网络空间安全专业发展历程及开设院校菜根Sec 安全网络安全网络安全高校网络空间安全信息安全
一、专业发展历程1.早期探索阶段（1990年代末—2000年代初）（1）背景：1990年代互联网进入中国，计算机病毒、黑客攻击等问题逐渐显现，社会对信息安全人才的需求开始萌芽。（2）高校尝试：1997年，西安电子科技大学在密码学领域积累深厚，率先开设与信息安全相关的选修课程和研究方向。1998年，武汉大学依托其计算机学院和数学学科优势，开始探索信息安全方向的本科教育。2.正式设立本科专业（2001
开发者必看！添加 RTT 功能的详细指南 WPG大大通 NXP产线大大通 RTT 调试工程笔记经验分享
SEGGERRTT（Real-TimeTransfer）是一种高效的实时调试技术，通过J-Link调试器实现主机与目标设备间的双向通信。相比传统调试手段（如串口），RTT无需额外硬件引脚，且传输速度更快，特别适合资源受限的嵌入式场景。本文以NXPKW38芯片为例，详细介绍如何将SEGGERRTT功能集成到SDK工程中，助力开发者快速捕获调试信息。一、准备工作1.安装J-Link软件包确保已安装SE
嵌入式Linux驱动开发：从基础知识到实践精通坚持坚持那些年
本文还有配套的精品资源，点击获取简介：嵌入式Linux由于其稳定性、可定制性和丰富资源，在智能设备领域得到广泛应用。掌握嵌入式Linux驱动程序设计对于开发者至关重要。本课程从基础知识点出发，详细介绍了内核接口理解、设备树编程、I/O操作、字符与块设备驱动、网络驱动、电源管理、调试技巧、硬件抽象层、设备模型和模块化编程等关键技能，并通过实际操作实践来强化学习，帮助开发者成长为嵌入式Linux驱动开
PyTorch核心基础知识点 niuTaylor 编程区 pytorch 人工智能 python
PyTorch核心基础知识点，结合最新特性与工业级实践，按优先级和逻辑关系分层解析：▍核心基石：张量编程（TensorProgramming）1.张量创建（8种生产级初始化）#设备自动选择（2024最佳实践）device="cuda"iftorch.cuda.is_available()else"mps"iftorch.backends.mps.is_available()else"cpu"#关键
C语言的scanf函数海风有点咸 scanf函数 c语言
scanf函数简介scanf是ScanFormat的缩写，意思是格式化扫描，也就是从键盘获得用户输入。scanf函数称为格式输入函数，即按用户指定的格式从键盘上把数据输入到指定的变量之中。scanf()是C语言中的一个输入函数。与printf函数一样，都被声明在头文件stdio.h里，因此在使用scanf函数时要加上#include。（在有一些实现中，printf函数与scanf函数在使用时可以不
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
使用 NetworkX 进行图论分析与可视化 aiweker 跟我学python 图论 python
使用NetworkX进行图论分析与可视化NetworkX是一个用于创建、操作和研究复杂网络的Python库。它提供了丰富的图论算法和数据结构，适用于各种网络分析任务。本文将分点介绍NetworkX的主要功能，并通过代码示例进行详细说明。1.安装NetworkX在开始使用NetworkX之前，首先需要安装它。可以通过pip进行安装：pipinstallnetworkx2.创建图NetworkX支持多
2025最新植物大战僵尸杂交版3.4.5版本 ‌烟雨任平生游戏游戏程序游戏 php 算法数据结构 html5 javascript
更新内容植物大战僵尸杂交版v3.4.5版本的更新内容如下：新增了3档花园养成奖励与商店副本关卡，以及修复了3.4版本的已知BUG与平衡性调整下载链接点击下载
OpenStack阶梯计价实战：Hashmap模块从入门到精准计费冯·诺依曼的 openstack 云计算 linux
目录Hashmap模块概述核心概念解析配置步骤详解应用场景分析注意事项与扩展1.Hashmap模块概述OpenStack的Rating模块负责资源使用量的计费统计，而Hashmap是其核心组件，用于定义灵活的计价规则。通过Hashmap，管理员可以：根据资源类型（如CPU、存储、网络）设置差异化单价实现阶梯计价（如使用量超过阈值后单价打折）将资源与服务、服务组绑定，支持复杂计费策略2.核心概念解析
使用 UV 管理 Python 项目 | python小知识 aiweker 跟我学python uv python 人工智能
使用UV管理Python项目|python小知识1.引言在Python开发中，项目管理工具是必不可少的。常见的工具如pip、pipenv、poetry等，它们各有优缺点。近年来，uv作为一个新兴的Python项目管理工具，逐渐受到开发者的关注。uv旨在提供更快的依赖解析和安装速度，同时保持与现有工具的兼容性。本文将详细介绍uv的功能和应用场景，并通过代码示例展示其使用方法。最后，我们将对比uv与其
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
python Qt Solkatt's
最近帮朋友做了一个将文本文件按条件导出到excel里面的小程序。使用了PyQT，发现Python真是一门强大的脚本语言，开发效率极高。首先需要引用fromPyQt4importQtGui,uic,QtCore很多控件像QPushButton是从QtGui的空间中得来的，下面def__init__(self,parent=None)中定义了界面的设计及与控件相互联系的方法。classAddressB
Rust + 时序数据库 TDengine：打造高性能时序数据处理利器涛思数据（TDengine）时序数据库 rust tdengine
引言：为什么选择TDengine与Rust？TDengine是一款专为物联网、车联网、工业互联网等时序数据场景优化设计的开源时序数据库，支持高并发写入、高效查询及流式计算，通过“一个数据采集点一张表”与“超级表”的概念显著提升性能。Rust作为一门系统级编程语言，近年来在数据库、嵌入式系统、分布式服务等领域迅速崛起，以其内存安全、高性能著称，与TDengine的高效特性天然契合，适合构建高可靠、高
MATLAB数据的保存与读取晚风微凉～ java 前端 javascript
在工程应用中，我们经常需要将未处理完的数据保存起来以便后期使用，或者在一些复杂计算中，我们需要多次计算过程中，由于系统的工作空间会随着系统的关闭而被释放掉，导致下次使用时无法快速调用，所有需要对数据进行保存与读取。1.核心代码1）数据保存基于MATALB的储存数据的常用命令是"save",使用save会将数据以二进制的方式存储在后缀名）为"文件名字.mat";savedemo01使用该命令会将数据
TCP三次握手与四次挥手（全网最易懂保姆级教程）秋‍. JAVA 网络服务器运维 java tcp/ip 三次握手
一、前置知识准备1.TCP协议特性-面向连接：通信前需要建立专用通道-可靠传输：通过确认机制保证数据可达-全双工通信：双方可同时发送数据-流量控制：滑动窗口机制-拥塞控制：慢启动算法2.关键概念说明|术语|说明||------------|----------------------------------------------------------------------||**SYN**|
基于 STC89C52 的 8x8 点阵显示数字 @小张要努力单片机嵌入式硬件 stm32 51单片机 proteus
一、引言在电子设计领域，信息的有效展示是众多项目的关键环节。8x8点阵作为一种经济且实用的显示模块，能够呈现数字、简单字母及图形等信息，在电子时钟、简易游戏机等产品中广泛应用。STC89C52单片机凭借其低成本、丰富的I/O资源与稳定的性能，成为驱动8x8点阵的理想选择。本文将深入探讨如何利用STC89C52单片机结合74LS245芯片，实现8x8点阵的数字显示功能，并借助Proteus软件进行仿
回归任务中的评价指标MAE，MSE，RMSE，R-Squared 旺旺棒棒冰统计学习方法机器学习回归评价指标 r2 mse
转自博客。仅供自己学习使用，如有侵权，请联系删除分类任务的评价指标有准确率，P值，R值，F1值，而回归任务的评价指标就是MSE，RMSE，MAE、R-SquaredMSE均方误差MSE是真实值与预测值的差值的平方和然后求平均。通过平方的形式便于求导，所以常被用作线性回归的损失函数。MSE=1m∑i=1m(yi−y^i)2MSE=\frac{1}{m}\sum_{i=1}^{m}\left(y_{i
第十八章：模板的多态力量_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
模板的多态力量一、动态多态vs静态多态二、奇异递归模板模式（CRTP）三、策略模式（编译期策略选择）关键要点总结第一部分：多选题(10题)第二部分：设计题(5题)答案与详解多选题答案：设计题参考答案1.编译期策略选择器2.类型安全访问者模式3.概念约束数学库4.编译期工厂模式5.静态多态容器测试说明一、动态多态vs静态多态核心概念：动态多态：基于虚函数和继承体系，函数调用在运行时决定（通过虚函数表
实时光线追踪技术：Ray Tracing_2024-07-21_02-55-16.Tex chenjj4003 游戏开发 python 算法人工智能矩阵线性代数骨骼绑定开发语言
实时光线追踪技术：RayTracing实时光线追踪技术教程基础知识光线追踪原理光线追踪是一种渲染技术，它通过模拟光线在场景中的传播和反射来生成图像。在实时光线追踪中，这一过程被优化以在有限的时间内完成，通常用于游戏和实时动画。其核心原理是逆向追踪，即从观察者（摄像机）发出光线，而不是从光源发出，这样可以减少计算量。示例：光线追踪的基本算法#Python示例代码，展示如何计算光线与场景中物体的交点c
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
【005安卓开发方案调研】之Flutter+Dart技术开发安卓 ThinkPet 移动app开发 android flutter dart 跨平台
基于2025年国内移动开发环境现状，结合多份行业分析报告和技术文档，对Flutter+Dart开发安卓应用的技术成熟度和生态适配性分析如下：一、技术成熟度评估1.跨平台能力达到生产级标准Flutter的Skia自渲染引擎和Dart的AOT/JIT双编译模式，实现了90%以上的原生性能表现，在电商、社交、工具类应用中已无明显性能瓶颈。实测数据显示，列表滚动帧率稳定在55-60FPS，与原生开发差距小
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
计算机基础：编码01，无符号数编码水饺编程 MFC学习笔记 Win32学习笔记 mfc c++visual studio windows
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编码，原码（二）MFC专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编
CPP编译与链接过程阿斯顿的风格 c++开发语言 ubuntu linux bash 编译汇编
1.概述在C++中，从源代码（.cpp文件）到最终可执行程序，需要经历以下四个主要阶段：预处理（Preprocessing）编译（Compilation）汇编（Assembly）链接（Linking）2.预处理预处理阶段是编译流程的第一步，主要处理以#开头的指令，包括宏定义、文件包含以及条件编译等。2.1文件包含（#include）工作原理：当预处理器遇到#include指令时，会在文件系统中查找
【Python Qt 基本概念】深入探讨 PySide6 与 PyQt6：选择、共存与最佳实践泡沫o0 Qt应用开发 -探索Qt的魅力与实践 Python 基础教程 mfc c++qt 开发语言 python 嵌入式 linux
目录标题第一章:Python绑定的Qt库——PySide6与PyQt6的比较1.1PySide6与PyQt6的基本介绍1.1.1PySide6：Qt官方推荐的Python绑定1.1.2PyQt6：成熟的第三方Python绑定1.1.3主要差异：许可证1.2两者的相似性与差异性1.2.1功能和性能差异1.2.2API差异与兼容性1.3总结：选择的自由与责任第二章:在VSCode中使用PySide6与
第十七章:Future Directions_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
FutureDirections核心重难点：示例代码：设计题多选题答案设计题详解核心重难点：泛型非类型模板参数允许任意类型作为非类型模板参数（如template）需解决类型推导和链接问题编译期控制流constexprif替代模板偏特化（减少代码膨胀）折叠表达式优化可变参数模板处理反射与元编程增强类型检查（is_convertible_v等）反射提案（如成员变量/函数查询）模块化支持解决传统头文件包
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc