Feynman1999

InfoGAN论文理解及复现

by AHU Random_Walker

主要从四个方面来了解相关工作，即

Motivation
Related Work-Method
Experiments
Conclusion

然后有三个过程来复现代码，最后的疑问算是对整个框架和代码细节问题的汇总吧

框架
代码实现与结果
总结与疑问

参考的资料

https://arxiv.org/abs/1606.03657

https://study.163.com/course/courseMain.htm?courseId=1005703030

Motivation

InfoGAN全称是Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets，是NIPS2016的工作。

infoGAN的动机是什么呢？就是原始Gan没有对生成器如何使用噪声做出约束，训练出来的生成器，对于 $z$ 的每一个维度不能够很好的对应到相关的语义特征。而infoGAN可以找到这种语义特征。

先来直观感受一下：

可以看到通过调节参数 $c$ ，生成的数字可以分类、旋转、调整宽度。相当于是说通过了无监督的形式，学习到了参数和特征的分布关系。

其方法是通过加入一个（多个）新的变量 $c$ ，使得 $c$ 与生成的样本有较高的互信息。

这样 $c$ 就可以用于表示数据某个方面的语义信息，而 $z$ 用于表示样本 $x$ 中与 $c$ 无关的其它信息。

宏观上看，最后 $i n f o G A N$ 可以看成三个网络的组成：

生成网络 $x = G (z, c)$
判别真伪的网络 $y_1=D_1(x)$
判别类别 $c$ 的网络 $y_2=D_2(x)$

需要注意的是， $D_1$ 和 $D_2$ 共享网络的参数（除了最后一层外），所以和原始的GAN相比，infoGAN的时间复杂度是相同量级的，具体后面会说到。

$c$ 一般分为categorical latent code（分类潜码）和continuous latent code（连续潜码），取决于最后是要分类还是连续的特征参数。当 $c$ 用于代表类别信息的时候，网络最后一层是 $s o f t m a x$ 层。

Related Work-Method

由于笔者目前知识水平有限，论文中提到的一些早期（2016年之前）的模型和方法就不介绍了。主要介绍这篇论文的工作，当然是基于14年Goodfellow et al.原始GAN的工作之上了。

首先是mutual information 的概念。

互信息 mutual information

我们定义 $H(x)=\sum-P(x)logP(x)=E[-logP(x)]$

而互信息 $I (X; Y)$ 可以用于衡量随机变量 $X$ 中包含随机变量 $Y$ 的信息量
$I (X; Y) = H (X) - H (X ∣ Y) = H (Y) - H (Y ∣ X) = I (Y; X)$

$I (X; Y)$ 值越大，则 $X$ 中包含 $Y$ 的信息就越多。如果 $X, Y$ 相互独立，那么 $I (X, Y) = 0$ ，反之如果 $X$ 和 $Y$ 相关性较大，则 $， I (X ， Y)$ 也较大。

这个过程也可以理解为，当 $Y$ 有了观测值后， $X$ 的不确定性越低，则 $I (X; Y)$ 值越大。

本文提出把输入噪声向量分成两部分：

z，即原始的噪声，不可压缩的噪声。
c，文中称为latent code ,对应语义向量，可以有多个 $c_1,c_2,...$ ，这些变量相互独立，则 $p(c_1,c_2,...c_L)=\prod_{i=1}^{L}p(c_i)$ 。为了方便，下文统一用 $c$ 表示。

现在，我们打算以一种无监督学习的方式，发现这些latent code如何影响生成的图片，以达到我们想要的上面的效果。

我们把 $z$ 和 $c$ 都提供给生成器 $G$ ，记为 $G (z, c)$ 。然而，在标准的GAN中，直接将z,c在一起训练的话，生成器将忽略潜变量 $c$ 的作用，即 $P_G(x|c)=P_G(x)$ ，表明变量 $c$ 和 $x$ 相互独立。为了使 $x$ 受 $c$ 的指定影响，文献提出信息正则化约束项：潜变量 $c$ 与生成样本 $G (z, c)$ 的互信息量应该较大，即 $I (c; G (z, c))$ 应该较大。

为此，在原始Gan损失函数V(D,G)的基础上，加入正则约束 $I (c; G (z, c))$ ，现在的博弈变成这个样子：

Variational Mutual Information Maximization

如何最大化上式中的互信息呢？

实际上， $I (c; G (z, c))$ 很难直接最大化，因为他需要获得后验概率项 $P (c ∣ x)$ （为什么是这个，后面化简可以看出）

幸运的是，我们可以通过一个辅助分布 $Q (c ∣ x)$ ，获得一个 $P (c ∣ x)$ 的下界，从而得到 $P (c ∣ x)$ 的近似解：

怎么理解上面的式子呢？

$x$ 是 $G (z, c)$ 的观测值，而记 $c^{'}$ 是一个后验概率的观测值，即 $c'\sim P(c|x)$

由于 $H(x)=\sum-P(x)logP(x)=E[-logP(x)]$ ，

则 $-H(c|G(z,c))=-E[-logP(c|G(z,c))]=E_{x\sim G(z,c)}[E_{c'\sim P(c|x)}[logP(c'|x)]]$ 注意负号消去了

然后我们从 $E_{c'\sim P(c|x)}[logP(c'|x)]$ 中分解出一项“误差项”

即 $E_{c'\sim P(c|x)}[logP(c'|x)]=D_{KL}(P(\cdot|x) \ ||\ Q(\cdot|x)))+E_{c'\sim P(c|x)}[logQ(c'|x)]$

而 $D_{KL}(P(\cdot|x) \ ||\ Q(\cdot|x))) \ge 0$

因此，下界就是

这种操作应该也是比较经典的方法，也不是infogan的作者提出的，This technique of lower bounding mutual information is known as Variational Information Maximization [26].

然后，潜码的 $H (c)$ 也可以被优化，因为它具有常见分布的简单解析形式。而在这篇文章中，作者将为了简化，将 $H (c)$ 视为常数处理。（想一想为什么可以当做常数？）

到现在为止，我们解决了 $I (c; G (z, c))$ 显式计算的问题（通过找到问题的下界），但是我们还需要从后验样本中取样计算，（因为要计算多个 $c^{'}$ ），可不可以简化这个过程呢？

然后作者使用了一个引理，从而不需要上述计算。

有了这个lemma,我们对之前的下界得到一个变分公式 $L_1$ ：

这个式子用Lemma很好证明（替换一下即可）。而关于lemma本身的证明referred to论文的Appendix 1。

然后你发现 $c^{'}$ 没了。。这应该是本文的关键点之一

注意到， $L_1(G,Q)$ 很容易用蒙特卡洛方法近似估计（对 $c$ 和 $x$ 进行采样即可），具体来说，对于 $Q$ ，可以直接将 $L_1$ 最大化，而对于 $G$ ，可以使用reparametrization trick（重参数化技巧）来最大化。reparametrization trick经常用于蒙特卡洛估计中，具体可以参见http://blog.shakirm.com/2015/10/machine-learning-trick-of-the-day-4-reparameterisation-tricks/。

此外，当 $c$ 是离散值时，如果 $L_1(G,Q)=H(c)$ ，那么这个下界取到了最大值。（想一想为什么，连续值呢？）

在附录中，论文作者还指出了infoGAN与Wake-Sleep algorithm[27]的关联，其也提供了另外一种解释。

因此，最终InfoGAN被定义为如下的极大极小博弈：（变分互信息正则化，翻译比较僵硬…）

简单理解就是，生成器 $G$ 和判断类别网络 $Q$ 目标是使后面的式子尽量小，一方面是 $G$ 考虑到“欺骗”D使 $V$ 尽量小，另一方面是 $G, Q$ 要把 $L_1$ 搞大，这样 $c$ 和生成的数据相关性就大，加上负号后，整个式子就小。

而 $D$ 就要使后面大了。这一点和原始 $G A N$ 一样。

Experiments

在实践中，作者将辅助分布 $Q$ 作为神经网络训练来参数化。在多数实验中， $Q$ 和 $D$ 共享前面所有的卷积层，对于 $Q$ ，最后通过一层全连接层输出参数（在下面复现中，采用了两层全连接）。而且作者提到，L(G; Q) converge的速率比原始GAN的网络要快，所以时间并没有增加多少（一个量级的）。

对于离散分类编码 $c$ ，使用常见的softmax nonlinearity来表示 $Q(c_i|x)$ ，在下面的代码实现中采用的是交叉熵方法来计算 $l o s s$ ；

对于连续特征编码 $c$ ，作者说简单把 $Q(c_j|x)$ 看做高斯因素就行，在下面的代码实现中采用的是MSE方法，将高斯分布拉近，从而降低 $l o s s$

另外作者说 $G A N$ 相对来说比较难以训练，所以他们使用了 $D C - G A N$ 中的一些techniques，然后他们也没有什么新的训练trick。

最后关于那个式子中的超参数 $\lambda$ ，对于离散潜编码c简单的设置为1即可，而对于连续码，应该确保 $\lambda L_1(G,Q)$ 和 $G A N$ 的那些objectives在同一量级上。在后面代码实现中，都视作为1了，之后可以对连续尝试不同的数值。

关于Batch normalization

1.在实现中，D的第一层、G的最后一层分别通过卷积、反卷积时不进行batch normalization，因为会造成样本震荡和模型的不稳定。

2.Batch normalization的计算公式是 $y=\frac{\gamma(x-\mu)}{\sigma }+\beta$ ， $y$ 是输出， $\mu$ 是均值， $\sigma$ 是方差， $和\gamma和\beta$ 是缩放、偏移系数。 $\mu$ 和 $\sigma$ 在训练时使用的是一个batch数据的统计值，但是测试时，采用的是训练时计算出的滑动平均值。

3.在训练时注意将training设置为True，而在测试是设为False，并reuse设为True

优化时，添加以下代码进行 $\mu$ 和 $\sigma$ 的滑动平均值的更新操作：

框架

代码实现与结果

环境

win10
python 3.6
TensorFlow 1.10 (截至8.30.2018最新版本)
CUDA 9.0 cudnn7.1

代码

共有四个文件

main.py
infoGAN.py
ops.py #Most codes from https://github.com/carpedm20/DCGAN-tensorflow
utils.py #Most codes from https://github.com/carpedm20/DCGAN-tensorflow

其中，只有infoGAN是具体的关于本文的实现，main.py配置一些用户参数，ops.py和utils.py是一些文件路径管理、图片操作和优化方法。

main.py

from infoGAN import infoGAN
from utils import show_all_variables
from utils import check_folder
import tensorflow as tf
import argparse
import os


def parse_args():
    desc = "Tensorflow implementation of GAN collections"
    parser = argparse.ArgumentParser(description=desc)

    parser.add_argument('--gan_type', type=str, default='infoGAN',
                        choices=['infoGAN'],
                        help='The type of GAN', required=False)

    parser.add_argument('--dataset', type=str, default='mnist',
                        choices=['mnist', 'fashion-mnist', 'celebA'],
                        help='The name of dataset')

    parser.add_argument('--epoch', type=int, default=7,
                        help='The number of epochs to run')

    parser.add_argument('--batch_size', type=int, default=64,
                        help='The size of each batch')

    parser.add_argument('--z_dim', type=int, default=62,
                        help='Dimension of noise vector')

    parser.add_argument('--checkpoint_dir', type=str, default='checkpoint',
                        help='The directory name to save the checkpoints')

    parser.add_argument('--result_dir', type=str, default='results',
                        help='The directory name to save the generated images')

    parser.add_argument('--log_dir', type=str, default='logs',
                        help='The directory name to save training logs')

    return check_args(parser.parse_args())


# checking arguments
def check_args(args):
    # --checkpoint_dir
    check_folder(args.checkpoint_dir)

    # --result_dir
    check_folder(args.result_dir)

    # --log_dir
    check_folder(args.log_dir)

    # --epoch
    assert args.epoch >= 1, 'number of epochs must be larger than or equal to one'

    # --batch_size
    assert args.batch_size >= 1, 'batch size must be larger than or equal to one'

    # --z_dim
    assert args.z_dim >= 1, 'dimension of noise vector must be larger than or equal to one'

    return args


def main():
    args = parse_args()
    if args is None:
        print("args is None")
        exit()

    # open session
    models = [infoGAN]  # 导入infoGAN中的对象
    # GPU settings
    os.environ["CUDA_VISIBLE_DEVICES"] = '0'
    gpu_options = tf.GPUOptions(allow_growth=True)
    with tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) as sess:
        # declare instance for GAN

        gan = None
        for model in models:
            if args.gan_type == model.model_name:
                gan = model(sess,
                            epoch=args.epoch,
                            batch_size=args.batch_size,
                            z_dim=args.z_dim,
                            dataset_name=args.dataset,
                            checkpoint_dir=args.checkpoint_dir,
                            result_dir=args.result_dir,
                            log_dir=args.log_dir,
                            SUPERVISED=True,
                            reload=False)
                break

        if gan is None:
            raise Exception("[!] There is no option for " + args.gan_type)

        # build graph
        gan.build_model()

        # show network architecture
        show_all_variables()

        # launch the graph in a session
        gan.train()
        print(" [*] Training finished!")

        # visualize learned generator
        gan.visualize_results(args.epoch-1)
        print(" [*] Testing finished!")


if __name__ == '__main__':
    main()

infoGAN.py

#-*- coding: utf-8 -*-
from __future__ import division
import os
import time
import tensorflow as tf
import numpy as np
from ops import *
from utils import *


class infoGAN(object):
    model_name = "infoGAN"

    def __init__(self, sess, epoch, batch_size, z_dim, dataset_name, checkpoint_dir,
                 result_dir, log_dir, SUPERVISED=True, reload=True):
        self.sess = sess
        self.dataset_name = dataset_name
        self.checkpoint_dir = checkpoint_dir
        self.result_dir = result_dir
        self.log_fir = log_dir
        self.epoch = epoch
        self.batch_size = batch_size
        self.reload = reload

        if dataset_name == 'mnist' or dataset_name == 'fashion-mnist':
            # parameters
            self.input_height = 28
            self.input_width = 28
            self.output_height = 28
            self.output_width = 28

            self.z_dim = z_dim  # demension of noise-vector
            self.y_dim = 12  # dimension of code-vector (label+ two features)
            self.c_dim = 1  # channel

            # code
            self.len_discrete_code = 10  # categorical distribution (i.e. label)
            self.len_continuous_code = 2  # gaussian distribution (e.g. rotation, thickness)

            self.SUPERVISED = SUPERVISED  # if it is true, label info is directly used for code

            # train para
            self.learning_rate = 0.0002
            self.beta1 = 0.5

            # test
            self.sample_num = 64  # number of generated images to be saved(one time)

            # load mnist
            self.data_X, self.data_y = load_mnist(self.dataset_name)

            # get number of batches for a single epoch
            self.num_batches = len(self.data_X) // self.batch_size
        else:
            print("sure mnist?")
            raise NotImplementedError


    def generator(self, z ,y, is_training=True, reuse=False):
        # [batch_size, z_dim+y_dim] > [batch_size, 1024] > [batch_size, 128*7*7] >
        # [batch_size, 7, 7, 128] > [batch_size, 14, 14, 64] > [batch_size, 28, 28, 1]
        with tf.variable_scope("generator", reuse=reuse):

            # merge noise and code  1是axis 表明是列
            z = concat([z, y], 1)

            # 注意batch_norm操作
            net = tf.nn.relu(bn(linear(z, 1024, scope='g_fc1'), is_training=is_training, scope='g_bn1'))
            # 再做一次全连接，为后面反卷积做准备
            net = tf.nn.relu(bn(linear(net, 128*7*7, scope='g_fc2'), is_training=is_training, scope='g_bn2'))
            net = tf.reshape(net, [self.batch_size, 7, 7, 128])
            net = tf.nn.relu(
                bn(deconv2d(net, [self.batch_size, 14, 14, 64], 4, 4, 2, 2, name='g_dc3'), is_training=is_training,
                   scope='g_bn3')
            )

            # 注意out层不用bn
            out = tf.nn.sigmoid(deconv2d(net, [self.batch_size, 28, 28, 1], 4, 4, 2, 2, name='g_dc4'))

            return out


    def discriminator(self, x, is_training=True, reuse=False):
        with tf.variable_scope("discriminator", reuse=reuse):
            # 对图片做卷积 和G的反卷积完全相反的过程
            net = lrelu(conv2d(x, 64, 4, 4, 2, 2, name='d_conv1'))
            net = lrelu(bn(conv2d(net, 128, 4, 4, 2, 2, name='d_conv2'), is_training=is_training, scope='d_bn2'))
            net = tf.reshape(net, [self.batch_size, -1])  # 注意-1简化了细节
            net = lrelu(bn(linear(net, 1024, scope='d_fc3'), is_training=is_training, scope='d_bn3'))
            out_logit = linear(net, 1, scope='d_fc4')  # 直接做成1
            out = tf.nn.sigmoid(out_logit)

            return out, out_logit, net  # 这里返回net是为了classifier


    def classifier(self, x, is_training=True, reuse=False):
        # >[batch_size, 64] > [batch_size, y_dim]
        # All layers except the last two layers are shared by discriminator
        with tf.variable_scope("classifier", reuse):
            net = lrelu(bn(linear(x, 64, scope='c_fc1'), is_training=is_training, scope='c_bn1'))
            out_logit = linear(net, self.y_dim, scope='c_fc2')
            out = tf.nn.softmax(out_logit)  # 对连续标签取softmax不会出问题吗？

            return out, out_logit


    def build_model(self):
        # some parameters
        image_dims = [self.input_height, self.input_width, self.c_dim]
        bs = self.batch_size

        """ Graph Input """
        # images
        self.inputs = tf.placeholder(tf.float32, [bs]+image_dims, name='real_images')

        # labels
        self.y = tf.placeholder(tf.float32, [bs, self.y_dim], name='y')

        # noises
        self.z = tf.placeholder(tf.float32, [bs, self.z_dim], name='z')


        """ Loss Function"""
        # output of D for real images
        D_real, D_real_logits, _ = self.discriminator(self.inputs, is_training=True,
                                                      reuse=False)

        # output of D for fake images
        G = self.generator(self.z, self.y, is_training=True, reuse=False)
        D_fake, D_fake_logits, input4classifier_fake = self.discriminator(G, is_training=True,
                                                                          reuse=True)
        # get loss for discriminator (交叉熵)" -[log(D(x)) - log(1-D(G(z,y)))] "
        d_loss_real = tf.reduce_mean(
            tf.nn.sigmoid_cross_entropy_with_logits(logits=D_real_logits, labels=tf.ones_like(D_real))
        )
        d_loss_fake = tf.reduce_mean(
            tf.nn.sigmoid_cross_entropy_with_logits(logits=D_fake_logits, labels=tf.zeros_like(D_fake))
        )

        self.d_loss = d_loss_real + d_loss_fake

        # get loss for generator(交叉熵)  " -log(D(G(z,y))) "
        self.g_loss = tf.reduce_mean(
            tf.nn.sigmoid_cross_entropy_with_logits(logits=D_fake_logits, labels=tf.ones_like(D_fake))
        )

        # Information Loss   "  ~(),~(,)[(|)] + () "
        code_fake, code_logit_fake = self.classifier(input4classifier_fake, is_training=True,
                                                     reuse=False)

        # discrete code : catogorical   交叉熵
        disc_code_est = code_logit_fake[:, :self.len_discrete_code]  # 取出数据
        disc_code_tg = self.y[:, :self.len_discrete_code]  # 取出标签
        q_disc_loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=disc_code_est,
                                                                             labels=disc_code_tg))  # 与所给y的交叉熵

        # continuous code : gaussian (MSE: 高斯分布拉近)
        cont_code_est = code_logit_fake[:, self.len_discrete_code:]
        cont_code_tg = self.y[:, self.len_discrete_code:]
        q_cont_loss = tf.reduce_mean(tf.reduce_sum(tf.square(cont_code_tg - cont_code_est), axis=1))  # 对列求和后取平均

        # get information loss
        self.q_loss = q_disc_loss + q_cont_loss


        """Training"""
        # divide trainable variables into a group for D and a group for G and for Q
        t_vars = tf.trainable_variables()
        d_vars = [var for var in t_vars if 'd_' in var.name]
        g_vars = [var for var in t_vars if 'g_' in var.name]
        # 注意q的loss 会影响三个网络
        q_vars = [var for var in t_vars if ('d_' in var.name) or ('q_' in var.name) or ('g_' in var.name)]

        #optimizers
        with tf.control_dependencies(tf.get_collection(tf.GraphKeys.UPDATE_OPS)):
            self.d_optim = tf.train.AdamOptimizer(self.learning_rate, beta1=self.beta1) \
                .minimize(self.d_loss, var_list=d_vars)
            self.g_optim = tf.train.AdamOptimizer(self.learning_rate * 5, beta1=self.beta1) \
                .minimize(self.g_loss, var_list=g_vars)
            self.q_optim = tf.train.AdamOptimizer(self.learning_rate * 5, beta1=self.beta1) \
                .minimize(self.q_loss, var_list=q_vars)


        """ test """
        # for test  不训练，reuse之前的参数
        self.fake_images = self.generator(self.z, self.y, is_training=False, reuse=True)


        """Summary"""
        d_loss_real_sum = tf.summary.scalar("d_loss_real", d_loss_real)
        d_loss_fake_sum = tf.summary.scalar("d_loss_fake", d_loss_fake)
        d_loss_sum = tf.summary.scalar("d_loss", self.d_loss)
        g_loss_sum = tf.summary.scalar("g_loss", self.g_loss)

        q_loss_sum = tf.summary.scalar("q_loss", self.q_loss)
        q_disc_sum = tf.summary.scalar("q_disc_loss", q_disc_loss)
        q_cont_sum = tf.summary.scalar("q_cont_loss", q_cont_loss)

        # final summary operations
        self.g_sum = tf.summary.merge([d_loss_fake_sum, g_loss_sum])
        self.d_sum = tf.summary.merge([d_loss_real_sum, d_loss_sum])
        self.q_sum = tf.summary.merge([q_loss_sum, q_disc_sum, q_cont_sum])


    def train(self):

        # initialize all variables
        tf.global_variables_initializer().run()

        # graph inputs for visualize training results
        self.sample_z = np.random.uniform(-1, 1, size=(self.batch_size, self.z_dim))
        self.test_labels = self.data_y[0:self.batch_size]
        self.test_codes = np.concatenate((self.test_labels, np.zeros([self.batch_size, self.len_continuous_code])),
                                         axis=1)  # 连起来


        # saver to save model
        self.saver = tf.train.Saver()

        # summary writer
        self.writer = tf.summary.FileWriter(self.log_fir + '/' + self.model_name + '/' + self.dataset_name, self.sess.graph)

        # restore check-point if it exits
        could_load, checkpoint_counter = self.load(self.checkpoint_dir)

        if could_load  and self.reload:
            start_epoch = (int)(checkpoint_counter / self.num_batches)
            start_batch_id = checkpoint_counter - start_epoch * self.num_batches
            counter = checkpoint_counter
            print(" [*] load SUCCESS")

        # 重新训练所有
        else:
            start_epoch = 0
            start_batch_id = 0  # 每个epoch中的第几块batch
            counter = 1
            print(" [!] reload from begin")


        #loop for epoch
        start_time = time.time()
        for epoch in range(start_epoch, self.epoch):

            #get batch data   每一个batch更新一次网络的参数
            for idx in range(start_batch_id, self.num_batches):
                batch_images = self.data_X[idx * self.batch_size : (idx+1) * self.batch_size]  # real data

                # generate codes
                if self.SUPERVISED == True:
                    batch_labels = self.data_y[idx * self.batch_size : (idx+1) * self.batch_size]  #用对应的标签
                else:
                    batch_labels = np.random.multinomial(1, self.len_discrete_code * [float(1.0 / self.len_discrete_code)],
                                                         size=[self.batch_size])

                # batch_codes 和 batch_z 分别传入
                batch_codes = np.concatenate((batch_labels, np.random.uniform(-1, 1, size=(self.batch_size, 2))), axis=1)
                batch_z = np.random.uniform(-1, 1, [self.batch_size, self.z_dim]).astype(np.float32)

                # update G network
                _, summary_str_g, g_loss = self.sess.run(
                    [self.g_optim, self.g_sum, self.g_loss],
                    feed_dict={self.inputs: batch_images, self.z: batch_z, self.y: batch_codes}
                )
                self.writer.add_summary(summary_str_g, counter)

                # update D and Q network
                _, summary_str_d, d_loss, _, summary_str_q, q_loss = self.sess.run(
                    [self.d_optim, self.d_sum, self.d_loss, self.q_optim, self.q_sum, self.q_loss],
                    feed_dict={self.inputs: batch_images, self.z: batch_z, self.y: batch_codes}
                )
                self.writer.add_summary(summary_str_d, counter)
                self.writer.add_summary(summary_str_q, counter)


                # display training status
                counter +=1
                print("Epoch: [%2d] [%4d/%4d] time: %4.4f, d_loss: %.8f, g_loss: %.8f" \
                      % (epoch, idx, self.num_batches, time.time() - start_time, d_loss, g_loss))

                # save training results for every 300 steps
                if np.mod(counter, 300) == 0:
                    samples = self.sess.run(self.fake_images,
                                            feed_dict={self.z: self.sample_z, self.y: self.test_codes})
                    # 一次多少张图片 如果比batch_size大则取batch_size
                    tot_num_samples = min(self.sample_num, self.batch_size)
                    manifold_h = int(np.floor(np.sqrt(tot_num_samples)))
                    manifold_w = int(np.floor(np.sqrt(tot_num_samples)))
                    save_images(samples[:manifold_h * manifold_w, :, :, :], [manifold_h, manifold_w],
                                './' + check_folder(self.result_dir + '/' + self.model_dir) + '/' + self.model_name + '_train_{:02d}_{:04d}.png'.format(
                                    epoch, idx))
            # After an epoch, start_batch_id is set to zero
            # non-zero value is only for the first epoch after loading pre-trained model
            start_batch_id = 0

            # save model
            self.save(self.checkpoint_dir, counter)

            # show temporal results
            self.visualize_results(epoch)

        # save model for final step
        self.save(self.checkpoint_dir, counter)


    def visualize_results(self, epoch):
        tot_num_samples = min(self.sample_num, self.batch_size)
        image_frame_dim = int(np.floor(np.sqrt(tot_num_samples)))

        """ random noise, random discrete code, fixed continuous code """
        y = np.random.choice(self.len_discrete_code, self.batch_size) #1*batch_size的行向量  每一个范围是[0,len_discrete_code-1]
        y_one_hot = np.zeros((self.batch_size, self.y_dim))  # y_dim初始化为12
        y_one_hot[np.arange(self.batch_size), y] = 1  #一个trick  方便的置1

        z_sample = np.random.uniform(-1, 1, size=(self.batch_size, self.z_dim))

        samples = self.sess.run(self.fake_images, feed_dict={self.z: z_sample, self.y: y_one_hot})

        save_images(samples[:image_frame_dim * image_frame_dim, :, :, :], [image_frame_dim, image_frame_dim],
                    check_folder(self.result_dir + '/' + self.model_dir) + '/' + self.model_name + '_epoch%03d' % epoch + '_test_all_classes.png')

        """ random noise， specified discrete code, fixed continuous code """
        n_styles = 10  # must be less than or equal to self.batch_size

        np.random.seed()
        si = np.random.choice(self.batch_size, n_styles)

        for l in range(self.len_discrete_code):
            y = np.zeros(self.batch_size, dtype=np.int64) + l  #指定 l
            y_one_hot = np.zeros((self.batch_size, self.y_dim))
            y_one_hot[np.arange(self.batch_size), y] = 1

            samples = self.sess.run(self.fake_images, feed_dict={self.z: z_sample, self.y: y_one_hot})
            # save_images(samples[:image_frame_dim * image_frame_dim, :, :, :], [image_frame_dim, image_frame_dim],
            #             check_folder(self.result_dir + '/' + self.model_dir) + '/' + self.model_name + '_epoch%03d' % epoch + '_test_class_%d.png' % l)

            samples = samples[si, :, :, :]

            if l == 0:
                all_samples = samples
            else:
                all_samples = np.concatenate((all_samples, samples), axis=0)

        """ save merged images to check style-consistency """
        canvas = np.zeros_like(all_samples)
        for s in range(n_styles):
            for c in range(self.len_discrete_code):
                canvas[s * self.len_discrete_code + c, :, :, :] = all_samples[c * n_styles + s, :, :, :]

        save_images(canvas, [n_styles, self.len_discrete_code],
                    check_folder(self.result_dir + '/' + self.model_dir) + '/' + self.model_name + '_epoch%03d' % epoch + '_test_all_classes_style_by_style.png')

        """ fixed noise，specified discrete code, gradual change continuous code  """
        assert self.len_continuous_code == 2

        c1 = np.linspace(-1, 1, image_frame_dim)
        c2 = np.linspace(-1, 1, image_frame_dim)
        xv, yv = np.meshgrid(c1, c2)
        xv = xv[:image_frame_dim, :image_frame_dim]
        yv = yv[:image_frame_dim, :image_frame_dim]

        c1 = xv.flatten()
        c2 = yv.flatten()

        z_fixed = np.zeros([self.batch_size, self.z_dim])

        for l in range(self.len_discrete_code):
            y = np.zeros(self.batch_size, dtype=np.int64) + l
            y_one_hot = np.zeros((self.batch_size, self.y_dim))
            y_one_hot[np.arange(self.batch_size), y] = 1

            y_one_hot[np.arange(image_frame_dim*image_frame_dim), self.len_discrete_code] = c1
            y_one_hot[np.arange(image_frame_dim*image_frame_dim), self.len_discrete_code+1] = c2

            samples = self.sess.run(self.fake_images,
                                    feed_dict={ self.z: z_fixed, self.y: y_one_hot})

            save_images(samples[:image_frame_dim * image_frame_dim, :, :, :], [image_frame_dim, image_frame_dim],
                        check_folder(self.result_dir + '/' + self.model_dir) + '/' + self.model_name + '_epoch%03d' % epoch + '_test_class_c1c2_%d.png' % l)

    @property
    def model_dir(self):
        return "{}_{}_{}_{}".format(
            self.model_name, self.dataset_name,
            self.batch_size, self.z_dim)

    def save(self, checkpoint_dir, step):
        checkpoint_dir = os.path.join(checkpoint_dir, self.model_dir, self.model_name)

        if not os.path.exists(checkpoint_dir):
            os.makedirs(checkpoint_dir)

        self.saver.save(self.sess, os.path.join(checkpoint_dir, self.model_name+'.model'), global_step=step)

    def load(self, checkpoint_dir):
        import re
        print(" [*] Reading checkpoints...")
        checkpoint_dir = os.path.join(checkpoint_dir, self.model_dir, self.model_name)

        ckpt = tf.train.get_checkpoint_state(checkpoint_dir)
        if ckpt and ckpt.model_checkpoint_path:
            ckpt_name = os.path.basename(ckpt.model_checkpoint_path)
            self.saver.restore(self.sess, os.path.join(checkpoint_dir, ckpt_name))
            counter = int(next(re.finditer("(\d+)(?!.*\d)",ckpt_name)).group(0))
            print(" [*] Success to read {}".format(ckpt_name))
            return True, counter
        else:
            print(" [*] Failed to find a checkpoint")
            return False, 0

ops.py

"""
Most codes from https://github.com/carpedm20/DCGAN-tensorflow
"""
import math
import numpy as np
import tensorflow as tf

from tensorflow.python.framework import ops

from utils import *

if "concat_v2" in dir(tf):
    def concat(tensors, axis, *args, **kwargs):
        return tf.concat_v2(tensors, axis, *args, **kwargs)
else:
    def concat(tensors, axis, *args, **kwargs):
        return tf.concat(tensors, axis, *args, **kwargs)


def bn(x, is_training, scope):
    return tf.contrib.layers.batch_norm(x,
                                        decay=0.9,
                                        updates_collections=None,
                                        epsilon=1e-5,
                                        scale=True,
                                        is_training=is_training,
                                        scope=scope)


def conv_out_size_same(size, stride):
    return int(math.ceil(float(size) / float(stride)))


def conv_cond_concat(x, y):
    """Concatenate conditioning vector on feature map axis."""
    x_shapes = x.get_shape()
    y_shapes = y.get_shape()
    return concat([x, y*tf.ones([x_shapes[0], x_shapes[1], x_shapes[2], y_shapes[3]])], 3)


def conv2d(input_, output_dim, k_h=5, k_w=5, d_h=2, d_w=2, stddev=0.02, name="conv2d"):
    with tf.variable_scope(name):
        w = tf.get_variable('w', [k_h, k_w, input_.get_shape()[-1], output_dim],
              initializer=tf.truncated_normal_initializer(stddev=stddev))
        conv = tf.nn.conv2d(input_, w, strides=[1, d_h, d_w, 1], padding='SAME')

        biases = tf.get_variable('biases', [output_dim], initializer=tf.constant_initializer(0.0))
        conv = tf.reshape(tf.nn.bias_add(conv, biases), conv.get_shape())

        return conv


def deconv2d(input_, output_shape, k_h=5, k_w=5, d_h=2, d_w=2, name="deconv2d", stddev=0.02, with_w=False):
    with tf.variable_scope(name):
        # filter : [height, width, output_channels, in_channels]
        w = tf.get_variable('w', [k_h, k_w, output_shape[-1], input_.get_shape()[-1]],
                            initializer=tf.random_normal_initializer(stddev=stddev))

        try:
            deconv = tf.nn.conv2d_transpose(input_, w, output_shape=output_shape, strides=[1, d_h, d_w, 1])

        # Support for verisons of TensorFlow before 0.7.0
        except AttributeError:
            deconv = tf.nn.deconv2d(input_, w, output_shape=output_shape, strides=[1, d_h, d_w, 1])

        biases = tf.get_variable('biases', [output_shape[-1]], initializer=tf.constant_initializer(0.0))
        deconv = tf.reshape(tf.nn.bias_add(deconv, biases), deconv.get_shape())

        if with_w:
            return deconv, w, biases
        else:
            return deconv


def lrelu(x, leak=0.2, name="lrelu"):
    return tf.maximum(x, leak*x)


def linear(input_, output_size, scope=None, stddev=0.02, bias_start=0.0, with_w=False):
    shape = input_.get_shape().as_list()

    with tf.variable_scope(scope or "Linear"):
        matrix = tf.get_variable("Matrix", [shape[1], output_size], tf.float32,
                 tf.random_normal_initializer(stddev=stddev))
        bias = tf.get_variable("bias", [output_size],
        initializer=tf.constant_initializer(bias_start))
        if with_w:
            return tf.matmul(input_, matrix) + bias, matrix, bias
        else:
            return tf.matmul(input_, matrix) + bias

utils.py

"""
Most codes from https://github.com/carpedm20/DCGAN-tensorflow
"""

import math
import random
import pprint
import scipy.misc
import numpy as np
from time import gmtime, strftime
from six.moves import xrange
import matplotlib.pyplot as plt
import os
import gzip
import tensorflow as tf
import tensorflow.contrib.slim as slim


def load_mnist(dataset_name):
    data_dir = os.path.join("./data", dataset_name)

    def extract_data(filename, num_data, head_size, data_size):
        with gzip.open(filename) as bytestream:
            bytestream.read(head_size)
            buf = bytestream.read(data_size * num_data)
            data = np.frombuffer(buf, dtype=np.uint8).astype(np.float)
        return data

    data = extract_data(data_dir + '/train-images-idx3-ubyte.gz', 60000, 16, 28 * 28)
    trX = data.reshape((60000, 28, 28, 1))

    data = extract_data(data_dir + '/train-labels-idx1-ubyte.gz', 60000, 8, 1)
    trY = data.reshape((60000))

    data = extract_data(data_dir + '/t10k-images-idx3-ubyte.gz', 10000, 16, 28 * 28)
    teX = data.reshape((10000, 28, 28, 1))

    data = extract_data(data_dir + '/t10k-labels-idx1-ubyte.gz', 10000, 8, 1)
    teY = data.reshape((10000))

    trY = np.asarray(trY)
    teY = np.asarray(teY)

    X = np.concatenate((trX, teX), axis=0)
    y = np.concatenate((trY, teY), axis=0).astype(np.int)

    seed = 547
    np.random.seed(seed)
    np.random.shuffle(X)
    np.random.seed(seed)
    np.random.shuffle(y)

    # 变为向量
    y_vec = np.zeros((len(y), 10), dtype=np.float)
    for i, label in enumerate(y):
        y_vec[i, y[i]] = 1.0

    return X / 255., y_vec


def check_folder(dir):
    if not os.path.exists(dir):
        os.makedirs(dir)
    return dir


def show_all_variables():
    model_vars = tf.trainable_variables()
    slim.model_analyzer.analyze_vars(model_vars, print_info=True)


def get_image(image_path, input_height, input_width, resize_height=64, resize_width=64, crop=True, grayscale=False):
    image = imread(image_path, grayscale)
    return transform(image, input_height, input_width, resize_height, resize_width, crop)


def save_images(images, size, image_path):
    return imsave(inverse_transform(images), size, image_path)


def imread(path, grayscale=False):
    if (grayscale):
        return scipy.misc.imread(path, flatten=True).astype(np.float)
    else:
        return scipy.misc.imread(path).astype(np.float)


def merge_images(images):
    return inverse_transform(images)


def merge(images, size):
    h, w = images.shape[1], images.shape[2]
    if (images.shape[3] in (3, 4)):
        c = images.shape[3]
        img = np.zeros((h * size[0], w * size[1], c))
        for idx, image in enumerate(images):
            i = idx % size[1]
            j = idx // size[1]
            img[j * h:j * h + h, i * w:i * w + w, :] = image
        return img
    elif images.shape[3] == 1:
        img = np.zeros((h * size[0], w * size[1]))
        for idx, image in enumerate(images):
            i = idx % size[1]
            j = idx // size[1]
            img[j * h:j * h + h, i * w:i * w + w] = image[:, :, 0]
        return img
    else:
        raise ValueError('in merge(images,size) images parameter ''must have dimensions: HxW or HxWx3 or HxWx4')


def imsave(images, size, path):
    image = np.squeeze(merge(images, size))
    return scipy.misc.imsave(path, image)


def center_crop(x, crop_h, crop_w, resize_h=64, resize_w=64):
    if crop_w is None:
        crop_w = crop_h
    h, w = x.shape[:2]
    j = int(round((h - crop_h)/2.))
    i = int(round((w - crop_w)/2.))
    return scipy.misc.imresize(x[j:j+crop_h, i:i+crop_w], [resize_h, resize_w])


def transform(image, input_height, input_width, resize_height=64, resize_width=64, crop=True):
    if crop:
        cropped_image = center_crop(image, input_height, input_width, resize_height, resize_width)
    else:
        cropped_image = scipy.misc.imresize(image, [resize_height, resize_width])
    return np.array(cropped_image)/127.5 - 1.


def inverse_transform(images):
    return (images+1.)/2.


""" Drawing Tools """


# borrowed from https://github.com/ykwon0407/variational_autoencoder/blob/master/variational_bayes.ipynb
def save_scattered_image(z, id, z_range_x, z_range_y, name='scattered_image.jpg'):
    N = 10
    plt.figure(figsize=(8, 6))
    plt.scatter(z[:, 0], z[:, 1], c=np.argmax(id, 1), marker='o', edgecolor='none', cmap=discrete_cmap(N, 'jet'))
    plt.colorbar(ticks=range(N))
    axes = plt.gca()
    axes.set_xlim([-z_range_x, z_range_x])
    axes.set_ylim([-z_range_y, z_range_y])
    plt.grid(True)
    plt.savefig(name)


# borrowed from https://gist.github.com/jakevdp/91077b0cae40f8f8244a
def discrete_cmap(N, base_cmap=None):
    """Create an N-bin discrete colormap from the specified input map"""

    # Note that if base_cmap is a string or None, you can simply do
    #    return plt.cm.get_cmap(base_cmap, N)
    # The following works for string, None, or a colormap instance:

    base = plt.cm.get_cmap(base_cmap)
    color_list = base(np.linspace(0, 1, N))
    cmap_name = base.name + str(N)
    return base.from_list(cmap_name, color_list, N)

结果

由于gtx950m算力有限…，只跑了7 epochs，batch size是64，learning_rate = 0.0002

最后的结果如下

不同类全部输出，连续c不变：

0粗细和倾斜程度的变化：

总结与疑问

这是我第二次复现论文，上一篇就是原始gan了...

学习到了很多基本的概念...     比如Batch normalization等

tensorflow的熟练程度很重要，可以极大的提高训练、调参效率，比如设置checkpoint以重载，记录log，summary可视化等 ，这些还需要探索。

另外，程序一开始有warning，（往往是告诉你函数的一些更改），这个交叉熵好像即将弃用。

问题

这是一个无监督的方法，就是对于C我可以随机给初值，最后互信息都会很大。然后如果我用输入的real图片的标签（离散）作为 $c$ 训练，可不可以控制训练好后，恰好 $c = 0$ 时就输出0的图像呢？

上面的代码尝试了这个，

但是并不对应。因为这个标签只是real的标签，而和这一次你随机的噪声没有关系， $G$ 生成的确实很像 $r e a l$ ，然后成功欺骗了 $D$ ，然后 $Q$ 根据输入 $G$ 的 $c$ 优化参数，尽量使 $G$ 生成的图片和 $c$ 关系大，但是并不一定生成想要的那个数字。一种粗暴的方法是，最后人工观察，哪个离散值对应哪个数字。

所以，现在 $G$ 学到了 $r e a l$ 数据的分布，但原始GAN不知道具体怎么对应分布，只会生成其中某一种，而infoGAN通过训练 $c$ ，使得指定参数后，可以得到固定的分布，但好像还不知道指定哪个参数能得到指定的分布？
1.18.2019 update

采用mnist的标签，使用其对qnet训练，G也对Qnet训练，应该可以映射

你可能感兴趣的:(generate,Generative,Adversarial,Networks,Essay)

《Operating System Concepts》阅读笔记：p354-p358 操作系统
《OperatingSystemConcepts》学习第31天，p354-p358总结，总计5页。一、技术总结1.logicaladdress&virtualaddressBindingaddressesateithercompileorloadtimegeneratesidenticallogicalandphysicaladdresses.However,theexecution-timead
PHPer看docker容器的管理详解 PHP开源社区 PHP架构 docker python mysql php
查询容器信息dockerinspcet查询信息，包括运行情况、存贮位置、配置参数、网络设置等。查询容器的运行状态dockerinspect-f{{.State.Status}}【容器】查询容器的IPdockerinspect-f{{.NetworkSettings.IPAddress}}【容器】查询容器日志信息Ωdockerlogs【容器】-f实时打印最新的日志dockerstats实时查看容器所
【ComfyUI专栏】ComfyUI引用Embedded和HyperNetwork超网络雾岛心情 ComfyUI ComfyUI AIGC
大家如果使用过WebUI，那么一定知道界面中存在的Embedding和HyperNetworks。在界面中我们直接点击相应的嵌入式和超网络就能直接使用。ComfyUI的界面设计不如WEBUI直观，但我们仍可通过Text-Encoder输入Embedding来实现Embedding的引入。在C站（Civitai）上，我们可以看到种类繁多的Embedding资源。这些文件通常体积较小，大多只有几十KB
深入解析Quantum-GABP：量子神经网络的实现与应用 m0_57781768 神经网络量子计算人工智能
深入解析Quantum-GABP：量子神经网络的实现与应用引言在现代科技飞速发展的今天，量子计算与神经网络的结合成为了研究热点。量子神经网络（QuantumNeuralNetworks,QNN）凭借其巨大的计算潜力和独特的量子特性，逐渐吸引了研究者的关注。其中，Quantum-GABP（量子广义反向传播算法）作为一种高效的量子神经网络训练算法，展现出极大的应用前景。本文将深入探讨Quantum-G
JAVA随机生成六位验证码 Ning.L java python 开发语言
使用java语言随机生成六位数的验证码在importjava.util.Random;publicclassRandomCodeGenerator{publicstaticvoidmain(String[]args){//生成六位数验证码StringverificationCode=generateVerificationCode(6);System.out.println("生成的验证码是:"+
差异中寻找共识：浅析中美欧AIGC服务商的标识义务人工智能
2025年1月7日，西藏日喀则地震中一张被广泛传播的图片“被压在废墟下的小男孩”被证明是AI合成图片，[1]这随即引发了社会对于人工智能生成物（ArtificialIntelligenceGeneratedContent，以下简称“AIGC”）的广泛讨论。随着AI大模型生成逼真图像、音频与视频的能力日益增强，人类作品与AIGC之间的界限愈发模糊。如不加以管控，则会产生“真相侵蚀”（TruthDec
网络神经架构的概念及其实际应用 2301_81121233 网络爬山算法近邻算法霍夫曼树剪枝哈希算法柔性数组
###网络神经架构的概念**网络神经架构（NeuralNetworkArchitecture）**是指用于构建和组织人工神经网络（ArtificialNeuralNetworks,ANN）的结构和方法。这些架构通常由多个层次的节点（神经元）组成，通过模拟人脑神经元之间的连接和信息传递方式，来处理复杂的数据输入并生成相应的输出。网络神经架构通常由以下几个部分组成：1.**输入层（InputLayer
用maven生成springboot多模块项目 tan_jianhui 软件开发 spring boot maven java
用Maven生成SpringBoot多模块项目，可以按照以下步骤操作：1.创建父项目首先，使用Maven的archetype插件创建一个空的Maven项目作为父项目。打开终端，执行以下命令：mvnarchetype:generate-DgroupId=com.example-DartifactId=springboot-multi-module-demo-DarchetypeArtifactId=
HarmonyOS NEXT开发实战：Navigation页面跳转对象传递案例一晃有一秋鸿蒙实例鸿蒙 harmonyos 华为鸿蒙鸿蒙系统 android
介绍本示例主要介绍在使用Navigation实现页面跳转时，如何在跳转页面得到转入页面传的类对象的方法。实现过程中使用了第三方插件class-transformer，传递对象经过该插件的plainToClass方法转换后可以直接调用对象的方法，效果图预览使用说明从首页进入本页面时，会传递一个类对象UserBookingInfo。点击“换个座位”按钮会调用该类对象的generateRandSeatN
去除Dialog出现时背景变暗效果的方法 Shawn_LX
在样式XML文件下添加自定义Dialog样式，继承自android:Theme.Dialog主题样式true@android:color/transparentfalse加入以上属性后重写onCreateDialog()方法：@OverrideprotectedDialogonCreateDialog(intid){//TODOAuto-generatedmethodstubif(id==1){D
【sklearn 04】DNN、CNN、RNN @金色海岸 sklearn dnn cnn
DNNDNN（DeepNeuralNetworks，深度神经网络）是一种相对浅层机器学习模型具有更多参数，需要更多数据进行训练的机器学习算法CNNCNN（convolutionalNeuralNetworks，卷积神经网络）是一种从局部特征开始学习并逐渐整合的神经网络。卷积神经网络通过卷积层来进行特征提取，通过池化层进行降维，相比较全连接的神经网络，卷积神经网络降低了模型复杂度，减少了模型的参数，
UE中：运行时（伪）无限细分网格 Dawn·张 android 数码相机
先看效果：UE：运行时（伪）无限细分网格实际代码如下：InfiniteGrid.h#pragmaonce#include"CoreMinimal.h"#include"GameFramework/Actor.h"#include"InfiniteGrid.generated.h"USTRUCT()structFGridLayer{GENERATED_BODY()UPROPERTY(EditAnyw
CMake Error at myplugins_generated_yololayer.cu.o.Debug，tensorrtx编译失败解决雪可问春风 BUG 人工智能
system:ubuntu1804gpu:3060cuda:cuda11.4tensorrt:8.4使用项目tensorrtx进行yolov5的engine生成，之前在编译成功的配置为system:ubuntu1804gpu:2060cuda:cuda10.2tensorrt:7.2.3.4换到3060后，make失败，报错错误：/home/yfzx/work/vs-work/tensorrt-y
torch.logical_and()方法 CodeWang_NC pytorch 深度学习 python
torch.logical_and()计算给定输入张量的元素逻辑AND。零被视为False，非零被视为True官方文档说明:https://pytorch.org/docs/stable/generated/torch.logical_and.html#torch.logical_andtorch.logical_and(input，other，*，out=None）→返回张量input（张量）–
PINN物理信息网络 | 利用物理信息神经网络进行流体动力学建模算法如诗物理信息网络（PINN）神经网络机器学习人工智能流体动力学建模 PINN物理信息网络
背景物理信息神经网络（Physics-InformedNeuralNetworks，PINN）是一种结合了神经网络和物理方程的方法，用于建模和求解物理问题。传统的基于物理方程的数值方法在处理复杂的非线性偏微分方程时可能面临数值稳定性、高计算复杂度和网格依赖性等问题。而PINN作为一种数据驱动的方法，通过使用神经网络来近似物理方程，能够有效地解决这些问题。在流体动力学建模中，PINN可以应用于求解N
Deepseek:物理神经网络PINN入门教程天一生水water 神经网络人工智能深度学习
一、物理信息网络（PINN）的概念与原理1.定义与来源物理信息网络（Physics-InformedNeuralNetworks,PINN）是一种将物理定律（如偏微分方程、守恒定律等）嵌入神经网络训练过程的深度学习方法。其核心思想是通过神经网络同时拟合观测数据并满足物理约束，从而解决传统数值方法难以处理的高维、噪声数据或复杂边界条件问题。来源：PINN起源于对传统数值方法局限性的改进需求（如网格生
Unity插件-Mirror使用方法（十四）组件介绍（KCP Transport）一颗橘子宣布成为星球 Unity Mirror网络同步框架 unity 游戏引擎
目录一、插件介绍二、主要组件NetworkManagerNetworkManagerHUDNetworkIdentityNetworkTransformNetworkAnimatorNetworkBehaviourNetworkStartPositionNetworkRoomManagerNetworkRoomPlayerNetworkDiscoveryNetworkAuthenticators三
WPF—自定义分页 YANG-Live WPF C#wpf c#ui
WPFDataGrid分页DataGridDataGrid美化DataGrid数据源绑定DataGrid分页页面调用分页WPFDataGrid分页DataGridDataGrid数据列表看一下DataGrid的独特属性：AlternationCount：设置ItemControl中交替项的数据，可以理解为隔几行换色设置AutoGenerateColumns：是否自动生成列CanUserAddRow
[论文精读]AI-Guardian: Defeating Adversarial Attacks using Backdoors 0x211 论文精读人工智能
会议名称：2023IEEESymposiumonSecurityandPrivacy(SP)发布链接：AI-Guardian:DefeatingAdversarialAttacksusingBackdoors|IEEEConferencePublication|IEEEXplore中文译名：AI-Guardian:利用后门防御对抗攻击阅读原因：网安相关，方班需要本文主要介绍了一种名为AI-Guar
Windows 如何卸载 Docker KaedaRukawa 调试容器运维 windows docker
在卸载Docker之前，请确保系统上没有运行任何容器。运行以下cmdlet，检查是否有正在运行的容器：PowerShell#Leaveswarmmode(thiswillautomaticallystopandremoveservicesandoverlaynetworks)dockerswarmleave--force#Stopallrunningcontainersdockerps--quie
Ae 效果详解：分形 MediaTea
Ae菜单：效果/生成/分形Generate/Fractal分形Fractal效果可生成曼德布罗特集和朱莉娅集的视觉效果，通常用于创作独特的抽象图案和动态纹理，广泛应用于背景生成和抽象视觉表现。本效果适用于8-bpc和16-bpc色深模式。◆◆◆效果属性说明当首次应用此效果时，所显示的图像为经典的曼德布罗特集合样本。其中黑色区域代表集合，集合之外的像素则根据其距离集合的远近被着色。点击“重置”Res
Pytorch实现之利用普通GAN的人脸修复这张生成的图像能检测吗优质GAN模型训练自己的数据集 GAN系列 pytorch 生成对抗网络人工智能神经网络深度学习计算机视觉 python
简介简介：利用遮挡真实样本的部分面貌，输入给生成器，让生成器输出未被遮挡的面貌，以达到修复人脸的效果。论文题目：FACERESTORATIONVIAGENERATIVEADVERSARIALNETWORKS（基于生成对抗网络的人脸恢复）会议：2023ThirdInternationalConferenceonSecureCyberComputingandCommunication(ICSCCC)摘
论文学习：基于机器学习的光声图像分析1 superace7911 基于机器学习的光声图像处理机器学习人工智能图像处理
3/25——3/31期间论文学习笔记，关于基于机器学习的光声图像分析的6篇1区论文血管结构模拟&分割：Quantificationofvascularnetworksinphotoacousticmesoscopy链接数据集链接摘要这篇论文提出了一种新的方法，利用中观光声成像（MesoscopicPhotoacousticImaging,PAI）技术和高级图像分析技术，来非侵入性地定量化和分析活体
论文阅读笔记：Graph Matching Networks for Learning the Similarity of Graph Structured Objects 游离态GLZ不可能是金融技术宅知识图谱机器学习深度学习人工智能
论文做的是用于图匹配的神经网络研究，作者做出了两点贡献:证明GNN可以经过训练，产生嵌入graph-leve的向量可以用于相似性计算。作者提出了一种新的基于注意力的跨图匹配机制GMN(cross-graphattention-basedmatchingmechanism)，来计算出一对图之间的相似度评分。（核心创新点）论文证明了该模型在不同领域的有效性，包括具有挑战性的基于控制流图(control
FLOW MATCHING FOR GENERATIVE MODELING 阅读笔记冰冰冰泠泠泠笔记机器学习算法
论文提出了一种新的生成模型。论文的目的是给定一个目标分布，有目标分布的一定量的样本，但是不知道目标分布的概率密度函数，学习一个模型能生成服从目标分布的新样本。FlowMatching(FM)是一种训练连续标准化流ContinuousNormalizingFlow(CNF)的方法。FM是一种通用的方法。FM可以用于训练扩散路径，用FM训练扩散路径更稳定。FM也可以用于训练其他路径，一个例子是训练最优
基于pytorch的神经病网络搭建学习停走的风 pytorch学习学习 pytorch 人工智能
1.pycharm中code方法的使用1.1父类重写技巧操作：在需要重写的方法上右键，选择code-->Generate>OverrideMethods。作用：自动生成重写父类或接口的方法2.简单神经网络importtorchfromtorchimportnnclassyu(nn.Module):def__init__(self,*args,**kwargs)->None:super().__in
《自然语言处理实战入门》深度学习 ---- 预训练模型初探 shiter AI重制版】预训练 NLP 自然语言处理
文章大纲前言预训练模型简介语言表示学习神经上下文编码器为何需要预训练模型发展历史主流预训练模型预训练模型与分类将PTMs应用至下游任务微调策略未来研究方向参考文献前言随着深度学习的发展，各种神经网络被广泛用于解决自然语言处理(NLP)任务，如卷积神经网络(convolutionalneuralnetworks,CNNs)、递归神经网络(neuralnetworks,RNNs)、基于图的神经网络(g
C语言实现排序之选择排序算法 Seraphina_Lily C语言排序算法排序算法 c语言算法
1.代码#include#include#include//函数声明int*create_and_generate_random_array(intsize);voidprint_array(int*array,intsize);voidselection_sort(int*array,intsize);intgenerate_random_size();intmain(){intsize=gen
MPU6050 卡尔曼滤波算法四元数欧拉姿态解算 STM32 CubeMX HAL库 MDKkeil5 零基础移植辛尘大海算法 stm32 嵌入式硬件
文章目录一、在cubemx开启IIC并设置好对应的IIC引脚二、generatecode生成代码三、复制以下的全部代码新建分别保存放到IncSrc文件夹中1.MPU6050.h2.MPU6050.C四、如何使用总结一、在cubemx开启IIC并设置好对应的IIC引脚二、generatecode生成代码（记得生成单个c.h.文件）！！！！！！三、复制以下的全部代码新建分别保存放到IncSrc文件夹中
【Hugging Face】transformers 库中 model.generate() 方法：自回归模型的文本生成方法彬彬侠 Hugging Face model.generate transformers Hugging Face 文本生成自回归模型 GPT LLAMA
HuggingFacemodel.generate方法model.generate是transformers库中的文本生成（TextGeneration）方法，适用于自回归模型（如GPT-2、T5、BART、LLAMA），用于生成文本、摘要、翻译、问答等。1.适用于哪些模型？generate适用于基于Transformer生成文本的模型，例如：GPT-2(AutoModelForCausalLM)
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR