二亩三分地

CycleGAN——loss解析及更改与实验

CycleGAN（五）loss解析及更改与实验

2019年04月01日 11:25:05 邢翔瑞

版权声明：转载注明出处：邢翔瑞的技术博客
https://blog.csdn.net/weixin_36474809
https://blog.csdn.net/weixin_36474809/article/details/88895136

目的：弄懂loss的定义位置及何更改。

一、论文中loss定义及含义

1.1 论文中的loss

1.2 adversarial loss

1.3 cycle consistency loss

1.4 总体loss

1.5 idt loss

二、代码中loss定义

2.1 判别器D的loss

2.2 生成器G的loss

2.3 Idt loss

2.4 定义位置汇总

三、更改与实验

3.1 定义及更改位置

3.2 测试时会打出相应参数信息

四、训练中loss值常见变化

4.1 常见loss

4.2 运行及存储位置

一、论文中loss定义及含义

CycleGAN论文详解:Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

1.1 论文中的loss

其过程包含了两种loss：

adversarial losses:尽可能让生成器生成的数据分布接近于真实的数据分布
cycle consistency losses: 防止生成器G与F相互矛盾，即两个生成器生成数据之后还能变换回来近似看成X->Y->X

1.2 adversarial loss

尽可能让生成器生成的数据接近于真实的数据分布：

与GAN一样，G用于实现X->Y, 训练应当尽可能让此G(X)接近于Y，判别器Dy用于判别样本的真假。与GAN的公式一样：

同理，对于F实现 Y->X,

1.3 cycle consistency loss

用于让两个生成器生成的样本之间不要相互矛盾。

上一个adversarial loss只可以保证生成器生成的样本与真实样本同分布，但是我们希望对应的域之间的图像是一一对应的。即A-B-A还可以再迁移回来。

我们希望x -> G(x) -> F(G(x)) ≈ x，称作forward cycle consistency

同理，y -> F(y) -> G(F(y)) ≈ y, 称作 backward cycle consistency

为了尽可能保证consistency，我们设定相应的loss：

1.4 总体loss

即生成器G尽可能实现X到Y的迁移，生成器F尽可能实现Y到X的迁移，同时，希望两生成器的生成器是可以实现互逆，即相互迭代回到自身。（作者后面实验细节training datails之中，λ 取10 ）

1.5 idt loss

有一个loss再论文主要部分没有提及，但是在application之中提及了，并且代码之中有涉及，是idt loss

cycle_gan_model.py之中对它的定义是这样：

parser.add_argument('--lambda_identity', type=float, default=0.5, help='use identity mapping. Setting lambda_identity other than 0 has an effect of scaling the weight of the identity mapping loss. For example, if the weight of the identity loss should be 10 times smaller than the weight of the reconstruction loss, please set lambda_identity = 0.1')

idt loss的定义在论文的application之中，防止input 与out put之间的color compostion过多。网络所有的loss的定义就是，reconstruction loss就是GAN loss和cycle consistency loss两个加在一起，GAN loss用于迁移类，cycle consistency loss用于尽量保留原图可以循环迁移。但是还有一个更直观的loss叫idt loss尽量的避免迁移过多。

二、代码中loss定义

models/cycle_gan_model.py

论文中并未提及idt_A以及idt_B的含义及作用。

2.1 判别器D的loss

运用真实样本作为正样本True，及G生成的样本作为负样本False，训练D


 
   
   
   
   
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
          
     def backward_D_basic(self, netD, real, fake):
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     """Calculate GAN loss for the discriminator
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
             Parameters:
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
                 netD (network)      -- the discriminator D
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
                 real (tensor array) -- real images
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
                 fake (tensor array) -- images generated by a generator
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
             Return the discriminator loss.
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
             We also call loss_D.backward() to calculate the gradients.
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
             """
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # Real
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             pred_real = netD(real)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             loss_D_real = self.criterionGAN(pred_real, 
     True)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # Fake
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             pred_fake = netD(fake.detach())
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             loss_D_fake = self.criterionGAN(pred_fake, 
     False)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # Combined loss and calculate gradients
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             loss_D = (loss_D_real + loss_D_fake) * 
     0.5
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             loss_D.backward()
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     return loss_D

2.2 生成器G的loss

self.loss_G_A + self.loss_G_B + self.loss_cycle_A + self.loss_cycle_B + self.loss_idt_A + self.loss_idt_B


 
   
   
   
   
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # GAN loss D_A(G_A(A))
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_G_A = self.criterionGAN(self.netD_A(self.fake_B), 
     True)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # GAN loss D_B(G_B(B))
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_G_B = self.criterionGAN(self.netD_B(self.fake_A), 
     True)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # Forward cycle loss || G_B(G_A(A)) - A||
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_cycle_A = self.criterionCycle(self.rec_A, self.real_A) * lambda_A
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # Backward cycle loss || G_A(G_B(B)) - B||
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_cycle_B = self.criterionCycle(self.rec_B, self.real_B) * lambda_B
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # combined loss and calculate gradients
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_G = self.loss_G_A + self.loss_G_B + self.loss_cycle_A + self.loss_cycle_B + self.loss_idt_A + self.loss_idt_B
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_G.backward()

我们很容易理解，loss_G_A就是相应的GAN loss中的生成器G的项，loss_cycle_A就是cycle consistency loss中的项。

分别为GAN loss和L1 loss


 
   
   
   
   
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
                  
     # define loss functions
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.criterionGAN = networks.GANLoss(opt.gan_mode).to(self.device)  
     # define GAN loss.
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.criterionCycle = torch.nn.L1Loss()
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.criterionIdt = torch.nn.L1Loss()

2.3 Idt loss

idt loss是什么论文主要框架之中没有提及，cycle_gan_model.py之中对它的定义是这样：

parser.add_argument('--lambda_identity', type=float, default=0.5, help='use identity mapping. Setting lambda_identity other than 0 has an effect of scaling the weight of the identity mapping loss. For example, if the weight of the identity loss should be 10 times smaller than the weight of the reconstruction loss, please set lambda_identity = 0.1')

idt loss的定义再论文的application之中，防止input 与out put之间的color compostion过多。网络所有的loss的定义就是，reconstruction loss就是GAN loss和cycle consistency loss两个加在一起，GAN loss用于迁移类，cycle consistency loss用于尽量保留原图可以循环迁移。但是还有一个更直观的loss叫idt loss尽量的避免迁移过多。

2.4 定义位置汇总

GAN loss前无系数，
idt loss前面两个系数，lambda_B与lambda_idt
cycle loss前一个系数，ldmbda_B


 
   
   
   
   
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     if lambda_idt > 
     0:
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
                  
     # G_A should be identity if real_B is fed: ||G_A(B) - B||
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.idt_A = self.netG_A(self.real_B)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.loss_idt_A = self.criterionIdt(self.idt_A, self.real_B) * lambda_B * lambda_idt
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
                  
     # G_B should be identity if real_A is fed: ||G_B(A) - A||
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.idt_B = self.netG_B(self.real_A)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.loss_idt_B = self.criterionIdt(self.idt_B, self.real_A) * lambda_A * lambda_idt
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     else:
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.loss_idt_A = 
     0
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 self.loss_idt_B = 
     0
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
       
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # GAN loss D_A(G_A(A))
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_G_A = self.criterionGAN(self.netD_A(self.fake_B), 
     True)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # GAN loss D_B(G_B(B))
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_G_B = self.criterionGAN(self.netD_B(self.fake_A), 
     True)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # Forward cycle loss || G_B(G_A(A)) - A||
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_cycle_A = self.criterionCycle(self.rec_A, self.real_A) * lambda_A
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     # Backward cycle loss || G_A(G_B(B)) - B||
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             self.loss_cycle_B = self.criterionCycle(self.rec_B, self.real_B) * lambda_B

三、更改与实验

3.1 定义及更改位置

cycle_gan_model.py之中定义与更改


 
   
   
   
   
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     class CycleGANModel(BaseModel):之中
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     @staticmethod
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     def modify_commandline_options(parser, is_train=True):


 
   
   
   
   
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             For CycleGAN, 
     in addition to GAN losses, we introduce lambda_A, lambda_B, and lambda_identity 
     for the following losses.
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             A (
     source domain), B (target domain).
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             Generators: G_A: A -> B; G_B: B -> A.
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             Discriminators: D_A: G_A(A) vs. B; D_B: G_B(B) vs. A.
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             Forward cycle loss:  lambda_A * ||G_B(G_A(A)) - A|| (Eqn. (2) 
     in the paper)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             Backward cycle loss: lambda_B * ||G_A(G_B(B)) - B|| (Eqn. (2) 
     in the paper)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             Identity loss (optional): lambda_identity * (||G_A(B) - B|| * lambda_B + ||G_B(A) - A|| * lambda_A) (Sec 5.2 
     "Photo generation from paintings" 
     in the paper)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
             Dropout is not used 
     in the original CycleGAN paper.
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
              
     ""
     "
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
             parser.set_defaults(no_dropout=True)  # default CycleGAN did not use dropout
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
             if is_train:
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
                 parser.add_argument('--lambda_A', type=float, default=10.0, help='weight for cycle loss (A -> B -> A)')
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
                 parser.add_argument('--lambda_B', type=float, default=10.0, help='weight for cycle loss (B -> A -> B)')
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
                 parser.add_argument('--lambda_identity', type=float, default=0.5, help='use identity mapping. Setting lambda_identity other than 0 has an effect of scaling the weight of the identity mapping loss. For example, if the weight of the identity loss should be 10 times smaller than the weight of the reconstruction loss, please set lambda_identity = 0.1')
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
     
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
             return parser

这里设置相应的值，直接对default 进行更改即可，也可以输入命令行进行相应的更改，命令行后加上：

--lambda_A 10 --lambda_B 10

3.2 测试时会打出相应参数信息

四、训练中loss值常见变化

About loss curve

Unfortunately, the loss curve does not reveal much information in training GANs, and CycleGAN is no exception. To check whether the training has converged or not, we recommend periodically generating a few samples and looking at them.

作者给出，loss值对于实际的效果并没有影响，因为一个生成器和判别器的矛盾在于loss值，因此loss曲线并不能提现模型的性能。

4.1 常见loss

实际训练过程中可以根据loss值判断训练结果如何。几个值都是越小越好。

env/bin/python /home/xingxiangrui/pytorch-CycleGAN-and-pix2pix/train.py --dataroot /home/xingxiangrui/pytorch-CycleGAN-and-pix2pix/datasets/norText_2_cotton --name norText_2_cotton_cyclegan --model cycle_gan --no_html

运行成功：


 
   
   
   
   
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     [xingxiangrui@yq01-gpu-yq-face
     -21
     -5 ~]$ env/bin/python /home/xingxiangrui/pytorch-CycleGAN-
     and-pix2pix/train.py --dataroot /home/xingxiangrui/pytorch-CycleGAN-
     and-pix2pix/datasets/norText_2_cotton --name norText_2_cotton_cyclegan --model cycle_gan
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     ----------------- Options ---------------
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                    batch_size: 
     1
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                         beta1: 
     0.5
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
               checkpoints_dir: ./checkpoints
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                continue_train: 
     False
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     crop_size: 
     256
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                      dataroot: /home/xingxiangrui/pytorch-CycleGAN-
     and-pix2pix/datasets/norText_2_cotton	[default: 
     None]
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                  dataset_mode: unaligned
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     direction: AtoB
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                   display_env: main
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                  display_freq: 
     400
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                    display_id: 
     1
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                 display_ncols: 
     4
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                  display_port: 
     8097
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                display_server: http://localhost
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
               display_winsize: 
     256
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                         epoch: latest
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                   epoch_count: 
     1
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                      gan_mode: lsgan
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                       gpu_ids: 
     0
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     init_gain: 
     0.02
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     init_type: normal
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                      input_nc: 
     3
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                       isTrain: 
     True                          	[default: 
     None]
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                      lambda_A: 
     10.0
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                      lambda_B: 
     10.0
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
               lambda_identity: 
     0.5
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     load_iter: 
     0                             	[default: 
     0]
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     load_size: 
     286
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                            lr: 
     0.0002
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                lr_decay_iters: 
     50
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     lr_policy: linear
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
              max_dataset_size: inf
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                         model: cycle_gan
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                    n_layers_D: 
     3
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                          name: norText_2_cotton_cyclegan     	[default: experiment_name]
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                           ndf: 
     64
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                          netD: basic
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                          netG: resnet_9blocks
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                           ngf: 
     64
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                         niter: 
     100
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                   niter_decay: 
     100
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                    no_dropout: 
     True
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                       no_flip: 
     False
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                       no_html: 
     False
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                          norm: instance
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                   num_threads: 
     4
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     output_nc: 
     3
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                         phase: train
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                     pool_size: 
     50
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                    preprocess: resize_and_crop
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                    print_freq: 
     100
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                  save_by_iter: 
     False
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
               save_epoch_freq: 
     5
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
              save_latest_freq: 
     5000
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                serial_batches: 
     False
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                        suffix:
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
              update_html_freq: 
     1000
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
                       verbose: 
     False
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     ----------------- End -------------------
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     dataset [UnalignedDataset] was created
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     The number of training images = 
     100
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     initialize network 
     with normal
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     initialize network 
     with normal
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     initialize network 
     with normal
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     initialize network 
     with normal
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     model [CycleGANModel] was created
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     ---------- Networks initialized -------------
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     [Network G_A] Total number of parameters : 
     11.378 M
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     [Network G_B] Total number of parameters : 
     11.378 M
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     [Network D_A] Total number of parameters : 
     2.765 M
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     [Network D_B] Total number of parameters : 
     2.765 M
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     -----------------------------------------------
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     。。。
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     create web directory ./checkpoints/norText_2_cotton_cyclegan/web...
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     1, iters: 
     100, time: 
     0.896, data: 
     1.052) D_A: 
     0.384 G_A: 
     0.232 cycle_A: 
     1.791 idt_A: 
     0.739 D_B: 
     0.572 G_B: 
     0.620 cycle_B: 
     2.002 idt_B: 
     0.851
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     End of epoch 
     1 / 
     200 	 Time Taken: 
     92 sec
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     learning rate = 
     0.0002000
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     2, iters: 
     100, time: 
     0.865, data: 
     0.214) D_A: 
     0.219 G_A: 
     0.304 cycle_A: 
     1.499 idt_A: 
     0.597 D_B: 
     0.305 G_B: 
     0.699 cycle_B: 
     1.118 idt_B: 
     0.711
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     End of epoch 
     2 / 
     200 	 Time Taken: 
     87 sec
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     learning rate = 
     0.0002000
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     。。。
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     195, iters: 
     100, time: 
     0.865, data: 
     0.209) D_A: 
     0.016 G_A: 
     0.836 cycle_A: 
     0.584 idt_A: 
     0.168 D_B: 
     0.124 G_B: 
     0.346 cycle_B: 
     0.530 idt_B: 
     0.181
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     saving the model at the end of epoch 
     195, iters 
     19500
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     End of epoch 
     195 / 
     200 	 Time Taken: 
     88 sec
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     learning rate = 
     0.0000119
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     196, iters: 
     100, time: 
     1.197, data: 
     0.237) D_A: 
     0.036 G_A: 
     0.737 cycle_A: 
     0.590 idt_A: 
     0.133 D_B: 
     0.014 G_B: 
     0.271 cycle_B: 
     0.425 idt_B: 
     0.186
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     End of epoch 
     196 / 
     200 	 Time Taken: 
     87 sec
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     learning rate = 
     0.0000099
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     197, iters: 
     100, time: 
     0.871, data: 
     0.218) D_A: 
     0.031 G_A: 
     0.756 cycle_A: 
     0.533 idt_A: 
     0.113 D_B: 
     0.037 G_B: 
     0.511 cycle_B: 
     0.370 idt_B: 
     0.160
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     End of epoch 
     197 / 
     200 	 Time Taken: 
     86 sec
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     learning rate = 
     0.0000079
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     198, iters: 
     100, time: 
     0.856, data: 
     0.217) D_A: 
     0.063 G_A: 
     0.509 cycle_A: 
     0.634 idt_A: 
     0.123 D_B: 
     0.308 G_B: 
     0.492 cycle_B: 
     0.478 idt_B: 
     0.222
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     End of epoch 
     198 / 
     200 	 Time Taken: 
     86 sec
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     learning rate = 
     0.0000059
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     199, iters: 
     100, time: 
     0.903, data: 
     0.203) D_A: 
     0.033 G_A: 
     0.981 cycle_A: 
     0.515 idt_A: 
     0.110 D_B: 
     0.111 G_B: 
     0.531 cycle_B: 
     0.381 idt_B: 
     0.167
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     End of epoch 
     199 / 
     200 	 Time Taken: 
     86 sec
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     learning rate = 
     0.0000040
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     200, iters: 
     100, time: 
     1.200, data: 
     0.219) D_A: 
     0.017 G_A: 
     1.035 cycle_A: 
     0.613 idt_A: 
     0.106 D_B: 
     0.030 G_B: 
     0.726 cycle_B: 
     0.384 idt_B: 
     0.200
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     saving the latest model (epoch 
     200, total_iters 
     20000)
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     saving the model at the end of epoch 
     200, iters 
     20000
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     End of epoch 
     200 / 
     200 	 Time Taken: 
     89 sec
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     learning rate = 
     0.0000020

loss值越小，则训练越成功。最终D_A收敛于，一般看D的loss越小，则表明训练结果更好一些。

增大lambda为40之后，loss为：


 
   
   
   
   
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     ================ Training Loss (Mon Apr  
     1 
     11:
     46:
     05 
     2019) ================
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     1, iters: 
     100, time: 
     0.600, data: 
     0.176) D_A: 
     0.224 G_A: 
     0.485 cycle_A: 
     5.948 idt_A: 
     5.620 D_B: 
     0.410 G_B: 
     0.693 cycle_B: 
     9.939 idt_B: 
     2.715
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     2, iters: 
     100, time: 
     0.604, data: 
     0.169) D_A: 
     0.251 G_A: 
     0.731 cycle_A: 
     5.778 idt_A: 
     4.086 D_B: 
     0.497 G_B: 
     1.078 cycle_B: 
     6.170 idt_B: 
     2.712
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     3, iters: 
     100, time: 
     0.597, data: 
     0.163) D_A: 
     0.201 G_A: 
     0.586 cycle_A: 
     5.058 idt_A: 
     6.942 D_B: 
     0.219 G_B: 
     0.741 cycle_B: 
     13.409 idt_B: 
     2.129
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     4, iters: 
     100, time: 
     0.838, data: 
     0.185) D_A: 
     0.123 G_A: 
     0.200 cycle_A: 
     5.216 idt_A: 
     1.311 D_B: 
     0.128 G_B: 
     0.740 cycle_B: 
     2.606 idt_B: 
     2.367
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     5, iters: 
     100, time: 
     0.597, data: 
     0.146) D_A: 
     0.113 G_A: 
     0.472 cycle_A: 
     6.259 idt_A: 
     1.344 D_B: 
     0.258 G_B: 
     0.829 cycle_B: 
     3.239 idt_B: 
     2.951
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     6, iters: 
     100, time: 
     0.598, data: 
     0.192) D_A: 
     0.088 G_A: 
     0.731 cycle_A: 
     3.720 idt_A: 
     1.364 D_B: 
     0.142 G_B: 
     2.097 cycle_B: 
     3.516 idt_B: 
     1.719
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     7, iters: 
     100, time: 
     0.601, data: 
     0.170) D_A: 
     0.261 G_A: 
     0.691 cycle_A: 
     5.233 idt_A: 
     2.105 D_B: 
     0.788 G_B: 
     1.213 cycle_B: 
     4.088 idt_B: 
     2.316
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     8, iters: 
     100, time: 
     0.986, data: 
     0.156) D_A: 
     0.108 G_A: 
     0.938 cycle_A: 
     4.672 idt_A: 
     3.141 D_B: 
     0.062 G_B: 
     0.983 cycle_B: 
     5.727 idt_B: 
     2.015
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     9, iters: 
     100, time: 
     0.599, data: 
     0.175) D_A: 
     0.072 G_A: 
     0.883 cycle_A: 
     4.078 idt_A: 
     0.846 D_B: 
     0.057 G_B: 
     0.977 cycle_B: 
     2.139 idt_B: 
     1.904
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     10, iters: 
     100, time: 
     0.599, data: 
     0.159) D_A: 
     0.142 G_A: 
     0.473 cycle_A: 
     4.346 idt_A: 
     1.358 D_B: 
     0.077 G_B: 
     0.753 cycle_B: 
     3.725 idt_B: 
     2.112
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     。。。
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     195, iters: 
     100, time: 
     0.602, data: 
     0.164) D_A: 
     0.020 G_A: 
     0.723 cycle_A: 
     1.798 idt_A: 
     0.337 D_B: 
     0.034 G_B: 
     0.554 cycle_B: 
     1.263 idt_B: 
     0.681
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     196, iters: 
     100, time: 
     0.919, data: 
     0.162) D_A: 
     0.009 G_A: 
     1.077 cycle_A: 
     1.783 idt_A: 
     0.317 D_B: 
     0.055 G_B: 
     0.737 cycle_B: 
     1.220 idt_B: 
     0.642
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     197, iters: 
     100, time: 
     0.602, data: 
     0.155) D_A: 
     0.008 G_A: 
     1.063 cycle_A: 
     1.974 idt_A: 
     0.321 D_B: 
     0.149 G_B: 
     0.443 cycle_B: 
     1.102 idt_B: 
     0.725
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     198, iters: 
     100, time: 
     0.599, data: 
     0.172) D_A: 
     0.007 G_A: 
     0.800 cycle_A: 
     1.763 idt_A: 
     0.450 D_B: 
     0.225 G_B: 
     0.888 cycle_B: 
     1.459 idt_B: 
     0.811
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     199, iters: 
     100, time: 
     0.599, data: 
     0.153) D_A: 
     0.009 G_A: 
     1.097 cycle_A: 
     1.814 idt_A: 
     0.325 D_B: 
     0.082 G_B: 
     0.636 cycle_B: 
     1.103 idt_B: 
     0.709
    
      
      
      
      
   
     
     
     
     
    
    
    
    
   
     
     
     
     
    
      
      
      
      
   
     
     
     
     
   
     
     
     
     
    
      
      
      
      
       
       
       
       
     (epoch: 
     200, iters: 
     100, time: 
     0.946, data: 
     0.170) D_A: 
     0.009 G_A: 
     0.976 cycle_A: 
     1.923 idt_A: 
     0.319 D_B: 
     0.151 G_B: 
     0.608 cycle_B: 
     1.062 idt_B: 
     0.922

4.2 运行及存储位置

loss会进行相应运算并print出来，存于check points文件夹，之中模型的loss_log.txt之中，可以cat loss_log.txt打出loss信息。

注意，这个loss值是加了系数之后的loss，即乘了相应的lambda系数，之后打出的loss

深度学习论文阅读路线图喜欢打酱油的老鸟深度学习论文阅读路线图深度学习论文阅读路线图论文阅读路线图
https://www.toutiao.com/a6703859415763649031/作者：floodsun编译：ronghuaiyang这是作者一年前整理的东西，有些最新的论文没有包含进去，但是对于新手来说，入门足够了！如果你是深度学习领域的新人，你的第一个问题可能是“我该从哪些论文开始读起呢？”这就是深度学习论文的阅读路线图！这个路线图是根据下面几个规则构建的：从概要到细节从老的到最新的业
深度学习论文阅读：Generative Pre-Training(GPT) 阿正的梦工坊 DL Papers 深度学习 GPT BERT transformer
文章目录GPTAbstract1Introduction6Conclusion2RelatedWork3Framework3.1Unsupervisedpre-trainingGPT和BERT的区别3.2Supervisedfine-tuning3.3Task-specificinputtransformations4Experiments总结参考GPT核心点：预训练一个transformerde
推荐·人工智能+深度学习论文阅读小组我的昵称违规了
Pytorch学习到第5篇论文，这篇论文解读很少，就在网上搜了一下，不经意发现这个小组，推荐给大家。似乎不让放外链？我试一下PaperWeeklyPaperWeekly论文阅读小组阅读论文是小众活动，阅读者分散在全球各地。PaperWeekly论文阅读小组，把分散在全球的华人阅读者，聚合在一起。不仅互帮互助读懂论文，而且通过讨论，激发灵感。进入PaperWeekly的网站，阅读者不仅可以看到本周热
【深度学习论文阅读】四大分类网络之AlexNet 禾风wyh 深度学习分类数据挖掘人工智能
ImageNetClassificationwithDeepConvolutionNerualNetworks论文原文：ImageNetClassificationwithDeepConvolutionalNeuralNetworks1引言解决的问题：提高效率（GPU训练），防止过拟合（dropout）关键点：·大量带标签数据——ImageNet·高性能计算资源——GPU（GPU搭配了高度优化的2
深度学习论文阅读目标检测篇（五）中文版：YOLOv2《 YOLO9000: Better, Faster, Stronger》 AiCharm 深度学习论文阅读深度学习目标检测计算机视觉
深度学习论文阅读目标检测篇（五）中文版：YOLOv2《YOLO9000:Better,Faster,Stronger》摘要1.引言2.更好3.更快4.更强5.结论摘要摘要我们引入了一个先进的实时目标检测系统YOLO9000，可以检测超过9000个目标类别。首先，我们提出了对YOLO检测方法的各种改进，既有新发明的一些东西，也参考了前人的工作。改进后的模型YOLOv2在PASCALVOC和COC
深度学习论文阅读目标检测篇（五）中英对照版：YOLOv2《 YOLO9000: Better, Faster, Stronger》 AiCharm 深度学习论文阅读目标检测深度学习计算机视觉
深度学习论文阅读目标检测篇（五）中文版：YOLOv2《YOLO9000:Better,Faster,Stronger》Abstract摘要1.Introduction1.引言2.Better2.更好3.Faster3.更快4.Stronger4.更强5.Conclusion5.结论Abstract AbstractWeintroduceYOLO9000,astate-of-the-art,rea
深度学习论文阅读：Convolutional Neural Networks for Sentence Classification （TextCNN）空腹熊猫自然语言处理机器学习论文
这是一篇将CNN运用于句子分类的论文摘要Wereportonaseriesofexperimentswithconvolutionalneuralnetworks(CNN)trainedontopofpre-trainedwordvectorsforsentence-levelclassificationtasks.WeshowthatasimpleCNNwithlittlehyperparame
深度学习论文阅读目标检测篇（四）中英文对照版：YOLOv1《 You Only Look Once: Unified, Real-Time Object Detection》 Jasper0420 深度学习论文阅读深度学习计算机视觉目标检测神经网络
深度学习论文阅读目标检测篇（四）中英文对照版：YOLOv1《YouOnlyLookOnce:Unified,Real-TimeObjectDetection》Abstract摘要1.Introduction引言2.UnifiedDetection统一的检测2.1NetworkDesign网络设计2.2Training训练2.3Inference推断2.4LimitationsofYOLOYOLO的
深度学习论文阅读图像分类篇（一）：AlexNet《ImageNet Classification with Deep Convolutional Neural Networks》 Jasper0420 深度学习论文阅读深度学习 cnn python 人工智能计算机视觉
深度学习论文阅读图像分类篇（一）：AlexNet《ImageNetClassificationwithDeepConvolutionalNeuralNetworks》Abstract摘要1.Introduction引言2.TheDataset数据集3.TheArchitecture架构3.1非线性ReLU函数3.2在多GPU上训练3.3局部响应归一化3.4重叠池化3.5整体架构4.减少过拟合4.1
深度学习论文阅读图像分类篇（二）：ZFNet《Visualizing and Understanding Convolutional Networks》 Jasper0420 深度学习论文阅读深度学习神经网络机器学习算法网络
深度学习论文阅读（二）：ZFNet《VisualizingandUnderstandingConvolutionalNetworks》Abstract摘要1.Introduction引言1.1RelatedWork相关工作2.Approach方法2.1VisualizationwithaDeconvnet通过反卷积可视化3.TrainingDetails训练细节4.ConvnetVisualiza
神经网络深度学习论文阅读 Niklauseik 深度学习人工智能机器学习
Thisfigureshowsmyclassificationandsummaryofthesepapers.Myreadingnotesarebelow.Eachnotefollowingtheheadlineisdividedintoseveralparts,whicharethesummary,advantages,evaluationandimprovementofthepaper.Lea
深度学习论文阅读路线图 ronghuaiyang
请点击上方“AI公园”，关注公众号本文选自github作者：floodsun编译：ronghuaiyang作者一年前整理的东西，有些最新的论文没有包含进去，但是对于新手来说，入门足够了！如果你是深度学习领域的新人，你的第一个问题可能是“我该从哪些论文开始读起呢？”这就是深度学习论文的阅读路线图！这个路线图是根据下面几个规则构建的：从概要到细节从老的到最新的业界领先从通用的到细分领域的聚焦业界领先的
深度学习论文阅读目标检测篇（三）：Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》 Jasper0420 深度学习论文阅读深度学习计算机视觉 python 神经网络机器学习
深度学习论文阅读目标检测篇（三）：FasterR-CNN《TowardsReal-TimeObjectDetectionwithRegionProposalNetworks》Abstract摘要1.Introduction引言2.RELATEDWORK相关工作3.FASTERR-CNN3.1RegionProposalNetworksregionproposal网络3.1.1Anchors3.1.
深度学习论文阅读图像分类篇（五）：ResNet《Deep Residual Learning for Image Recognition》 Jasper0420 深度学习论文阅读深度学习神经网络机器学习计算机视觉
深度学习论文阅读图像分类篇（五）：ResNet《DeepResidualLearningforImageRecognition》Abstract摘要1.Introduction引言2.RelatedWork相关工作3.DeepResidualLearning深度残差学习3.1.ResidualLearning残差学习3.2IdentityMappingbyShortcuts快捷恒等映射3.3Net
深度学习论文阅读（四）：GoogLeNet《Going Deeper with Convolutions》 Jasper0420 深度学习论文阅读深度学习 cnn python 人工智能计算机视觉
深度学习论文阅读（四）：GoogLeNet《GoingDeeperwithConvolutions》Abstract摘要1.Introduction引言2.RelatedWork相关工作3.MotivationandHighLevelConsiderations动机和高层思考4.ArchitecturalDetails架构细节5.GoogLeNet6.TrainingMethodology训练方法
深度学习论文阅读图像分类篇（六）：SENet《Squeeze-and-Excitation Networks》 Jasper0420 深度学习论文阅读深度学习机器学习 python 算法
深度学习论文阅读图像分类篇（六）：SENet《Squeeze-and-ExcitationNetworks》Abstract摘要1.Introduction引言2.RelatedWork相关工作3.Squeeze-and-ExcitationBlocks3.1.Squeeze:GlobalInformationEmbedding全局信息嵌入3.2.Excitation:AdaptiveRecali
深度学习论文阅读目标检测篇（七）中文版：YOLOv4《Optimal Speed and Accuracy of Object Detection》 Jasper0420 深度学习论文阅读深度学习目标检测计算机视觉人工智能
深度学习论文阅读目标检测篇（七）中英对照版：YOLOv4《OptimalSpeedandAccuracyofObjectDetection》Abstract摘要1.Introduction引言2.Relatedwork相关工作2.1.Objectdetectionmodels目标检测模型2.2.Bagoffreebies2.3.Bagofspecials3.Methodology方法3.1Sele
深度学习论文阅读目标检测篇（七）中英对照版：YOLOv4《Optimal Speed and Accuracy of Object Detection》 Jasper0420 深度学习论文阅读深度学习目标检测计算机视觉神经网络
深度学习论文阅读目标检测篇（七）中英对照版：YOLOv4《OptimalSpeedandAccuracyofObjectDetection》Abstract摘要1.Introduction引言2.Relatedwork相关工作2.1.Objectdetectionmodels目标检测模型2.2.Bagoffreebies2.3.Bagofspecials3.Methodology方法3.1Sele
深度学习论文阅读目标检测篇（一）：R-CNN《Rich feature hierarchies for accurate object detection and semantic...》 Jsper0420 深度学习论文阅读深度学习机器学习人工智能计算机视觉神经网络
深度学习论文阅读目标检测篇（一）：R-CNN《Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation》Abstract摘要1.Introduction引言2.ObjectdetectionwithR-CNN使用R-CNN做物体检测2.1ModuledesignRegionproposals模块设计区域推荐2.2
深度学习经典网络解析图像分类篇（七）：ResNet Jsper0420 #图像分类篇深度学习人工智能计算机视觉 cnn
深度学习经典网络解析图像分类篇（七）：ResNet1.背景介绍2.网络过深导致的问题为什么随着网络层级越深，模型效果却变差了呢？3.ResNet3.1ResNet概要3.2ResNet网络结构3.2.1残差结构3.2.2ResNet中卷积块设计3.2.3不同跳跃连接3.3RenNet创新点4.1总结ResNet论文翻译详情见我的博客：深度学习论文阅读（五）：ResNet《DeepResidualL
深度学习入门教程陈嘿萌教程深度学习入门教程研究生入门人工智能入门教程优秀博主推荐优秀资源推荐
文章目录掌握一门编程语言：`ilovePython`图书推荐编程工具Anaconda-环境管理Pycharm-代码codingPython图像处理机器学习深度学习论文阅读并实现代码版本控制管理Bilibili优秀博主推荐云服务器推荐公众号推荐学术网站推荐（wordischeap，showmethecode）论文文献工具深度学习入门路线推荐：1、我是土堆2、霹雳吧啦Wz3、同济子豪兄`更新记录`掌握
【深度学习论文阅读】TCN:An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence LawenceRay 深度学习
2018年人工智能十佳论文之一：TCN论文地址：AnEmpiricalEvaluationofGenericConvolutionalandRecurrentNetworksforSequenceModeling项目地址：TCN的github链接文章目录1.ABSTRACT2.INTRODUCTION&BACKGROUND2.1TemporalConvolutionalNetworks2.2Seq
[深度学习论文阅读]Facenet论文阅读笔记（包括GoogLenet参数计算方式） GJCfight CV方向论文阅读
论文：FaceNet:AUnifiedEmbeddingforFaceRecognitionandClustering(文章是2015年CVPR的文章)1统述功能：faceverification(isthisthesameperson)recognition(whoisthisperson)clustering(findcommonpeopleamongthesefaces)人脸识别方向论文总结
深度学习论文阅读计划（超级天坑，待填） 'Themis' 个人计划论文笔记深度学习
写在前面本文总结了自己在深度学习领域读过的一点论文，链接了自己或他人写的一些论文笔记也包含了对将来制定的论文阅读计划。将阅读笔记整理在一起是为了能融会贯通，力求梳理出统一解决某一类问题的技巧或思想，也为了成全自己在成长道路上的“满足感”。欢迎沟通，与君共勉。TableofContents写在前面简要汇总trick轻量网络CNN经典结构目标检测算法人脸识别算法视频处理算法图像对抗算法详细汇总tric
听说读论文也有trick？这篇文章告诉你深度学习论文阅读最佳姿势夕小瑶
2020年的今天，我们的专业是deeplearning，但是我们要keeplearning，每天早上一睁眼，arxiv每天更新上百篇的论文，著名微博博主@爱可可-爱生活保持也在推送最新的deeplearning资讯和论文。我们不缺少计算机视觉论文，我们缺少的是鉴别哪些应该读。无论是泛读还是精度，海量论文总是让我们迷失双眼，Github搜索awesome有成百上千个repo，但是缺少比较和注解。我们
RoadMap｜深度学习论文阅读路线图 csdn郭芮
声明：感谢THU数据派公众号（datapi）授权发布。原文：DeepLearningPapersReadingRoadmap翻译：王军福，北京理工大学，目标识别从业者。如果你是深度学习领域的一名新手，可能会遇到的第一个问题是“应该从哪篇论文开始读起呢”？这里给出了深度学习论文阅读路线图！路线图按照下面四个准则构建而成：从提纲到细节从经典到前沿从通用领域到特定领域专注于最先进的技术你将会发现很多近期
干货 | 吴恩达的课上完了？手把手教你如何科学开启你的深度学习论文阅读生涯（附链接）... DatapiTHU
来源：大数据文摘本文约4000字，建议阅读8分钟。本文为你介绍了如何学习福利阅读文章并提供建议。当你阅读了深度学习相关的书籍或者上过精彩的在线课程后，你将如何深入学习？如何才能够“自力更生”，独立地去了解相关领域中最新的研究进展？本文作者NityeshAgarwal，毕业于贾达普大学，在学校里学习过信息技术，现在作为志愿者为开源社区做贡献。以下是作者第一人称给出的建议。事先声明——我不是深度学习方
深度学习论文阅读路线图空空看春晚机器学习算法
尊重原版：http://mp.weixin.qq.com/s?__biz=MzI5MzIwNDI1MQ==&mid=2650117609&idx=3&sn=ab3453596f03bf1bca2ad2fb030806e3&chksm=f4748d9dc303048b877c549fb2d186fb168d9918a8b8144f6075f7c99956697ae3503999838b&mpshar
AI基础：深度学习论文阅读路线（127篇经典论文下载）风度78
0.导语作者：Floodsung出处：https://github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap翻译：黄海广如果您是深度学习领域的新手，那么您可能会遇到的第一个问题是“我应该从哪篇论文开始阅读？”本文是深度学习论文的阅读路线图！该路线图是根据以下四个准则构建的：从轮廓到细节从旧到最新从通用到特定领域专注于最新技术您会发现许多非
【深度学习论文阅读】计算机视觉论文汇总 LawenceRay 深度学习
名称年份作者文章名链接被引Neocognitron1980KunihikoFukushima(福岛·邦彦)Neocognitron:aself-organizingneuralnetworkmodelforamechanismofvisualpatternrecognitionhttps://link.springer.com/article/10.1007/BF003442513192TDNN1
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

CycleGAN——loss解析及更改与实验

CycleGAN（五）loss解析及更改与实验

一、论文中loss定义及含义

1.1 论文中的loss

1.2 adversarial loss

1.3 cycle consistency loss

1.4 总体loss

1.5 idt loss

二、代码中loss定义

2.1 判别器D的loss

2.2 生成器G的loss

2.3 Idt loss

2.4 定义位置汇总

三、更改与实验

3.1 定义及更改位置

3.2 测试时会打出相应参数信息

四、训练中loss值常见变化

4.1 常见loss

4.2 运行及存储位置

你可能感兴趣的:(深度学习论文阅读)