BEGAN知识小结

BEGAN知识小结


本文为阅读完BEGAN论文后作出的系统小结。论文地址

简介

BEGAN是Google在17年上半年出的一篇论文,该论文对GAN做了进一步的改进,使得在没有使用一些trick的时候GAN依旧可以训练的很好,模式奔溃和训练不平衡等问题也解决的非常好。
以往的GAN都是希望生成器生成的model和真实数据的model分布尽量相近,BEGAN从loss的角度进行比较,希望生成器生成的model的loss和真实数据的model的loss分布尽量相近,由于使用的是同一个encoder和decoder去解码和编码,Autoencoder本身就会提取图像的共性,比如人脸的轮廓信息,那么当两者loss分布逼近的时候,两者model的分布也将会逼近。

BEGAN中,作者做出了以下四个贡献:

  1. 提出了一种新的简单强大GAN网络结构,使用标准的训练方式不加训练trick也能很快且稳定的收敛。
  2. 对于GAN中G,D的能力的平衡提出了一种均衡的概念。
  3. 提供了一个超参数,这个超参数可以在图像的多样性和生成质量之间做均衡。
  4. 提出了一种收敛程度的估计,这个机制只在WGAN中出现过。

结构,损失函数

BEGAN采用autoencoder结构的discriminator。
下图为BEGAN整体结构图。
BEGAN知识小结_第1张图片
其中损失函数使用的是 L1,L2 norm。

作者在论文中表示:在大量实验下发现每个pixel的重构误差实际上是独立同分布的,并且都是(近似)正态分布。根据中心极限定理,整个图像的重构误差也将服从相同的正态分布。
给定两个正太分布,可以算出这两个分布之前的Wasserstein distance:

作者提出假设是一个常数或者是关于W的递增函数。
那么基于该假设,我们可以通过最大化来最大化,根据GAN的对抗原则,D需要不断拉大W的距离即最大化,而G则是要拉近距离。

那么最大化(m1 - m2)其实有两组解。
在这里插入图片描述
在论文中作者选择的是第二组解,因为最小化么m1,最大化m2不仅可以拉大两个分布之间的距离同时也可以减小真实图片的重构误差,那么G在拉近两个分布之间的距离时最小化m2即可。

损失函数:如下图所示为BEGAN的Loss function。

在GAN的训练中非常容易出现训练不平衡的现象,即 L 和 D 训练的进度不一样导致一方的能力大于另外一方。为解决这个问题,作者提出了一个超参数来平衡双方的loss。其中:

当超参数较小时,D致力于最小化真实样本的重构误差,相对来说,而对生成样本的关注较少,这将导致生成样本的多样性降低。作者称这个超参数为diversity ratio,它控制生成样本的多样性。
为了尽可能地满足公式二,作者借鉴控制论中的“比例控制理论”(Proportional Control Theory),引入比例增益和比例控制器的输出。
完整的损失函数公式如下:

综上所述,我们可以列出一个判断收敛的指标。从以下公式中可以看出,M越小表示训练的越好。

BEGAN网络结构图如下:
BEGAN知识小结_第2张图片

Reference:
https://arxiv.org/abs/1703.10717
https://zhuanlan.zhihu.com/p/26394806
https://blog.csdn.net/qq_25737169/article/details/77575617

你可能感兴趣的:(知识梳理,AI)