DCGAN论文阅读笔记

一.论文链接

  • DCGAN
  • carpedm20/DCGAN-tensorflow

二.论文概要

  • 提出了基于卷积拓扑网络的DCAGN,并且分析验证了卷积GAN的一些限制
  • 将训练好的解码器用于分类,能达到挺好的效果
  • 可视化GAN的一些层

三.论文细节

1) CNN的三个演进

  • generator中使用反卷积来上采样,discriminator中使用strided卷积来替代池化层,从而让网络自己去学习空间采样
  • global averaging pooling来替代全连接层,作者发现这一操作提升了模型的可靠性,但是会降低模型的收敛速度。
  • BN,加速收敛以及缓解梯度弥散。在GAN中直接应用的话会导致样本震荡以及模型不稳定,作者不在generator的输出层以及discriminator的输入层加BN来防止这个问题。

2) 网络结构

  • generator中,relu为激活函数,除了输出层是用的sigmoid函数。
  • 使用bounded activation的帮助会更大一点,学的更快,能覆盖更多的训练分布中的颜色空间。
  • 在discriminator中,作者使用leaky relu作为激活函数

3) 代码

  • conv_cond_concat(image, yb),其中yb的维度为[N,1,1,class_num], image的维度为[N,H,W,C],这个方法相当于把yb复制成维度为[N,H,W,class_num],然后在最后一个维度进行concat,即返回为一个维度为[N,H,W,C+class_num]的tensor

四.参考

  1. DCGAN论文笔记+源码解析
  2. carpedm20/DCGAN-tensorflow
  3. tensorflow DCGAN 源码中 conv_cond_concat函数

你可能感兴趣的:(计算机视觉)