对于PatchGAN的理解

PatchGAN

我们知道,普通的GAN的鉴别器输出的是对于输入的进行判断的一个概率值,即将输入映射成一个实数(概率值0或者1),是对输入的一个整体上的评价。

而PatchGAN其实就是将普通GAN的判别器换成了全卷积网络。PatchGAN将输入映射为NxN的patch(矩阵) X X X i j X _{ij} Xij 的值代表每个patch为真样本的概率,将 X i j X _{ij} Xij 求均值,即为判别器最终输出, X X 其实就是卷积层输出的特征图。该矩阵等同于原始GAN中的最后的评价值用以评价生成器的生成图像。 从这个特征图可以追溯到原始图像中的某一个位置,可以看出这个位置对最终输出结果的影响。

PatchGAN的优点

普通GAN输出一个数,像是一票否决,PatchGAN输出一个矩阵,N*N矩阵中每个点(true or false)即代表原始图像中的一块小区域(这也就是patch含义)评价值,最终结果求平均,考虑到图像的不同部分的影响,就像考虑了多人的建议然后给出决定,相当于是众人投票的结果。

参考资料

[1] https://blog.csdn.net/weixin_35576881/article/details/88058040
[2] https://zhuanlan.zhihu.com/p/359287990

你可能感兴趣的:(深度学习,深度学习,计算机视觉,人工智能)