基于自编码器的生成对抗网络AEGAN

基于自编码器的生成对抗网络AEGAN

1 introduction

autoencoder是一个很好的特诊提取模型,然而,如果我们使用autoencoder的decoder部分来当做一个generator,效果并不好,主要原因在于,我们提取出的h本身是一个启发式的特征,没有任何显式含义,所以在利用decoder来做generation的时候,我们无法给出一个有意义的关于h的分布。
GAN最为一个很好的生成模型,同样也存在一个问题,就是生产的图像,缺乏合理的解释,并且并不是特别真实。
所以在这篇文章中,作者提出了一种新的AEGAN,利用GAN的形式来提升encoder的generation能力,而利用autoencoder来实现图像的重构,从而让生成的图像更加真实。

2 AEGAN

整个AEGAN可以看做三部分组成:encoder,decoder,discriminate。其结构如图所示。
基于自编码器的生成对抗网络AEGAN_第1张图片

encoder:对真实的图像x进行编码,从而获得一个隐含层z。
decoder:对编码的隐含层z进行解码,从而获得一个原始输入x的重构 x^
上面两部分,构成了AEGAN中autoencoder的部分,用传统的重构误差最小化的方式进行训练。
discriminate:通过一个判别器来判断输入的z是来自我们生成的一个分布,还是对真实值的特征提取。

comprehension

给定一个D,来判别输入的z是来自真实样本,还是来自某个特定分布,这和原始的GAN有着根本的区别,原始的GAN是来拟合样本 pdata 的分布,而AEGAN则是让我们提取的特征z靠近我们给定的分布 pz(z) 。这样就可以很好的解决原始autoencoder在生成的时候中间层h的特征无异议的问题。
然后在利用这个我们约束后的特征,进行重构,这样我们就可以获得一个和原始样本无限接近的新样本。这就很好的消除了原始GAN生成图像不逼真的问题。

weakness

有好处,自然也有不足。重构误差虽然解决了生成样本的真实性的问题,同时也让GAN生成的多样性大打折扣,这本身又是一个矛盾。

你可能感兴趣的:(深度学习,autoencoder)