对GAN的理解

1、网络是怎么判断两幅图像相似的?

判别器D输出值是一个概率值,其公式为:,当D(x)的值越大,说明pg(x)越小,

 

判别器D的训练目标可以看成是条件概率 P=(Y=y|x)的最大似然估计,当y=1时,说明x来自于pdata,当y=0时,说明x来自与pg(x)

则极大极小问题可以变形为:

对GAN的理解_第1张图片

 

理解篇:

随机噪声图片通过生成网络生成合成图像,该图像其实就是一个数据分布Pz(),通过该数据分布,比较该数据分布Pz()和真实数据分布Pdata()之间的JS散度,来判断真实数据与合成数据之间的相似性,得到一个概率值D(x),该值越大就说明生成图像被判断为真实图像的可能性越大,即网络训练的越好。

二、GAN网络的生成和理解

1、如何生成一张假的图片

         首先给出一个简单的高维的正态分布的噪声向量,如上图所示的D-dimensional noise vector,这个时候我们可以通过仿射变换,也就是xw+b将其映射到一个更高的维度,然后将他重新排列成一个矩形,这样看着更像一张图片,接着进行一些卷积、池化、激活函数处理,最后得到了一个与我们输入图片大小一模一样的噪音矩阵,这就是我们所说的假的图片,这个时候我们如何去训练这个生成器呢?就是通过判别器来得到结果,然后希望增大判别器判别这个结果为真的概率,在这一步我们不会更新判别器的参数,只会更新生成器的参数。

         对GAN的理解_第2张图片

 

 

 

你可能感兴趣的:(深度学习理解篇)