李宏毅(7)——GAN4项内容

目录

 

1: 特征提取

1.1:infoGAN

1.2:VAE-GAN

1.3:BiGAN

1.4:Triple GAN

1.5:测试数据与训练数据的domain的匹配

用于混合特征的分离


1: 特征提取

1.1:infoGAN

实际上laten space与图像的映射是很乱的,所以很难确定某个laten space中的维度具体的意义

李宏毅(7)——GAN4项内容_第1张图片

加一个classifier,只有当c到x的映射十分整齐明显的时候,分类器才能很好地分类

c对图片有非常明确地影响,z’代表难以解释的东西

李宏毅(7)——GAN4项内容_第2张图片

李宏毅(7)——GAN4项内容_第3张图片

1.2:VAE-GAN

李宏毅(7)——GAN4项内容_第4张图片

生成器看到了图片的样子,更稳定

李宏毅(7)——GAN4项内容_第5张图片

更新En时,不仅要求图像越像越好,还要求编码符合某种分布(VAE增加的噪声)

更新De时,不仅要求图像越像越好,还要骗过判别器(要判别器给高分(编解码出来的和Generate出来的两种图像))

也有判别器做三分类的

李宏毅(7)——GAN4项内容_第6张图片

1.3:BiGAN

编解码器联手起来骗过判别器

李宏毅(7)——GAN4项内容_第7张图片

李宏毅(7)——GAN4项内容_第8张图片

为什么要这么做

李宏毅(7)——GAN4项内容_第9张图片

如果VAE和BiGAN能到达最优的话,那么效果是一样的,但是实际操作中不可能loss=0,那么最后的结果就是VAE生成的图片更像但是更模糊,BiGAN生成的图像更清晰但是不太像(更能抓住语义信息)

李宏毅(7)——GAN4项内容_第10张图片

1.4:Triple GAN

是CGAN的扩展,将Gan生成的图片和x组成对,来增加label生成器(classifier)的训练数据,label生成器的质量也是由判别器把握的。

李宏毅(7)——GAN4项内容_第11张图片

1.5:测试数据与训练数据的domain的匹配

鲁邦的特征提取器——用一个domain 判别器来训练

李宏毅(7)——GAN4项内容_第12张图片

李宏毅(7)——GAN4项内容_第13张图片

用于混合特征的分离

李宏毅(7)——GAN4项内容_第14张图片

李宏毅(7)——GAN4项内容_第15张图片

李宏毅(7)——GAN4项内容_第16张图片

为了让Phonetic Encoder不保留speaker相关的信息,我们用GAN的概念,当分类器不能区分(A+b)与(A+c)的时候,说明编码器去掉了A

李宏毅(7)——GAN4项内容_第17张图片

你可能感兴趣的:(GAN)