李宏毅 GAN lecture(2018)笔记_P2

1. Text to Image

李宏毅 GAN lecture(2018)笔记_P2_第1张图片
traditional supervised approach

  传统的监督学习产生image会带来图片模糊的问题, 因为你给他Text:"train", 给它的是一堆形态完全不同的火车图片, 它学出来的就是这些图像的平均

李宏毅 GAN lecture(2018)笔记_P2_第2张图片
conditional GAN

  conditional gan的任务变成了两个, 一个是判断生成的图像是否是realistic, 还有一个是给的c(description)和x(生成的图像)是否能够match起来, 就是不止说D要给生成的图像低分, 并且如果c和x对应不上, 就是指鹿为马的情况, 也要给低分

李宏毅 GAN lecture(2018)笔记_P2_第3张图片
conditional GAN training scheme

  training conditional GAN和普通GAN的区别在于不只是G产生的图要给低分, 图是real的, 但是是和C不能匹配的也要给低分

李宏毅 GAN lecture(2018)笔记_P2_第4张图片
Conditional GAN Discriminator

  将Discriminator分成了两个Network来训练, 就是用两个Discriminator来训练两种错误(图片不像realistic & 图片和描述不匹配)

李宏毅 GAN lecture(2018)笔记_P2_第5张图片
Stack GAN

  Stack GAN的思路是先产生小张图, 然后根据这些小张图再产生大张图

李宏毅 GAN lecture(2018)笔记_P2_第6张图片
Image to Image Gan
李宏毅 GAN lecture(2018)笔记_P2_第7张图片
Traditional supervised approach

  还是一样的问题, 如果用传统方法就是要pixel和pixel的距离尽量近, 那产生的图片也是比较模糊的, 这个问题在SR的应用上应该也是同样的问题, 就是用l1/l2 loss train出来的图像会比较blurry

李宏毅 GAN lecture(2018)笔记_P2_第8张图片
image to image GAN scheme

  GAN的问题是它会产生一些原来没有的奇怪的东西, 比如下面"GAN"那张图上左上角的那个不知道是烟囱还是窗户的东西, 所以在loss里面还会包括l1 loss的部分, 希望Generate图像在大局之外, 从pixel的角度也接近target

李宏毅 GAN lecture(2018)笔记_P2_第9张图片
patch GAN

  只让discriminator检查图像的一小部分patch, 如果要检查整张图像, D的参数量需要比较大, 很容易就over-fitting, 不好训练

李宏毅 GAN lecture(2018)笔记_P2_第10张图片
Conditional GAN for Speech Enhance

  那其实图像的Noise reduction用GAN来做的话也是同样的方法, 我有个疑问, 为什么SR/deBlur的两个GAN里, 没有看到D有这个判断是否是fake pair的作用, 就是为什么D不用判断我生成的fake图像是否和noise图像是pair的, 只用判断我生成的fake图像是否是fake图像

李宏毅 GAN lecture(2018)笔记_P2_第11张图片
Conditional GAN for Video Generation

  这个思路实际上就可以用来做MEMC

你可能感兴趣的:(李宏毅 GAN lecture(2018)笔记_P2)