【课程笔记-李宏毅ML】Deep generative model

Deep generative model

课件资料
中文笔记

overview

generative models

  • PixelRNN
  • Variational Autoencoder
  • Generative Adversarial Network

PixelRNN

每次生成一个pixel
【课程笔记-李宏毅ML】Deep generative model_第1张图片

VAE(variational auto-encoder)

和auto-encoder结构相似,但在code的地方有所不同
【课程笔记-李宏毅ML】Deep generative model_第2张图片
对一个10维的数据,固定其中8维,剩下两维在二维空间中随机取点,丢入decoder中,观察其会生成什么样的图片(来观察code的每一个dim分别代表什么意思

为什么用VAE(intuition)

【课程笔记-李宏毅ML】Deep generative model_第3张图片
原来的auto-encoder是将一个code恢复成原来的图片,那如果输入一个满月和玄月之间的code,decode会输出什么?
将VAE看作在code中加上一定噪声之后,希望他还能恢复满月或者玄月的图,那满月和玄月之间的某一个code就可能既希望他输出满月也输出玄月,那可能就会输出一种介于满月和玄月之间的图,如下图所示
【课程笔记-李宏毅ML】Deep generative model_第4张图片
其中mi就是原本的code,下面的是noise,σ是神经网络自己产生的,但其variance不能过小,如果variance = 0就和auto-encoder一样了,所以需要对他做一些限制,让variance不要太小。
【课程笔记-李宏毅ML】Deep generative model_第5张图片
minimize项的图像如下,
【课程笔记-李宏毅ML】Deep generative model_第6张图片
这样minimize的时候就会获得,σ = 0,而variance接近1.最后一项mi就相当于是L2正则化啦,防止过拟合。

为什么VAE?(另一角度)

(math warning老师说这个地方不懂也没关系,后面我是真不懂了)【课程笔记-李宏毅ML】Deep generative model_第7张图片如何估计一个概率分布?高斯混合模型↓
【课程笔记-李宏毅ML】Deep generative model_第8张图片高斯混合模型其实就是很多个高斯分布叠加在一起的,当你取一个x的时候其实是在每一个高斯分布中sample,然后把他们加在一起,其中p(m)是第几个高斯分布的权重,p(x|m)是在这个分布下,sample到x的概率。
VAE就是高斯混合模型的distributed representation的版本
【课程笔记-李宏毅ML】Deep generative model_第9张图片
【课程笔记-李宏毅ML】Deep generative model_第10张图片
【课程笔记-李宏毅ML】Deep generative model_第11张图片
【课程笔记-李宏毅ML】Deep generative model_第12张图片
【课程笔记-李宏毅ML】Deep generative model_第13张图片
【课程笔记-李宏毅ML】Deep generative model_第14张图片

VAE存在的一个问题

没有办法真的产生新的图片
【课程笔记-李宏毅ML】Deep generative model_第15张图片

Generative Adversarial Network(GAN)

【课程笔记-李宏毅ML】Deep generative model_第16张图片这里是说,generator用来生成图片(generator从来没有看过真实的图片),discimnator用来判断生成的图片的是不是真的,generator根据discriminator的结果进化,discriminator也进化,如此反复。
【课程笔记-李宏毅ML】Deep generative model_第17张图片
generator可以是VAE的decoder部分,discriminator将generator产生的图片都label为0,真实的图片label为1.

【课程笔记-李宏毅ML】Deep generative model_第18张图片如何更新generator?将generator和discriminator看成一个大的神经网络,随机输入一个vector,generator生成的图片输入discriminator,希望discriminator输出1,直接用梯度下降来寻找generator的参数,但要固定discriminator的参数
【课程笔记-李宏毅ML】Deep generative model_第19张图片
CAN的实际应用还存在一些问题
【课程笔记-李宏毅ML】Deep generative model_第20张图片

你可能感兴趣的:(课程学习,机器学习)