GAN深度强化学习2

文章目录

  • Theory Behind GAN
  • General Framework
  • Tips for Improving GAN

Theory Behind GAN

GAN深度强化学习2_第1张图片
想要找出这种分布
GAN深度强化学习2_第2张图片
真实分布未知,求出近似解
GAN深度强化学习2_第3张图片
P G , P d a t a P_G,P_{data} PG,Pdata未知
GAN深度强化学习2_第4张图片
GAN深度强化学习2_第5张图片
解释:
GAN深度强化学习2_第6张图片
GAN深度强化学习2_第7张图片
GAN深度强化学习2_第8张图片
GAN深度强化学习2_第9张图片
GAN深度强化学习2_第10张图片
注: ∫ x P d a t a d x = 1 \int_{x}P_{data}dx=1 xPdatadx=1
∫ x P G d x = 1 \int_{x}P_{G}dx=1 xPGdx=1
GAN深度强化学习2_第11张图片
GAN深度强化学习2_第12张图片
GAN深度强化学习2_第13张图片
GAN深度强化学习2_第14张图片
GAN深度强化学习2_第15张图片
GAN深度强化学习2_第16张图片
GAN深度强化学习2_第17张图片
GAN深度强化学习2_第18张图片
含有max,仍然可以做微分
GAN深度强化学习2_第19张图片
GAN深度强化学习2_第20张图片

discriminator 需要多次迭代
generator 迭代次数要少
G 每次只更新一点点,这样可以保证 V ( G , D ∗ ) V(G,D^*) V(G,D)变化很小
GAN深度强化学习2_第21张图片
GAN深度强化学习2_第22张图片
D 迭代多次
G 少次
GAN深度强化学习2_第23张图片
non-saturating 非饱和
两种方式training效果差不多
GAN深度强化学习2_第24张图片
Discriminator给target较高的值,G产生的数据较低的值
GAN深度强化学习2_第25张图片
到最后,D无法分辨两种data

General Framework

f-GAN
GAN深度强化学习2_第26张图片
PQ不同时, D f ( P ∣ ∣ Q ) > 0 D_f(P||Q)>0 Df(PQ)>0
D f ( P ∣ ∣ Q ) D_f(P||Q) Df(PQ)用来衡量 PQ之间的差异
不同的f代表不同的divergence
GAN深度强化学习2_第27张图片
GAN深度强化学习2_第28张图片
穷举所有的x
conjugate 共轭
直观来看:
GAN深度强化学习2_第29张图片
f ∗ f^* f也是convex
GAN深度强化学习2_第30张图片
GAN深度强化学习2_第31张图片

GAN深度强化学习2_第32张图片
GAN深度强化学习2_第33张图片
GAN深度强化学习2_第34张图片
G 的分布太小
GAN深度强化学习2_第35张图片
G 只分布一侧

GAN深度强化学习2_第36张图片
不同的divergence 出现不同的问题
GAN深度强化学习2_第37张图片
为了避免 mode collapse ,训练多个G,每个G中取一个image

Tips for Improving GAN

GAN深度强化学习2_第38张图片
1二维空间的两条曲线,几乎没有重叠
2采样只是少量,很难overlap
GAN深度强化学习2_第39张图片
无法从 G 0 G_0 G0 更新到 G 1 G_1 G1
GAN深度强化学习2_第40张图片
GAN深度强化学习2_第41张图片
sigmoid 斜率为0,fake 无法向real 移动
GAN深度强化学习2_第42张图片wasserstein [ve]
a pile of earth 一堆土
GAN深度强化学习2_第43张图片
GAN深度强化学习2_第44张图片
每一行加起来应等于左侧值,列向也如此
GAN深度强化学习2_第45张图片
GAN深度强化学习2_第46张图片
GAN深度强化学习2_第47张图片
(WGAN 最原始的做法) weight clipping 效果不好,并不能保证 1-Lipschitz
GAN深度强化学习2_第48张图片
GAN深度强化学习2_第49张图片
梯度小于等于1,没有惩罚
无法做到 all x ,所以从 P p e n a l t y P_{penalty} Ppenalty 中 sample
GAN深度强化学习2_第50张图片
GAN深度强化学习2_第51张图片
GAN深度强化学习2_第52张图片
GAN深度强化学习2_第53张图片
GAN深度强化学习2_第54张图片
不加 GP ,则可能不会收敛

你可能感兴趣的:(GAN深度强化学习2)