《GAN实战》GANs in Action 第一章

1. 训练过程

每次迭代,也就是batch完成连词训练
(a)训练鉴别器
固定生成器参数,根据反向传播总误差,运用梯度下降的方法,更新鉴别器参数,寻求最小化分类误差
(b)训练生成器
固定鉴别器参数,根据反向传播总误差,运用梯度上升的方法,更新生成器参数,寻求最大的鉴别器误差。
下一个batch重复这个过程。

2.纳什均衡

相互矛盾的双方,当任何一方无论怎么努力都不能改善他们的处境或者结果。
同样我们认为GAN 达到纳什均衡时,训练完成
(1)生成器生成的伪样本与训练集中的正式数据别无二致
(2)鉴别器能做的最有用的方法就是抛硬币,以50%的概率将每个样本分为真和假。
实际生活中有很多的例子,是个很有趣的原理,囚徒困境,智猪博弈等

3.错误勘误

9-10页两个图搞反了。

你可能感兴趣的:(深度学习)