GAN网络的重新学习的一些内容记录

20211130 -
本篇文章属于自己在学习过程中的一些内容记录,正是因为对这些内容不理解,才有了这篇文章,同时会记录一些自己的思考,对与错请仔细斟酌。

0. 引言

经过了一年多,上次专门研究GAN是去年的时候,学习了基础的原理,也记录了一些文章;但是当时并没有使用代码跑过,比如简单的GAN或者WGAN这种。各种乱七八糟的文章在吹,什么有了这个,再也不用怕什么什么了。。。无话可说。

今年八月份的时候,我就弄过这种内容,当时也是为了学习对抗自编码器才学习了一些内容。但是那个时候,我去复现一些GAN的内容的时候,就发现了问题。一方面,大家不同的源码,不管是不同的实现方法也好,不同的实现框架也好,甚至不同的框架版本等等。一些是github上高star的仓库,一些是文章中提到的。但是这里的痛点,是说,他们给出的代码,最后可能训练也比较困难,而且,就比如说理想状态下,GAN网络判别器的准确率应该是50(讲道理,虽然在各种论文里面都看到过,但是我目前还没有实现过,使用最原始的损失函数),然后如果使用WGAN,他本身就更替了这种损失函数的评价方式,又没办法去测试。

但是,去搜索很多文章,或者github,他们给出代码之后,并没有给出是否收敛或者稳定的结果,仅仅是给列出来一个图片,说我生成了这些图片,你看这个图片效果还挺不错。之前看的一篇文章,说准确率部分实际上应该是0.7-0.8的状态,但是这个说法就跟很多论文或者文章都不一样,这就很尴尬。

目前也是属于这种比较尴尬的境地,就在这篇手记中记录一些相关的文章把,我也没办法。
(可能,这是最后一次碰这个东西了,估计弄完这部分研究内容,以后再也不会碰)

1. 文章记录

How to Develop a Conditional GAN (cGAN) From Scratch
How to Develop an Auxiliary Classifier GAN (AC-GAN) From Scratch with Keras

2. 痛点记录

2.1 WGAN的收敛

对于GAN的研究中,论文和一些博客文章,甚至一些跟风的营销号,都说GAN非常难以训练,难以收敛,然后使用WGAN能比较好的解决问题。但是实际上,即使是这样,你去测试一些代码,还是会发现,测试多次,结果都不一样。而且由于WGAN采用的度量方式和原始的GAN并不样,这个新出来的结果,也没有找到非常好的说明文档。

总结来说就是,虽然说,大家都在用这个东西,但是即使有WGAN,很多人还是利用定期生成的图片来测试质量,等于用人眼来判别质量。然后等测试这个代码的时候,这些判断指标又一飞冲天,你又什么也搞不明白。说白了,就是大家都在说他好,然后测试的时候,就仅仅利用图片来说明情况,但是对于数值型的指标却什么也不提。目前未知,我看到的文章,基本上没有提过这部分内容,不管是论文,还是网上的博客文章。

(未完待续。。。)

你可能感兴趣的:(深度学习,深度学习,对抗学习,对抗自编码器)