对抗生成网络学习(四)——WGAN+爬虫生成皮卡丘图像(tensorflow实现)
一、背景 WGAN的全称为Wasserstein GAN, 是 Martin Arjovsky 等人于17年1月份提出的一个模型,该文章可以参考[1]。WGAN针对GAN存在的问题进行了有针对性的改进,但WGAN几乎没有改变GAN的结构,只是改变了激活函数和loss函数,以及截取权重,却得到了非常好的效果[2]。且WGAN的方法同样适用于DCGAN。 本文以python爬虫爬取的皮卡丘(pikachu)数据集为例,利用WGAN生成皮卡丘图像。 [1]文章链接: https://arxiv.org/abs/1701.07875 [2] DCGAN、WGAN、WGAN-GP、LSGAN、BEGAN原理总结及对比 二、WGAN原理 网上对于WGAN的解读文章介绍的非常详细,这里给出两个详细介绍的链接: [2] DCGAN、WGAN、WGAN-GP、LSGAN、BEGAN原理总结及对比 [3] 令人拍案叫绝的Wasserstein GAN 在文章《Wasserstein GAN》中,作者从数学的角度进行了大量的公式推论,指出了GAN的问题所在,并提出了四点改进方法: (1)判别器的最后一层去掉sigmoid (2)生成器和判别器的loss不取log (3)在每一轮梯度更新之后,对 权值进行截取 ,将其值约束到一个范围之内(fixed box)。文章将其截取至[-0.01, 0.01]