GAN-多域风格迁移-StarGANv2论文解读

文章目录

  • 解决问题
  • 创新点
  • 算法
    • 损失函数
  • 实验
  • 总结

论文: 《StarGAN v2: Diverse Image Synthesis for Multiple Domains》
github: https://github.com/clovaai/stargan-v2

解决问题

常规风格迁移为一对一域迁移,当有N个域互相迁移时,则需要训练N*(N-1)个模型,显然一对一域迁移不适用于此场景。

创新点

本文提出StarGAN v2可实现多域之间互相迁移,同时开源动物脸数据集AFHQ

算法

好的图像与图像之间域的迁移应满足以下两点:
1、生成样本多样性;
2、多域可扩展性;

StarGAN V2主要包括四部分:
生成器、映射网络、风格编码、判别器;
生成器G:
在输入图片x基础上通过加入代表某域特性的风格s,允许G生成各个域的图像;
映射网络F:
提供隐向量z及域y,经过映射网络F生成风格 s ~ \tilde{s} s~
风格编码器E:
输入图片x和其对应域y,通过编码器E提取x所在域的风格编码 s ^ \hat{s} s^
判别器D:
判别器D有多个输出分支,每个分支Dy判别输入图片x是否属于域y;

损失函数

x为输入图片,y为x对应域, y ~ \tilde{y} y~为目标域
训练目标包括以下几部分:
常规对抗损失如式1,其中 s ~ = F y ~ ( z ) \tilde{s} = F_{\tilde{y}}(z) s~=Fy~(z),
GAN-多域风格迁移-StarGANv2论文解读_第1张图片
风格重构损失:
为了强化G利用F生成的风格编码 s ~ \tilde{s} s~的能力,如式2,

在这里插入图片描述
风格多样性损失:
用于强化G生成不同风格图像,如式3,其越大越好;

在这里插入图片描述
循环一致性损失:
用于保证G生成图像保留x特性;如式4,其中 s ^ = E y ( x ) \hat{s}=E_y(x) s^=Ey(x)

在这里插入图片描述

整体损失如式5
GAN-多域风格迁移-StarGANv2论文解读_第2张图片

实验

GAN-多域风格迁移-StarGANv2论文解读_第3张图片
从FID指标来看,StarGANv2生成图片与真图比较接近,同时超越其他多域迁移方法。

总结

作者提出的StarGANv2解决图像迁移中两大挑战:一个域图像到目标域图像样本多样性以及支持迁移到多个目标域。 StarGANv2超域其他多域迁移方法,并且开源动物脸数据集AFHQ。

你可能感兴趣的:(GAN,论文详解,风格迁移,计算机视觉,GAN,风格迁移)