Raki的读paper小记:Style Transformer

摘要与总结

将内容和风格在隐空间解耦在不成对文本风格迁移的是非常流行的,然而现在的模型不太行,主要体现在两点:
Raki的读paper小记:Style Transformer_第1张图片

模型

Z是经过编码后的文本表示,S是style embedding
Raki的读paper小记:Style Transformer_第2张图片

Discriminator Network

因为缺少平行语料,没法直接获得风格不为S的迁移后的监督文本,本文提出一种判别网络来从非平行预料中学习到这种监督

为了更好的保存内容,训练一个网络,用文本为X,风格不为S的样本去迁移到风格为S的文本

为了风格控制,训练一个判别网咯来辅助style transformer更好的控制生成文本的风格

Conditional Discriminator

条件判别器的作用是判别输入的文本的风格是否为S

在训练阶段,风格为S的为正类,其他的为负类

训练的目的是将正类的概率最大化
Raki的读paper小记:Style Transformer_第3张图片

Multi-class Discriminator

跟前面一个判别器不同,在这里只有一条文本输入到这个判别器,然后判别器需要输出这条文本的风格S

在网络的学习阶段,训练网络将负样本的识别概率最大化

训练

Raki的读paper小记:Style Transformer_第4张图片
把 x 和 f θ ( x , s ) f_\theta(x,s) fθ(x,s) 从负样例中判别出来
Raki的读paper小记:Style Transformer_第5张图片

Raki的读paper小记:Style Transformer_第6张图片
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

Raki的读paper小记:Style Transformer_第7张图片
总体的训练:
Raki的读paper小记:Style Transformer_第8张图片

实验

Raki的读paper小记:Style Transformer_第9张图片
Raki的读paper小记:Style Transformer_第10张图片
Raki的读paper小记:Style Transformer_第11张图片

Raki的读paper小记:Style Transformer_第12张图片

评价

我的评价是:???有点懵逼

开玩笑哈,这个style transformer借鉴了GAN的想法,自己去生成负样例然后去训练判别网络,直到收敛,我觉得这个想法挺novel的但是又还好(就是把GAN迁移到文本上),但是能实现出来确实牛逼,但是就是绕来绕去让我这个菜b有点晕,感觉可以更清晰的表达出来?

你可能感兴趣的:(读paper,NLP,transformer,深度学习,迁移学习,自然语言处理,机器学习)