Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding

问题

数据增强是增大训练数据集,能有效解决数据不足问题

相关工作

Kurata et al. (2016a)给输出隐藏层加随机扰动,来产生不同表达。此方法确实能生成不同表达,但也在系统中加入了扰动噪音。

模型

机器翻译可以用来做数据增强,很自然。解决数据不足的问题

copy decoder

生成受限decoder

看论文时的疑问

在结合copy decoder和生成受限decoder两种结果的时候,采用的是建立分类器来预测选取其中哪种结果,是否可以综合两种结果,而不是两者取其一

你可能感兴趣的:(Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding)