Google's Multilingual Neural Machine Traslation System:Enabling Zero-Shot translation

支持多语言的翻译系统

支持多种输入语言和多种输出语言的翻译系统。

以往的方法:
(1)多编码器多解码器方案:其中每一个编码器-解码器对对应一个源语言-目标语言对。
Google's Multilingual Neural Machine Traslation System:Enabling Zero-Shot translation_第1张图片
(2)一种特定的源语言,不同的目标语言对应不同的解码器。
Google's Multilingual Neural Machine Traslation System:Enabling Zero-Shot translation_第2张图片
(3)不同的源语言对应不同的编码器,各种目标语言共享一个解码器。
Google's Multilingual Neural Machine Traslation System:Enabling Zero-Shot translation_第3张图片

谷歌的多语言神经机器翻译系统

Google's Multilingual Neural Machine Traslation System:Enabling Zero-Shot translation_第4张图片
(1)使用单模型来完成不同源语言到不同目标语言的翻译任务,可以很容易的将其扩展到新的源-目标语言组合上。
(2)系统提升了训练源不充足的语言上的翻译质量,由于模型的参数隐式地共享,所以模型能在不同语言上有较强的泛化能力。
(3)支持One-hot向量。

实现多语言是对输入数据进行调整,人为地在句子开头加上特殊字符,以标示不同的目标语言。

Zero-Shot翻译:
实验设置:
用葡萄牙语到英语和英语到西班牙语的数据进行训练,测试时要求模型直接进行葡萄牙语到西班牙语的翻译,实验表明模型可以达到和基于短语的翻译系统相当的效果。增量学习(添加一小部分葡萄牙语到西班牙语的数据),模型效果最好。

你可能感兴趣的:(CS224)