[ THUNLP-MT(9/10) ] Neural Machine Translation of Rare Words with Subword Units | Byte Pair Encoding
Sennrich在ACL’2016发表的论文,主要研究神经机器翻译模型中的未登录词问题,提出了BytePairEncoding方法,同时该方法也解决了词表过大的问题。本文在介绍Sennrich的研究工作的基础上,也介绍了中文对于未登录词的相关方法。论文传送门引用次数:944文章目录论文内容》问题》目标:不需要back-offmodel来解决未登录词问题》相关工作介绍及论点》解决方法:BytePai