机器翻译:基础与模型(Machine Translation: Foundations and Models)

引言:

这是一个教程,目的是对机器翻译的基础知识和建模方法进行较为系统的介绍,并在此基础上对机器翻译的一些前沿技术展开讨论(前身为《机器翻译:统计建模与深度学习方法》)。其内容被编纂成书,可以供计算机、人工智能相关专业高年级本科生及研究生学习之用,亦可作为自然语言处理,特别是机器翻译相关研究人员的参考资料。本书用tex编写,所有源代码均已开放。

本书共分为四个部分,每部分由若干章节组成,章节的顺序参考了机器翻译技术发展的时间脉络,同时兼顾了机器翻译知识体系的内在逻辑。

作者:肖桐 (Tong Xiao) 朱靖波 (Jingbo Zhu)

单位:东北大学自然语言处理实验室 (NEUNLPLab) / 小牛翻译 (NiuTrans Research)

顾问:姚天顺 (Tianshun Yao) 王宝库 (Baoku Wang)

机器翻译:基础与模型(Machine Translation: Foundations and Models)_第1张图片

 

内容:


Part I 机器翻译基础

  1. 机器翻译简介
  • 1.1 机器翻译的概念
  • 1.2 机器翻译简史
  • 1.3 机器翻译现状及挑战
  • 1.4 基于规则的方法
  • 1.5 数据驱动的方法
  • 1.6 推荐学习资源
  1. 统计语言建模基础
  • 2.1 概率论基础
  • 2.2 掷骰子游戏
  • 2.3 n-gram 语言模型
  • 2.4 预测与搜索
  • 2.5 小结及拓展阅读
  1. 词法分析和语法分析基础
  • 3.1 问题概述
  • 3.2 中文分词
  • 3.3 命名实体识别
  • 3.4 句法分析(短语结构分析)
  • 3.5 小结及拓展阅读
  1. 翻译质量评价
  • 4.1 译文质量评价所面临的挑战
  • 4.2 人工评价
  • 4.3 有参考答案的自动评价
  • 4.4 无参考答案的自动评价
  • 4.5 小结及拓展阅读

Part II 统计机器翻译

  1. 基于词的机器翻译建模
  • 5.1 词在翻译中的作用
  • 5.2 一个简单实例
  • 5.3 噪声信道模型
  • 5.4 统计机器翻译的三个基本问题
  • 5.5 IBM 模型1
  • 5.6 小结及拓展阅读
  1. 基于扭曲度和繁衍率的模型
  • 6.1 基于扭曲度的模型
  • 6.2 基于繁衍率的模型
  • 6.3 解码和训练
  • 6.4 问题分析
  • 6.5 小结及拓展阅读
  1. 基于短语的模型
  • 7.1 翻译中的短语信息
  • 7.2 数学建模
  • 7.3 短语抽取
  • 7.4 翻译调序建模
  • 7.5 翻译特征
  • 7.6 最小错误率训练
  • 7.7 栈解码
  • 7.8 小结及拓展阅读
  1. 基于句法的模型
  • 8.1 翻译中句法信息的使用
  • 8.2 基于层次短语的模型
  • 8.3 基于语言学句法的模型
  • 8.4 小结及拓展阅读

Part III 神经机器翻译

  1. 人工神经网络和神经语言建模
  • 9.1 深度学习与人工神经网络
  • 9.2 神经网络基础
  • 9.3 神经网络的张量实现
  • 9.4 神经网络的参数训练
  • 9.5 神经语言模型
  • 9.6 小结及拓展阅读
  1. 基于循环神经网络的模型
  • 10.1 神经机器翻译的发展简史
  • 10.2 编码器-解码器框架
  • 10.3 基于循环神经网络的翻译建模
  • 10.4 注意力机制
  • 10.5 训练及推断
  • 10.6 小结及拓展阅读
  1. 基于卷积神经网络的模型
  • 11.1 卷积神经网络
  • 11.2 基于卷积神经网络的翻译建模
  • 11.3 局部模型的改进
  • 11.4 小结及拓展阅读
  1. 基于自注意力的模型
  • 12.1 自注意力机制
  • 12.2 Transformer 架构
  • 12.3 位置编码
  • 12.4 基于点乘的多头注意力机制
  • 12.5 残差网络和层标准化
  • 12.6 前馈全连接网络子层
  • 12.7 训练
  • 12.8 推断
  • 12.9 小结及拓展阅读

Part IV 机器翻译前沿

  1. 神经机器翻译模型训练
  • 13.1 开放词表
  • 13.2 正则化
  • 13.3 对抗样本训练
  • 13.4 学习策略
  • 13.5 知识蒸馏
  • 13.6 基于样本价值的学习
  • 13.7 小结及拓展阅读
  1. 神经机器翻译模型推断
  • 14.1 面临的挑战
  • 14.2 基本问题
  • 14.3 轻量模型
  • 14.4 非自回归翻译
  • 14.5 多模型集成
  • 14.6 小结及拓展阅读
  1. 神经机器翻译结构优化
  • 15.1 注意力机制的改进
  • 15.2 神经网络连接优化及深层模型
  • 15.3 基于句法的神经机器翻译模型
  • 15.4 基于结构搜索的翻译模型优化
  • 15.5 小结及拓展阅读
  1. 低资源神经机器翻译
  • 16.1 数据的有效使用
  • 16.2 双向翻译模型
  • 16.3 多语言翻译模型
  • 16.4 无监督机器翻译
  • 16.5 领域适应
  • 16.6 小结及拓展阅读
  1. 多模态、多层次机器翻译
  • 17.1 机器翻译需要更多的上下文
  • 17.2 语音翻译
  • 17.3 图像翻译
  • 17.4 篇章级翻译
  • 17.5 小结及拓展阅读
  1. 机器翻译应用技术
  • 18.1 机器翻译的应用并不简单
  • 18.2 增量式模型优化
  • 18.3 交互式机器翻译
  • 18.4 翻译结果的可干预性
  • 18.5 小设备机器翻译
  • 18.6 机器翻译系统的部署
  • 18.7 机器翻译的应用场景

随笔

Part V 附录

  • 附录 A:开源机器翻译系统
  • 附录 B:评测任务及基准数据集
  • 附录 C:IBM模型2-5训练方法

参考文献

索引

你可能感兴趣的:(大数据)