报告全文下载地址:https://static.aminer.cn/misc/pdf/translation.pdf
机器翻译已经发展了70年,近期谷歌、Facebook 等公司将神经网络应用在机器翻译中,更是将机器翻译的速度和质量提升了不止一个档次。 而机器翻译领域所取得的这些成就,离不开无数专家学者前赴后继的潜心研究。
机器翻译已经发展了70年,近期谷歌、Facebook 等公司将神经网络应用在机器翻译中,更是将机器翻译的速度和质量提升了不止一个档次。
而机器翻译领域所取得的这些成就,离不开无数专家学者前赴后继的潜心研究。
专家地图
图 机器翻译领域全球学者分布
上图是以“machine translation”为关键词,在AMiner数据库中得到的全球机器翻译领域人才分布图。
由图可以看到,美国在这一领域人才最多最为集中,欧洲和中国对机器翻译的研究紧跟其后,南美洲、非洲和大洋洲则人才比较匮乏。
图 机器翻译领域国内学者分布
我们以“machine translation”为关键字在AMiner数据库中对国内机器翻译领域人才进行挖掘,得到了国内机器翻译领域人才分布图。
可以看出,机器翻译研究主要集中在北京,这与北京高校众多、教育先进不无关系。
排序规则
AMiner基于发表于国际期刊会议的学术论文,对某一领域内专家进行深入挖掘,并按照相关度和影响力等对专家进行排序和分类。
排序规则参考H-index、paper、citation、专家所获得的荣誉、任职机构排名、专家Activity、Sociability、Diversity等多项指标综合计算分析,将该领域专家划分为领军人物、中坚力量和领域新星。
领军人物
Yoshua Bengio
Yoshua Bengio 是加拿大蒙特利尔大学计算机科学与运筹学系的教授,机器学习实验室(MILA)的负责人。其经典作品 Learning DeepArchitectures for AI 非常适合对深度学习感兴趣的读者作为入门读物。
Bengio的主要贡献在于他对 RNN 的一系列推动,包括经典的 neural language model,gradientvanishing 的细致讨论,word2vec 的雏形,以及现在的machinetranslation;是神经网络复兴的主要的三个发起人 之一。
Yoshua Bengio 也是 Journal of Machine Learning Research、Neural Computation和Foundations and Trends in Machine Learning 的编辑。
自1999年以来,一直与 Yann Le Cun 共同组织学习研讨会,并与他一起创建了国际代表性学习会议(ICLR)。
领军人物
Kevin Knight
Kevin Knight 在卡内基梅隆大学计算机科学获得博士学位,目前是南加州大学信息科学研究所的一名教授,机器翻译界公认的领袖,是统计机器翻译的主要倡导者之一。
他培养了一批知名学者,例如Philipp Koehn等都是其学生。同时他也是JHU的统计机器翻译夏季研讨班的主要组织者之一。
Kevin Knight 的研究兴趣包括自然语言生成器、自然语言处理、机器翻译、文本生成、密码学、人工智能、译码、计算语言学-自动语言翻译、自动文本摘要、大型词汇和分类法的构建以及与计算机的多媒体通 信等。
领军人物
Nagao Makoto
长尾真是日本国家信息通讯研究院理事长,前京都大学校长。
他是国际自然语言处理与机器翻译领域杰出学科带头人,EBMT之父,在图像和语言的智能信息处理等领域具有深厚的理论造诣并取得了丰硕的实践应用成果。
长尾真曾获得机械翻译国际联盟第一次荣誉奖章,国际人工智能财团学术研究奖,IEEE Emanuel R.Piore 等诸多奖项。
领军人物
Philipp Koehn
Philipp Koehn 毕业于南加州大学计算机科学系,目前是爱丁堡信息学院和约翰·霍普金斯大学计算机科学系的教授。
他的主要研究兴趣是统计机器翻译,并且是基于短语的机器翻译方法的发明者之一,这是2013年欧洲发明奖(EPO)研究的三个入围项目之一。
2003年,他与 Franz Josef Och 和 Daniel Marcu 合著的论文 Statistical Phrase-BasedTranslation 在机器翻译界引起了广泛关注,并被引用三千多次。基于短语的方法被广泛应用于工业的机器翻译应用中,如谷歌 翻译和亚洲在线。
领军人物
Franz Josef Och
Franz Josef Och 毕业于亚琛工业大学,是谷歌著名的研究科学家和谷歌翻译的首席架构师。目前统计机器翻译研究领域一些著名的的开源软件,如IBM模型训练工具Giza++、最大熵模型训练工具YASMET都是 他开发的。
他的主要研究包括统计机器翻译、自然语言处理和机器学习等。
在机器翻译领域的主要贡献有:把判别模型引入机器翻译,从根本上取代noisy-channel模型而成为目前的标准模型框架;简化了基于短语的模型,Och引入了相对频度,极大降低了参数估计的复杂度,这是Oc h的一个大贡献;开发并发布GIZA++。
国内活跃学者
刘群
刘群是中国科学院自然语言处理研究组组长。
主要研究方向是中文自然语言处理。具体包括汉语词法分析、汉语句法分析、语义处理、统计语言模型、辞典和语料库、机器翻译、信息提取、中文信息处理和智能交互中的大规模资源建设和中文信息处理和 智能交互中的评测技术等。
他曾负责863重点项目“机器翻译新方法的研究”和“面向跨语言搜索的机器翻译关键技术研究”等。
国内活跃学者
张民
张民是苏州大学智能计算研究所的一名教授。2003年12月,他加入新加坡信息通信研究所并于2007年在研究所建立了统计机器翻译团队。2012年加入苏州大学,并于2013年在该大学成立智能计算研究所。
他目前的研究兴趣包括机器翻译、自然语言处理、信息提取、社交网络计算、互联网智能、智能计算和机器学习。
近年来在国际顶级学报和顶级会议发表学术论文150余篇,Springer出版英文专著两部,主编Springer和IEEE CPS出版英文书籍十本。他一直积极地为研究界做贡献,组织多会议并在许多会议和讲座中进行演 讲。
国内活跃学者
周明
周明是微软亚洲研究院自然语言计算组的首席研究员和经理,是机器翻译和自然语言处理领域的专家。
他的研究兴趣包括搜索引擎、统计和神经机器翻译、问答、聊天机器人、计算机诗歌和文本挖掘等。
1989年,他设计了“CEMT-I机器翻译系统”,这是汉英机器翻译的第一个实验,获得了中国大陆政府的科学技术进步奖。
1998年,他设计了著名的中日文机器翻译软件产品J-Beijing,并获得了日本机械翻译协会2008年颁发的机器翻译产品的最高荣誉称号。
最近,周明团队与微软产品团队紧密合作,在中国(小冰)、日本(Rinna)和美国(Tay)创建了知名的chat-bot产品,拥有4000万用户。他在顶级会议(包括45+ACL论文)和NLP期刊上发表并发表了100多篇论文,获得了38项国际专利。
国内活跃学者
赵铁军
赵铁军是哈尔滨工业大学计算机科学与技术学院语言技术研究中心教授,哈工大语言语音教育部-微软重点实验室副主任。
他的研究领域包括自然语言理解、机器翻译、基于内容的网页信息处理以及应用人工智能等。
近4年来获得软件著作权7项,在国内外刊物和会议上发表论文150余篇。主持完成国家自然科学基金、国家863项目、国防预研、省部委、国际合作项目等20余项。2009年获得国防科技进步奖。
国内活跃学者
刘洋
刘洋是清华大学计算机科学与技术系特别研究员。
主要研究方向是自然语言处理,近年来从事的科研工作集中在统计机器翻译领域。
刘洋在自然语言处理和人工智能领域重要国际刊物Computational Linguistics和国际会议ACL、EMNLP、IJCAI和AAAI上发表50余篇论文,2010年在自然语言处理领域国际顶级期刊计算语言学上发表国内第一篇 长文,并且是国内第一个在ACL上做tutorial的学者。
他承担了10余项国家自然科学基金、国家重点研发计划、国家863计划、国家科技支撑计划和国际合作项目,2015年获国家自然科学基金优秀青年项目资助。
获ACL 2017杰出论文和ACL 2006优秀亚洲自然语言处理论文奖、2015年国家科技进步二等奖、2014年中国电子学会科学技术奖科技进步类一等奖等奖项。