自然语言处理研究综述

      自然语言是指汉语、英语、俄语等人们日常使用的语言,区别于人工语言,如程序设计的语言。

      自然语言处理,是指用计算机对自然语言的形、音、 义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。实现人机间的信息交流,是人工智能界、计算机科学和语言学界所共同关注的重要问题。自然语言处理的具体表现形式包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及两个流程,包括自然语言理解和自然语言生成。

       随着自然语言处理在业界的发展,比如百度、谷歌、阿里等都成立了自然语言处理的技术团队,Google在机器翻译方面,2016年发布GNMT使用最先进的训练技术,实现翻译质量的最大提升,2017年宣布其机器翻译实现了完全基于attention的transformer机器翻译网络架构,实现了新的最佳水平。阿里的自然语言处理为其产品服务,在电商平台中构建知识图谱实现智能导购,同事进行全网用户兴趣挖掘,在客服场景中运用自然语言处理技术打造机器人客服,如蚂蚁金服智能小宝等。可以说,现在自然语言处理越来越火热。那么,自然语言处理的研究体系到底是什么呢?小白查看很多资料,书籍,总结了一下目前自然语言处理的研究框架。

自然语言处理研究综述_第1张图片

你可能感兴趣的:(数据分析及算法)