阿里90后科学家研发,达摩院开源新一代AI算法模型

640?wx_fmt=png


整理 | 一一

出品 | AI科技大本营(ID:rgznai100)


AI科技大本营7月5日消息,阿里达摩院宣布开源新一代人机对话模型ESIM。该算法模型提出两年多,已被200多篇论文引用,更曾在国际顶级对话系统评测大赛(DSTC7)上获得双料冠军,将人机对话准确率的纪录提升至94.1%。


ESIM模型还被用来评测一些新提出的数据集,比如来自纽约大学的MultiNLI数据集、最近大热的来自华盛顿大学的SWAG数据集、NAACL19 Best Resource Paper常识知识QA数据集CommonsenseQA等等。


据介绍,比起业界使用最为广泛的LSTM模型,ESIM人机对话回复模型回复准确率更高。采用全新ESIM模型的人机对话回复模型,比LSTM模型回复准确率提升25%(数据来自ICASSP2019论文中Ubuntu测试集的数据)。

       640?wx_fmt=png

陈谦参加第七届对话系统技术挑战赛


ESIM模型最初由达摩院语音实验室内的90后科学家陈谦(花名潭清)研发,他博士毕业于中科大,是达摩院中最年轻的科学家之一,也是2018届的阿里星(阿里星是专门针对高校顶尖人才的一个培养计划,从应届毕业生中经过层层筛选,由技术带头人担任主管,进行重点培养,每年的阿里星平均只有20人不到)。

 

在去年DSTC 7对话系统评测大赛上,ESIM在NOESIS赛道中从麻省理工学院、约翰霍普金斯大学、IBM研究院等近20支参赛队伍中拿下该赛道两项比赛的冠军。NOESIS赛道考察AI的人机对话能力,要求AI根据给定的多轮人机对话历史,从成百到上万个句子中选出正确的回复。

 640?wx_fmt=png


ESIM模型的原理论文已于2017年发表在国际顶级自然语言处理会议ACL 2017,阿里巴巴此次开源的模型原理论文发表在了今年国际顶级语音会议ICASSP 2019上,在公开的标准数据集Ubuntu(英文)和E-commerce(中文)上均取得了目前最高的成绩。


人机对话系统及其背后的认知智能,为让机器快速准确理解人类的表达,ESIM给AI装上一套“雷达”系统,赋予它实时检索对话历史、自动去除干扰信息的能力,使它能够给出人类期待的回复。

 

目前,这一模型已在基于ESIM模型研发的智能语音点餐机、地铁语音售票机等应用中落地,还可能将给智能客服、导航软件、智能音箱等应用场景带去改变。


开源地址

https://github.com/alibaba/esim-response-selection


论文链接

https://arxiv.org/pdf/1901.02609.pdf


(*本文为 AI科技大本营整理文章,转载请联系 1092722531


精彩推荐


    阿里90后科学家研发,达摩院开源新一代AI算法模型_第1张图片

推荐阅读

  • 正态分布为何如此重要?

  • 智能文本信息抽取算法的进阶与应

  • 入门必备 | 一文读懂神经架构搜索

  • 爬虫到底违法吗?这位爬虫工程师给出了答案

  • 印度人才出口:一半美国科技企业CEO是印度裔 | 数据分析中印青年

  • 为什么说“大公司的技术顽疾根本挽救不了”

  • 25 年 IT 老兵零基础写小说,作品堪比《三体》| 人物志

  • 中小企业搭建混合云,服务器如何选?

  • 从0到1 | 文本挖掘的传统与深度学习算法

  • 一览微软在机器阅读理解、推荐系统、人机对话等最新研究进展 | ACL 2019

  • 1.2w星!火爆GitHub的Python学习100天刷爆朋友圈!

640?wx_fmt=png 你点的每个“在看”,我都认真当成了喜欢

你可能感兴趣的:(阿里90后科学家研发,达摩院开源新一代AI算法模型)