会议时间: ATT第13期:2019年7月12~13日,ATT第14期:2019年7月14~15日
报到时间:2019年7月12日
报到地点:北京西郊宾馆会议中心(二层)-银杏大厅
上课地点:北京西郊宾馆会议中心(二层)-银杏大厅
交通指南:北京市海淀区王庄路18号
主办单位:中国中文信息学会, 中国中文信息学会学术工作委员会
承办单位:北京语言大学
会议网站:
http://conference.cipsc.org.cn/ssatt2019
在线注册地址:
http://reg.cipsc.org.cn/ssatt2019
深度学习是人工智能领域的前沿热点,已在自然语言处理、计算机视觉、语音识别、计算机围棋等任务取得了令人瞩目的成绩,获得了学术界和工业界的广泛关注。随着机器学习和深度学习技术的不断进步,近年来越来越多的研究者开始关注,如何能够让机器像人类一样阅读文本,如何让机器能够自然的与人交流,对于智能问答和对话系统的研究又再次成为了研究的热点。
为进一步普及深度学习知识、促进自然语言处理技术发展、深入探讨问答与对话的基础理论与应用开发,中国中文信息学会学术工作专委会定于2019年7月12日-13日,14日-15日,在北京西郊宾馆举办中国中文信息学会前沿技术讲习班(CIPS ATT),邀请来自研究第一线的知名青年专家学者系统讲述深度学习、问答、对话的基础知识以及最前沿的相关算法,为感兴趣的学者、学生和工程师提供一个四天的学习交流机会,快速了解有关的基本概念、研究内容、发展趋势、算法实现和开源工具。
7 月 12 日 |
||
08:30-09:00 |
开幕式,合影 |
|
09:00-12:00 |
面向自然语言处理的深度学习基础(一) |
邱锡鹏(复旦大学) |
12:00-14:00 |
午餐,午间休息 |
|
14:00-17:00 |
面向自然语言处理的深度学习基础(二) |
邱锡鹏(复旦大学) |
7 月 13 日 |
||
09:00-12:00 |
开放域语义解析 |
陈波(中国科学院软件研究所) |
韩先培(中国科学院软件研究所) |
||
12:00-14:00 |
午餐,午间休息 |
|
14:00-17:00 |
图神经网络在自然语言处理中的应用 |
张岳(西湖大学) |
7 月 14 日 |
||
09:00-12:00 |
基于深度学习的机器阅读理解 |
崔一鸣(科大讯飞) |
12:00-14:00 |
午餐,午间休息 |
|
14:00-17:00 |
问答系统 |
段楠(微软亚洲研究院) |
唐都钰(微软亚洲研究院) |
||
7 月 15 日 |
||
09:00-12:00 |
面向任务的对话系统 |
张伟男(哈尔滨工业大学) |
车万翔(哈尔滨工业大学) |
||
12:00-14:00 |
午餐,午间休息 |
|
14:00-17:00 |
开放领域人机对话系统 |
严睿(北京大学) |
17:00-17:30 |
结业仪式 |
本次讲习班邀请了在自然语言处理领域较早开展深度学习研究并取得众多成果的几位青年学者讲授深度学习理论知识,以及自然语言处理中的应用。按授课顺序,他们包括:
报告题目:面向自然语言处理的深度学习基础报告人:邱锡鹏(复旦大学) |
本报告主要介绍在自然语言处理中使得的深度学习基础知识,具体内容分为两部分:(1)理论部分:深度学习的基础知识、主要模型(卷积神经网络、循环神经网络、注意力机制等)以及将这些模型应用到具体的自然语言处理任务上;(2)实践部分:通过文本分类、序列标注、文本生成为例来讲述如何实现具体的自然语言处理模型。
邱锡鹏,复旦大学计算机科学技术学院副教授,博士生导师。于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,在ACL、EMNLP、AAAI、IJCAI等计算机学会A/B类期刊、会议上发表50余篇学术论文,引用1700余次。开源中文自然语言处理工具FudanNLP项目作者,FastNLP项目负责人。2015年入选首届中国科协人才托举工程,2017年ACL杰出论文奖,2018年获中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”。
报告题目:开放域语义解析 |
|
报告人:陈波(中国科学院软件研究所) |
|
报告人:韩先培(中国科学院软件研究所) |
语义解析(Semantic Parsing)是将自然语言句子转换为机器可识别的、可计算的语义表示的任务。语义解析是自然语言处理的核心任务之一,在智能问答、语音助手、智能机器人、代码生成等任务上具有广泛的应用。本报告将详细介绍语义解析这项任务,首先介绍语义解析任务、数据集和工具,然后依次介绍基于文法的语义解析方法(CCG,DCS等)、基于语义图构建的语义解析方法和新兴的神经语义解析方法(Seq2Seq, Seq2Act, coarse-to-fine等),最后对语义解析的前沿方向和重要挑战进行展望,包括上下文有关的语义解析(可用于对话),与周边环境有交互的语义解析(如用于机器人执行指令)。
陈波,博士,中国科学院软件研究所中文信息处理实验室助理研究员,2018年获得中国科学院大学博士学位,并获得优秀毕业生。主要研究方向为语义解析(Semantic Parsing)和自然语言理解。在ACL、COLING、NAACL等自然语言处理国际顶级会议发表学术论文多篇。参与多项国家自然科学基金重点课题以及企业合作科研项目的研发。
韩先培,博士,中国科学院软件研究所中文信息处理实验室/计算机科学国家重点实验室研究员。主要研究方向为信息抽取、知识图谱、语义解析以及智能问答系统。在ACL、SIGIR、AAAI、EMNLP等重要国际会议发表论文四十余篇。韩先培是中国中文信息学会理事,语言与知识计算专业委员会副主任,中国科学院青促会会员,入选中国科协青年人才托举计划,获得中国中文信息学会汉王青年创新奖。
报告题目:图神经网络在自然语言处理中的应用报告人:张岳(西湖大学) |
自然语言处理中的很多结构,包括序列结构、树状结构、以及有环图结构,可以归纳为普通的图结构。对图结构的神经网络编码,有助于自然语言处理任务中提取有用信息。近几年来,图神经网络在自然语言处理中得到一系列研究。这个讲座总结图神经网络的两种基本模式,即卷积图神经网络和循环图神经网络,并且讨论他们在自然语言处理中的应用。具体任务包括语义理解、信息抽取和问答等。
张岳目前是西湖大学的副教授。他的研究兴趣包括自然语言处理和计算金融。他一直致力于基础句法分析,文本生成,自然语言生成,机器翻译,信息抽取,情感分析和股票市场分析等工作。他获得了IALP 2017和COLING 2018的最佳论文奖。张岳担任Transactions of ACL编委,ACM TALLIP副主编和IEEE Transactions on Big Data副主编,以及COLING 2014/18,NAACL 2015/19,EMNLP 2015/17/19,ACL 2017/18/19的领域主席。张岳在NAACL2010,ACL 2014和EMNLP 2016/18做过讲习班。
报告题目:基于深度学习的机器阅读理解报告人:崔一鸣(科大讯飞) |
机器阅读理解(Machine Reading Comprehension)是让机器阅读并理解给定的文本并且能够回答与文本相关的问题,是目前自然语言处理领域最受关注的任务之一,也是认知智能中的典型任务。在本报告中,我们将聚焦基于深度学习的机器阅读理解,涵盖了目前主流的机器阅读理解任务,包括:填空型阅读理解、篇章抽取型阅读理解、选择型阅读理解、对话型阅读理解、开放域阅读理解等。我们将对每个任务具有代表性的数据集和经典模型进行详细介绍,并同步介绍相关中文机器阅读理解的研究发展。在报告的最后,我们将剖析近期机器阅读理解领域的研究热点,并且对未来的发展方向进行展望。
崔一鸣,科大讯飞AI研究院资深级研究员,研究主管,哈尔滨工业大学社会计算与信息检索研究中心在读博士研究生,于哈尔滨工业大学计算机科学与技术专业获得工学硕士和学士学位。长期从事阅读理解、问答系统、机器翻译等自然语言处理相关领域的研究工作。曾获国际口语机器翻译评测(IWSLT 2012、IWSLT 2014),NIST机器翻译评测(NIST OpenMT 15)多项冠军。2017年至今带领团队多次获得国际权威机器阅读理解评测冠军,其中包括SQuAD 1.1、SQuAD 2.0挑战赛冠军,国际语义评测SemEval 2018阅读理解任务冠军,对话型阅读理解挑战赛CoQA、QuAC冠军等。同时,在自然语言处理顶级及重要国际会议(ACL/AAAI/IJCAI/COLING/NAACL)上发表多篇学术论文,并担任ACL系列会议及AAAI等国际会议程序委员会委员,担任JCSL、TKDD等国际ESI期刊审稿人等学术职务。
报告题目:问答系统 |
|
报告人:段楠(微软亚洲研究院) |
|
报告人:唐都钰(微软亚洲研究院) |
本次报告将覆盖多种不同类型的问答系统和方法:首先,介绍基于表格的问答系统,包括面向表格的检索、语义解析、问题生成以及如何从单轮问答扩展到多轮问答。然后,介绍基于知识图谱的问答系统,并将重点放在对话式多轮问答,包括多轮语义解析框架以及如何融合检索模型和元学习。接下来,介绍基于图片的问答系统,并将重点放在如何将语义解析方法融合到图片问答系统中。最后,介绍基于文本的问答系统。这里我们将围绕预训练模型进行说明。本次报告的最后,将和大家讨论与问答相关的未来(可能)研究课题和方向。
段楠,博士,微软亚洲研究院自然语言计算组主管研究员,从事包括问答、对话、语义理解和搜索等在内的自然语言处理研究。《智能问答》(高教出版社)作者,其多项研究成果成功用于包括必应搜索、Cortana语音助手和微软小冰等在内的微软人工智能产品。
唐都钰,博士,微软亚洲研究院自然语言计算组研究员。从事自动问答、语义理解等自然语言处理研究,多项研究成果已经转化到微软必应搜索中。
报告题目:任务型对话系统 |
|
报告人:张伟男(哈尔滨工业大学) |
|
报告人:车万翔(哈尔滨工业大学) |
对话系统一般可以分为两种,即任务型对话系统(也称作目标导向型对话系统)和闲聊对话系统。本讲习班主要介绍任务型对话系统,其多用于垂直领域业务助理系统,如微软小娜、百度度秘、阿里小蜜以及我们研发的对话技术平台(DTP)等。这类系统具有明确需要完成的任务目标,如订餐、订票等。我们将首先介绍任务型对话系统的背景和定义,然后依次介绍其中的关键技术,包括自然语言理解(包括领域意图的识别和语义槽的填充)、对话管理(包括对话状态跟踪和对话策略优化)以及自然语言生成;接着介绍任务型对话系统的评价方法和国内外相关技术评测任务;最后对任务型对话系统的技术和应用趋势进行展望。
张伟男,哈尔滨工业大学计算机科学与技术学院副教授/博士。研究兴趣包括人机对话及自然语言处理。在ACL、AAAI、IJCAI及IEEE TKDE等CCF A类国际会议及国际顶级期刊发表论文多篇,主导研发了人机对话系统“笨笨”。目前为中国中文信息学会(CIPS)信息检索专委会委员、青年工作委员会委员,中国人工智能学会(CAAI)青年工作委员会委员。曾获黑龙江省科技进步一等奖、中国人工智能学会最佳青年成果奖、中国人工智能学会“合创杯”第二届全国青年创新创业大赛三等奖及首届“百度奖学金”。
车万翔博士,哈尔滨工业大学计算机学院教授,博士生导师,斯坦福大学访问学者,合作导师Christopher Manning教授。现任中国中文信息学会计算语言学专业委员会委员、青年工作委员会副主任;中国计算机学会高级会员、曾任YOCSEF哈尔滨主席(2016-2017年度)。在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文50余篇,其中AAAI 2013年的文章获得了最佳论文提名奖,论文累计被引用2,100余次(Google Scholar数据),H-index值为26。出版教材 2 部,译著 2 部。承担国家自然科学基金、973等多项科研项目。负责研发的语言技术平台(LTP)已被600余家单位共享,提供的在线“语言云”服务已有用户1万余人,并授权给百度、腾讯、华为等公司使用。2018年,获CoNLL多语种句法分析国际评测第1名。2015-16年,连续两年获Google Focused Research Award(谷歌专注研究奖);2016年,获黑龙江省科技进步一等奖(排名第2);2012年,获黑龙江省技术发明奖二等奖(排名第2);2010年获中国中文信息学会“钱伟长”中文信息处理科学技术奖一等奖(排名第2)、首届汉王青年创新奖(个人)等多项奖励。2017年,所主讲的《高级语言程序设计(Python)》课程获国家精品在线开放课程。
报告题目:人工智能在机对话系统中的技术现状与挑战报告人:严睿(北京大学) |
近年来,自动人机对话系统在学术界和工业界都获得了相当大的关注度,随着微软小冰百度度秘等产品的发布,以及大量人工智能公司的建立,这些对话系统背后的技术在逐步积累,也逐步解密。随着研究者的探索愈发深入,人们看到了一个对话系统逐渐从科幻电影中走进现实生活的可能。在讲座中,我将回顾人机对话的发展历程,以及随着深度学习技术盛行之后,由数据驱动模型带来的革命性改变。讲座将从人机对话的已有应用出发,再分析现有对话系统的不足,展望下一代人机对话系统的挑战。同时会分享我们组在人机对话研究所做的努力与探索,以及相应的代表性成果。
严睿,北京大学助理教授,博士生导师,前百度公司资深研发,华中师范大学与中央财经大学客座教授与校外导师。主持研发多个开放领域对话系统和服务类对话系统,发表高水平研究论文80余篇,担任多个学术会议(KDD, IJCAI, SIGIR, ACL, WWW, AAAI, CIKM, EMNLP等)的(高级)程序委员会委员及审稿人。
马少平 清华大学
孙 乐 中国科学院软件研究所
张 奇 复旦大学
张伟男 哈尔滨工业大学
于 东 北京语言大学