⬆⬆⬆ 点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
作为地球上最高级的智慧生命,人类始终对构建一种与自己高度类似的智能形式充满着热情。自 1956 年的达特茅斯会议起,人工智能已发展为了一门枝繁叶茂的朝阳学科。尤其是进入新千年后,随着计算能力的提升与深度学习理论的逐渐成熟,人工智能技术在各个研究领域大放异彩,并在巨大商业价值的驱动下,走进了千家万户。然而,随着人工智能研究走进深水区,传统的基于深度学习的「感知」技术已经逐渐无法满足学术研究和产业应用的需求,人们对于研发更准确、更鲁棒、更具可解释性、更安全的人工智能技术的呼声日益高涨,并期待其在自动驾驶、智慧金融、电子商务、交通物流等领域有更加深入的应用。
2020 年 9 月 25 日-9 月 26 日,「2020 中国科技峰会系列活动青年科学家沙龙—人工智学术生态与产业创新」, 活动由中国科协主办,清华大学计算机系、AI TIME以及智谱·AI承办;为了迎接人工智能下一个十年的重大挑战,本次沙龙活动旨在打造有利于创新的学术生态、繁荣创新文化开展研讨、搭建青年科技工作者交流对话平台、促进青年成长成才。本次沙龙共包含 17 场精彩的学术、产业报告,还有两场非常精彩的AI TIME论道,论道嘉宾在现场进行了精彩的思辨,与线上观众互动频繁。
本次学术沙龙的主席、国家杰青、清华大学计算机系唐杰教授首先带来了题为《认知推理——人工智能的下一个浪潮》的主题报告,指出如今人工智能领域的研究正处于从「感知」走向「认知」的重要转型时期,这一思想也始终贯穿于本次学术沙龙各位各位讲者的精彩报告中。
在本次演讲中,唐杰教授首先从多跳问答系统引入,回顾了面对较为复杂的问题时,人脑会采取迭代式的的认知推理过程,并将这一过程与基于预训练语言模型的「黑盒」机器学习方法进行了对比,说明现有的人工智能技术存在「缺乏可解释性」的弊端,从而指出了将外部知识与概念融入到机器学习模型中的重要性。
图 1:认知图谱
为了实现这一目标,唐杰教授团队基于双通道理论提出了迭代式的「认知图谱」学习范式,即通过 System 1(例如,预训练的 BERT、XLNet 等模型)模拟直觉式的知识扩展过程,而 System 2(例如,基于图神经网络的知识推理)则负责对 System 1 抽取的信息价值作出判断,并将有用的信息放入 System 1 进行下一轮迭代,直到 System 2 找到令人满意的答案为止。
基于「认知图谱」范式开发的 CogQA 模型的性能在 HotpotQA 竞赛中曾持续占据榜首达 3 个月之久。实验表明,该方法的推理优势在跳数较多的问答系统中尤为凸显,且可以显示地输出推理链条,具有很强的可解释性与纠错能力。
图 2:人工智能的发展趋势
自上世纪 50 年代至今,人工智能研究经历了从「计算」、「感知」,走向「认知」的研究趋势。为了实现 System 1 的快速语义匹配,唐杰教授团队近期在图数据的自监督学习方面进行了深入的研究。对于 System 2 而言,目前大多数工作仍然着眼于提升图神经网络的决策能力,其推理能力仍有待进一步加强。
图 3:第三代人工智能
在认知智能时代,为了实现统计与知识推理、脑认知的融合计算,我们仍面临着缺乏超大规模知识图谱、以及对知识的理解能力等重大挑战。为此,以 Yoshua Bengio 为代表的一大批研究人员正探索将符号推理与深度学习相结合的计算方法。
在唐杰教授看来,人工智能下一个十年的研究主旋律是从大数据到知识,再到智能的认知推理过程。而从更长远的时间尺度上看,人工智能在未来三十年的发展方向也许是从认知推理到记忆,产生计算机的自我意识。唐杰教授从认知心理学中的全局工作理论(GWT)的角度对以上研究思路进行了高度凝练的升华与统一。
唐杰教授的精彩报告为本次学术沙龙奠定了基调,也起到了抛砖引玉的作用,指出了一系列未来人工智能研究领域亟待解决的问题:如何更好地将人类知识应用于人工智能系统?如何构建刻画物体及其之间关系的世界模型?如何实现更具可解释性的人工智能?如何提高对数据样本的利用率?如何实现大规模、安全的商业人工智能系统?本次学术沙龙中各位讲者精彩的报告则一一针对这些问题给出了自己的解决方案。
一、知识的力量:从感知到认知
在迈向强人工智能的道路上,提取人类知识并将其注入给机器系统是十分关键的一步。世界顶级学术期刊《Science》曾在 2015 年发文指出,目前深度学习在知识建模方面仍然需要更多的研究与发现。
本次学术沙龙的另一位主席、清华大学计算机系刘知远副教授,在其报告《知识指导的自然语言处理》中,通过基于 Hownet 义元知识的词嵌入与基于知识图谱的世界知识嵌入的相关工作说明,数据驱动的「感知」深度学习技术并不是人工智能的终点,人类语言及其它领域的知识对于提升深度学习系统的性能、可解释性都有着重要的意义。
图 4:知识指导的自然语言处理
在本次学术沙龙举办的《论道自然语言处理的瓶颈与曙光》圆桌讨论中,百度人工智能技术委员会主任何中军、中科院计算所研究员兰艳艳等人也就「结合知识常识发展自然语言处理非技术」这一话题展开了讨论。根据何中军老师多年从事机器翻译工作的经验来看,仅仅基于传统的统计方法和神经网络方法得到的句子翻译结果往往缺乏逻辑性,经常违背常识,而百度在未来也将积极探索将知识融入到预训练的语言模型中,从而解决上述问题。兰艳艳研究员也持类似的观点,在她看来,除了向自然语言处理模型中引入知识与常识之外,还应该结合图像、视频等多模态信息,与语言文字互为补充,达到「认知语言」的状态。
图 5:《论道自然语言处理的瓶颈与曙光》圆桌讨论掠影
而作为目前最流行的知识表征范式,知识图谱其本身也存在着巨大的有待研究的空间。来自中国人民大学信息学院的张静副教授在其报告《知识图谱融合中歧义性与异质性问题的讨论》中,首先简要对知识图谱的定义、表示方式、应用场景进行了介绍,并针对动态多源知识图谱融合的歧义性与异质性问题展开了讨论,介绍了他们如何在动态的开放学术图谱上将论文链接到已存在的作者上,以及融合异质多语言知识图谱两个方面的工作。
二、建模之王:图神经网络
图是一种人们用来表示世界中物体及其之间关系的最自然的方式。近年来,GCN、GraphSage、GAT 等一大批图神经网络方法由于其强大的建模、表征、推理能力,逐渐成为了人工智能研究领域中的「明星」。实际上,在本次学术沙龙活动的多位讲者的演讲中都可以寻觅到图神经网络技术的身影。
其中,浙江大学计算机学院杨洋副教授的报告《Time2Graph:从图视角出发的时间序列建模》与北京交通大学计算机学院万怀宇副教授的报告《时空交通数据预测方法及应用》体现了他们将图神经网络应用于特殊时序场景的独到心得。
杨洋副教授在报告中,针对用户窃电行为预测等实际问题,利用 Shapelets(具有代表性的时序子序列)表征了具有特定意义的时序信号片段,并针对 Shapelets 在不同时间点意义不同、Shapwlets 会发生演化的问题,分别提出了基于「局部因子+全局因子」、「图神经网络」的解决方案。
图6:Time2Graph 架构示意图
万怀宇副教授在报告中,针对公路、铁路、民航网络等数据,自然地运用了图来描述交通网络的空间结构,并且从时间、空间两个维度上刻画了信号的特征,尝试了利用图卷积捕获时空关系结构。基于构建的时空图预测模型,万怀宇副教授等人完成了航班的需求预测、高速公路收费定价、滴滴用户需求预测等任务。
图7:时空图卷积
三、数据当先:迁移与增强
如今,基于深度学习的人工智能技术是典型的数据驱动型技术,具有良好泛化性能的模型高度依赖于大量的、标注质量高的训练样本。然而,获取数据并进行大规模的数据标注是一件成本极高的工作。为此,来自哈尔滨工业大学的车万翔教授与清华大学自动化系的黄高副教授分别从迁移学习与数据增强两个不同的角度试图解决数据缺乏的问题。
在车万翔教授的报告《基于迁移学习的任务型对话系统研究》中,他针对任务型对话场景,指出目前深度学习技术所要求的大量高质量标注数据无法满足,并试图通过迁移学习的方法,将利用源任务训练的模型学习到的知识迁移到目标任务上,从而在目标任务上获得较好的模型性能。具体而言,车万翔教授从多任务学习、跨领域迁移学习、跨语言迁移学习三个角度分别介绍了他们在该方向的研究工作。
图8:基于迁移学习的任务型对话系统
在黄高副教授的报告《图像数据的语义层扩增方法》中,他则是选择了对数据做加法,在「深度特征插值」技术的启发下,开发了一套隐式语义增强方法,实现了自动、多样化的数据扩增。
图9:隐式语义数据增强
四、安全至上:人工智能隐私保护
现有的深度学习技术极易受到对抗性样本、逆向工程、下毒攻击等手段的攻击从而泄露用户的信息,为了将人工智能技术大规模应用于医疗、金融、生物信息等对隐私保护要求较高的场景,一大批研究人员开展了对人工智能安全的研究。
来自清华大学交叉信息研究院的马雄峰副教授带来了题为《量子密钥分发网络优化及安全性》的报告,简要地介绍了量子通讯在密码学中的应用,指出了量子密钥分发的广阔应用空间。
图10:量子密码学在瑞士大选中的应用
来自微众银行的AI资深研究员刘洋带来了题为《联邦学习金融领域的应用》的报告。微众银行是在联邦学习领域处于国际领先地位的企业,该公司的首席人工智能官杨强教授是联邦学习领域的开创者之一。在报告中,刘洋研究员介绍了微众银行为解决数据隐私保护、数据孤岛等问题在联邦学习方面的研究进展,重点说明了该技术在金融领域的应用方法。
图11:联邦学习系统架构
在本次学术沙龙举办的《论道推荐系统之“效率”》圆桌讨论中,北京邮电大学计算机学院程祥副教授认为,除了可以从技术的角度达到推荐效果与用户隐私保护之间的平衡,未来还应该积极推进相关法律法规的建设,从非技术的角度充分保护用户的隐私。
五、人工智能应用与人机交互
随着智能理论和相关计算技术的发展,将人工智能技术大规模应用于商业场景,并实现个性化、体验良好的人机交互,为人工智能下一个十年的研究注入了不竭的活力。
来自清华大学计算机系的喻纯副教授带来了题为《智能人机交互》的报告,针对人机交互的核心问题——「自然动作交互的意图理解」,介绍了他们团队在「自然动作的交互动作感知」、「自然动作意图编码」、「自然动作数据理解」方面的相关工作。
作为目前最火热、前进最光明的应用领域之一,无人驾驶技术的发展得到了学术界持续的关注和资本的青睐。小马智行联合创始人兼 CTO 楼天城博士在报告《无人驾驶——一场技术主导的「登月之旅」》中,回顾了小马智行在构建「信息收集」、「物体感知」,「决策」、「控制」等多个模块相互配合的全体系无人驾驶架构方面的努力。他指出,我们仍然处于无人驾驶研发的「上半场」(即原型车验证等可行性探索),而无人驾驶研发的「下半场」将关注如何将该技术产品化、规模化。他畅想道,在真正实现自动驾驶的时候,人、车、路的关系将被彻底改变和颠覆,车会变成人类生活的一部分,成为一种终端平台。而要想实现这一宏伟的设想,首先必须做到的是「全无人化」与「规模化量产」。
图12:「汽车大脑」示意图
除了无人驾驶,电子商务也是当下人工智能最重要应用的应用场景之一。来自新加坡国立大学的冯福利老师在报告《因果推理赋能推荐系统初探》中,针对现有的机器学习独立同分布学习假设难以满足的问题,指出需要将因果推理技术引入推荐系统模型,从而消除数据的偏差,并带来更可靠的可解释性。冯福利老师认为,在双系统理论中,System 1 的任务是学习实用工具,System 2 的任务则是学习制造工具,并且需要通过额外的循环引入因果关系,从而指导模型的训练。
来自阿里巴巴集团的高级算法专家周畅在报告《认知智能与推荐系统》中,介绍了他们受认知系统中记忆机制、知识的形成与传播机制的启发,理解用户行为,对用户进行建模,并生成个性化推荐的相关工作。
图13:受认知智能启发的推荐系统
在本次学术沙龙举办的《论道推荐系统之“效率”》圆桌讨论中,清华大学计算机系张敏副教授也发表了与阿里巴巴集团周畅博士相类似的观点,在她看来,在「知识图谱+推荐系统」研究领域中,图结构的复杂程度、问题的规模、算法的效率、有限的算力等因素极大制约着图模型的训练效果,研究人员不妨从脑认知科学领域寻求破局之法,找到质效皆优的训练方法。
此外,智谱·AI CTO 张鹏在报告《AI 驱动的智慧人才技术体系》中,就人工智能技术在人才挖掘、人才引进、人才利用、人才评价等方面的应用,介绍了如何构建 AI 驱动的智慧人才技术体系架构;学堂在线 CEO 王帅国在报告《AI 让教育更智慧》中,讨论了知识图谱、问答系统、推荐系统等人工智能技术在在线教育场景下的广阔使用场景;北京彩智科技有限公司 CEO 徐剑军在报告《DKnow深知智能——一个真正有用的行业chatbot》中,介绍了聊天机器人在工业界的具体应用,以及相关的工程经验;达闼科技研发副总裁赵开勇在报告《基于自学习的机器人决策系统》中,讨论了机器人控制中实际遇到的学习问题,并就如何提高机器人的决策能力、如何利用仿真环境进行开发等问题展开了讨论。
结语
立足学术前沿,深耕产业应用,在「2020 中国科技峰会系列活动青年科学家沙龙—人工智学术生态与产业创新」活动中,来自中科院、清华大学、北京大学、浙江大学、中国人民大学、哈尔滨工业大学等院校的青年科学家,以及来自阿里巴巴、百度、微众银行、学堂在线等企业的青年企业家们,以主题报告和圆桌论坛的形式,围绕认知智能、自动驾驶、自然语言处理、计算机视觉、人机交互、推荐系统、量子计算、联邦学习、知识图谱、智慧人才等AI领域最前沿的学术发展和产业前沿展开了讨论。
人工智能研究已经迈进了一个新的十年,从基于「感知」的深度学习研究时代走来,越来越多的研究者们将目光投向了基于知识、因果推理、图模型等新技术的「认知」人工智能研究领域,人工智能技术在无人驾驶、电子商务、智慧金融等领域的应用也逐渐往个性化、大规模化等方向纵深发展。这是人工智能研究的黄金年代,我们期待新一代的青年科学家、企业家勇立潮头,在这个崭新的时代里书写下新的科学诗篇!
AI Time欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你,请将简历等信息发至[email protected]!
微信联系:AITIME_HY
AI Time是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。
更多资讯请扫码关注
(点击“阅读原文”查看直播回放)