直播时间:2020年2月11-12日为期两天
报名方式见文末
活动详情
2019年11月智源研究院启动了“2019年度智源青年科学家征集评选工作”,面向人工智能领域优势高校院所定向征集,及面向在京企事业单位公开征集相结合的方式,由各单位推荐符合基本条件的青年科学家申请人。通过组织小同行专家初评和研究院综合评议相结合的方式对申请人进行遴选,并邀请人工智能领域学科带头人及知名专家按照研究方向组织申请人进行了分组答辩。参考专家初评结果,结合申请人学术信息及研究方向特点对申请人进行综合评议,从中遴选出16名申请人,成为智源青年科学家候选人。
“智源论坛 Live | 青年科学家线上报告会”将由这16位青年科学家候选人,于2020年2月11日、12日两天,在线分享他们在各自领域的最新研究进展与经验。
活动流程
人工智能理论专题
袁洋《机器学习可靠性与算法优化》
本报告主要介绍报告人三个部分的研究工作,包括机器学习理论、机器学习可靠性和机器学习与算法优化。机器学习理论主要介绍的是SGD算法的理论分析,包括逃离鞍点与局部最小值。机器学习可靠性介绍的是对抗样本与鲁棒性相关的内容,也包括数据安全方面的研究。而机器学习与算法优化则是介绍了用算法解决机器学习问题,或者用机器学习技术设计更好的算法相关的内容。报告人的研究工作大多是从理论角度出发,尝试用理论理解实际观察到的现象,或者用理论设计新的算法。
蔡少伟《可满足性及其应用》
逻辑公式可满足性问题是逻辑学的基础问题,也是计算机科学和人工智能领域的一个核心问题,尤其是命题逻辑可满足性(SAT)和可满足性模理论(SMT)有着广泛应用,包括约束问题求解,自动规划,软硬件系统验证,定理自动证明,集成电路设计等。本报告将介绍SAT和SMT的常见求解方法,并介绍作者在这些方面的相关研究进展,包括处理局部搜索循环问题的方法,基于冲突的子句学习的一个改进方法,基于推理和搜索求解大规模组合优化问题的启发式算法研究等,也介绍相应算法的实际应用。
张新雨《模型平均、集成学习与迁移学习》
模型平均是统计学的前沿研究领域,它是处理模型不确定性的方法,通常比采用单个模型能得到更好的预测效果。集成学习是使用某种规则把多个学习器的学习结果进行集成从而获得比单个学习器更好的学习效果的一种机器学习方法,它可以用于分类问题集成、回归问题集成等。因此,模型平均可以说一种特殊的集成学习方法。本人的研究一直聚焦在模型平均领域,解决了该领域的重要公开难题,并针对复杂数据提出了最优模型平均方法。本次报告将讨论的拟研究问题包括稳健集成学习和基于微分方程的集成学习。迁移学习是将源域中的样本或者是训练出来的参数迁移到目标域,以期提高目标域的学习效果的一种机器学习方法,本次报告将讨论在多源域情况下参数迁移学习的一些研究成果和拟研究的问题。
人工智能信息处理专题
赵鑫《知识驱动的智能化推荐算法》
本次报告首先简要介绍演讲人个人研究经历,接下来简要介绍其早期的研究工作(即社交话题语义理解与面向社交平台的个性化推荐系统),最后介绍当前以及拟开展的研究内容。主要考虑三个方面进行介绍。首先,用户选择物品的原因复杂,单一“相关度”分数不能充分刻画用户偏好;同时推荐与解释同等重要,黑箱模型不能突破“相关度”的限制 推荐结果;第三, 需要更灵活的接入推荐系统方式,与实际的应用场景匹配。围绕上述三个方面,将介绍知识驱动的序列推理模型、富信息的长评论文本生成模型和交互式推荐算法。
杨植麟《Latest Advances of Neural Language Models》
传统的自然语言模型分为两个主要类别,自回归和自编码。为了结合两种方法的优缺点,我们提出了XLNet自然语言模型,其中包含基于排列的自然语言建模目标函数以及双流注意力机制等新技术,在20项标准数据集的同等条件下取得了超越BERT和RoBERTa的结果,是当前在标准FLOPs下效果最好的预训练方法。作为展望,针对当前模型仍然依赖于在微调时使用大规模数据,我们提出了提升预训练模型的数据效率的研究计划。
兰艳艳《智能信息检索模型》
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。近年来,随着机器学习技术的发展,基于机器学习的信息检索模型也随之得到了快速的发展,取得了良好的效果,并有大量的方法应用到实际的信息检索系统中,例如百度,必应等搜索引擎。然而,现有信息检索的模型和学习模式还远远没有完美解决信息检索的问题,满足人类信息检索的需求。本次报告以深度文本匹配方向为例,介绍近年来深度学习应用到信息检索方向的一些学术进展,重点围绕基于交互的深度文本匹配模型展开,包括MatchPyramid, MatchSRNN,和Vip等模型。同时将介绍未来拟开展的对话式信息检索方向的挑战,和在对话生成方向的一些前期工作,如对话生成的质量和多样性问题。
李纪为《对话系统与信息抽取》
此次报告,我将对自然语言处理中的两个重要方向,对话系统和信息抽取相关的工作进行回顾和展望。
第一个方向,我们将对对话系统如何产生有意义回复、如何保持对话一致性、如何优化多轮对话等问题进行探讨,同时对于如今对话系统所面临的的问题,包括如何赋予对话系统推理能力、如何更加全面地考虑背景信息、如何明确化对话系统的目标等问题进行探讨。
第二个方向,我们将讨论如何基于机器阅读理解算法,构建通用的信息抽取系统,解决包括命名实体识别、关系抽取、语义消歧等诸多信息抽取问题。同时对于如何构建统一的信息抽取系统进行展望。
人工智能芯片与系统专题
梁云《面向人工智能的敏捷芯片设计》
人工智能应用需要庞大算力的支持。然而,人工智能的算法和应用特点是发展和迭代快速,传统的芯片设计及其软件开发周期长,成本高,很难适应人工智能应用的变化。在该报告中,我首先介绍我在计算机体系结构,芯片设计自动化,软硬件协同设计等方面的前期积累,接着介绍将要展开的敏捷芯片设计研究,提供集芯片架构、自动化软件、高性能计算库于一体的整体解决方案。
陈恺《人工智能安全》
近年来出现的人工智能技术对攻防对抗产生了重要影响。一方面它可辅助传统攻防手段,使其智能化与高效化;另一方面,其自身的安全问题,如对抗样本、神经网络后门等,也时刻威胁着自动驾驶、面部识别支付等多种应用。这次报告将就这两方面展开,包括自然语言理解与深度学习等人工智能技术在传统攻防中的应用,也将会对自动驾驶目标识别系统以及语音识别系统等进行智能化对抗。最后,我们将介绍未来研究工作。
人工智能新兴与交叉专题
边凯归《智能视频内容分发、传输与理解》
当今互联网所承载的巨量数据中,视频内容传输占比已经超过70%。在中国大陆,长视频、短视频用户均已超过6亿人。然而,高速发展的移动接入网、拥挤的核心网、以及正在建设的边缘网络之间还存在一些矛盾。因此,提高视频传输质量、增强视频观看体验,仍然面临着诸多挑战。为了解决以上问题,视频网络需要通过人工智能技术,来预测视频内容在时间和空间上的流行度,刻画网络动态变化,分析用户观看行为,从而协调网络边缘节点的存储资源和计算能力,通过缓存、动态码率分配、超分辨率重建、内容标注、分布式机器学习、等关键技术更好地为用户推荐视频内容,增强用户的观看体验。同时,为未来5G网络中的各种视频应用发展提供技术支持。
喻纯《自然人机交互中的智能输入》
用户体验是终端产品的核心价值。学术界和工业界一直做自然交互创新,旨在让用户通过自然动作,便捷高效地向计算设备表达交互意图。本报告将围绕自然交互的意图理解这一科学问题,以优化意图表达的直观性和效率为主线,介绍报告人三方面的研究工作,包括:高可用自然交互动作输入和智能感知,自然动作表达交互意图的编码映射优化和面向非精确自然动作输入的交互意图理解。基于现有工作基础,报告人将进一步介绍其在视觉无障碍交互领域的研究计划,包括图形用户界面交互语义的表示和提取,运动控制能力建模和交互式参数估计和个性化交互界面构建和意图理解等方面内容,目标是探寻并构建适合于盲人无视觉反馈状态下自然交互的界面范式。本报告适合于对人机交互以及对如何应用智能技术优化用户体验感兴趣的听众。
人工智能感知专题
王瑞平《知识引导的开放环境视觉识别》
自然场景中的视觉目标识别是视觉场景理解的核心任务之一,目前主流的“深度学习+大规模数据+强监督标注”视觉识别模型在封闭场景数据集上的性能取得不断突破的同时也在日趋饱和,其发展正逐渐面临来自真实开放场景应用的挑战。本研究以此为出发点,致力于突破现有识别方法框架的局限,建立具有仿人类视觉感知系统知识推理能力的“万物识别”理论与方法,研发小数据、弱监督条件下实用性强的增量图像分类与检索关键技术,引领形成新型的开放环境视觉识别研究范式。报告将介绍本课题组近几年围绕开放场景识别所开展的一些前期探索,包括:属性与类别关联的多任务图像检索、属性知识辅助的零样本物体识别、开放环境下的增量物体识别、属性学习驱动的可解释物体识别、场景推理的物体检测与关系分析、以及视觉概念知识库的构建等。报告最后就后续拟开展研究工作的思路进行探讨。
鲁继文《智能视觉感知与推理》
视觉感知与推理是计算机视觉与模式识别领域的研究热点,被认为是人类迈向通用视觉智能亟待突破的问题。报告将汇报本人近年来提出的多个视觉感知与推理方法,主要包括深度度量学习、紧致表示学习、和结构关系推理,以及它们在人脸与物体识别、行人跟踪与再识别、行为预测与识别、图像与视频检索、三维场景理解、和深度模型压缩等多个视觉任务中的应用。
施柏鑫《非传统图像采集与智能视觉计算》
相机在现代生活中扮演着重要角色,为人们记录下无数有意义的瞬间,对于计算机视觉研究者而言,相机完成视觉信息捕捉,为几乎所有的计算机视觉算法提供输入。人工智能时代对高质量的数字图像和视频提出了大量需求,智能手机等移动设备对相机功能和性能不断提出新需求和新挑战,如果输入图像质量不够高、内容不够丰富,再先进的计算机视觉算法都会遇到难以逾越的瓶颈。本次报告介绍北京大学“相机智能”课题组在“非传统图像采集+智能视觉计算”方面的研究成果与进展,利用“计算摄像学+计算机视觉”技术,实现更高性能、更多维度、更少失真的影像采集与重构,希望通过成像智能化的实现助力人工智能关键问题攻关和重大应用赋能。
马占宇《基于域自适应的小样本学习》
现有深度学习模型的泛化能力严重依赖于大量有标记的训练数据,迁移学习是改善模型在受限数据环境下的泛化能力的有效方式。此次报告包含三部分。第一部分主要介绍报告人的教育、科研、学术服务经历等,第二部分着重介绍报告人前期开展的研究工作及其创新内容,第三部分重点介绍计划开展的研究工作,主要有:1)小样本数据的特征分布形态研究;2)基于多源域适应的小样本数据分类方法研究;3)面向域自适应的深度网络架构研究。上述工作的主要目标包括:1)研究基于数据分布的域自适应模型,实现在像素层面和特征层面的域漂移消除;2)提出多源域的域自适应模型,实现公共特征子空间的构建;3)基于损失函数设计及结构自动优化,提出面向域自适应的深度网络架构。
代季峰《数据和知识双驱动的图像理解算法》
现有的图像理解算法,其成功主要依赖于在大量的标注数据上训练针对特定“小”任务的深度神经网络。深度神经网络能够以前所未有的能力在海量训练数据中挖掘复杂的模式以优化特定任务的识别精度。
但是在脱离“大量标注数据+特定任务”的舒适区之后,现有的图像理解算法并不能取得良好的表现。比如长尾分布类别的识别任务是对现有识别算法是巨大的挑战。在现实世界中,存在着大量的长尾类别,它们类别数量众多而通常每类的样本数量较少。现有的图像识别算法并不能够有效的在这种每类样本数量稀少的情况下训练。另一个构成挑战的例子是上升到认知层面的图像理解任务。在这类任务中,图像理解算法需要不止进行识别层面的理解(比如图片分类、检测、分割),还需要进行认知层面的分析(比如推断人的目的、目标,以及社会活动行为等)。这类复杂的非特定任务难以通过对样本的标注来穷尽所有可能的情况,现有算法难以进行如此复杂的推断过程。
上述挑战的一个根本原因是在于现有的机器学习算法和模型完全依赖于给定的训练样本,对输入之外的世界完全一无所知。这并不是人类的工作方式。我们能够从已知的有限的样本推广,能够用组合、类比、推理等方式去理解复杂的概念。作为人类,我们具有对世界的运行方式的常识。当我们遇到从未遇到的情景时,我们能够使用已有的常识去理解并做出推断。
本研究计划致力于开发数据和知识双驱动的图像理解算法。我们希望在算法中,能够既利用传统的带标注的样本信息,也利用外部的知识库提供的知识,来构建新一代的图像理解算法。我们希望开发的算法能够脱离现有的“大量标注数据+特定任务”舒适区,能够对“少量标注数据+复杂非特定任务”的场景取得突破和进展。
报名方式
微信扫码添加小智为好友,备注“Live+姓名+单位/院校+职位/专业”,并发送口令“live0211”入群,获取直播间地址。
最后,附上完整议题版日程海报,便于大家保存查看;也欢迎大家分享到朋友圈,让更多小伙伴一起听课。