2019年8月25日下午,“AI未来说·青年学术论坛”第八期深度学习专场,在中国科学院大学中关村校区3号教学楼S201阶梯教室举行。
“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术、PaperWeekly作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。
深度学习是机器学习领域中一个新的研究方向,它使机器学习更接近于最初的目标——人工智能。深度学习是一种以人工神经网络为架构,学习样本数据内在规律和表示层次的算法,其核心为特征学习,旨在通过分层网络获取分层次的特征信息,从而解决了以往需要人工设计特征的重要难题。目前,深度学习在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理、多媒体学习、语音等相关领域都取得了很多成果。
本次论坛邀请到了来自中国科学院大学“AI小鸭学院”教师团队的4位嘉宾,包括中国科学院信息工程研究所的文新老师、付鹏老师、文瑞洁老师和中国科学院自动化研究所的陈智能老师。
文新老师作“深度学习入门基础与学习资源”的报告分享
作为中国科学院信息工程研究所高级工程师,新工科联盟人工智能协同育人工作委员会副秘书长、百度认证布道师,新工科深度学习师资培训负责人,文新老师报告的主要内容包括深度学习概述、深度学习优势、深度学习入门基础和深度学习资源四个部分。报告以了解不同层次学生代表的课程需求为开场,进而结合大家所关心的问题展开了讲解。首先介绍了深度学习领域的大牛、大玩家(企业)、学术影响力的爆发式增长以及人才需求量的指数级增长。接着从图像识别说起,阐述了图像识别面临的语义鸿沟挑战,并进一步介绍了传统方法及其存在的问题,由此引出了深度学习方法及其优势。同时,举例说明了深度学习无处不在但并非无所不能。然后介绍了入门深度学习应掌握的数学基础、编程语言和深度学习常用库,并由机器学习的定义和相关的概念引出了深度学习的模型、典型网络结构、一般过程以及难题与挑战。最后介绍了深度学习的相关资源,包括团队介绍、学习框架、师资培训、学习教材以及课程规划。
陈智能老师作“计算机视觉经典:深度学习与目标检测”的报告分享
作为中国科学院计算技术研究所博士,香港城市大学博士后,中国科学院自动化研究所副研究员,硕士生导师,陈智能老师报告的主要内容包括目标检测概述、传统目标检测方法、深度学习方法和竞赛分享四个部分。报告首先以计算机视觉的基础概念引入,介绍了计算机视觉主要任务,由此引出了目标检测的概念及其存在的问题难点,并展示了目标检测的发展历程。接着,回顾了包括VJDetector(实时目标检测(人脸))、HoG特征(行人检测)和DPM(可变形的组件模型特征)等传统目标检测方法。然后按照演化进程分别介绍了采用深度学习的目标检测两阶段方法和一阶段方法,前者包括R-CNN、SPP-Net、FastR-CNN、Faster R-CNN和FPN等,后者包括YOLO、SSD等。最后分享了自己所在团队参加“百度-西交大·大数据竞赛2018”的经历,以及个人经验与体会。
付鹏老师作“深度学习与机器阅读”的报告分享(由于林政老师临时有事,所以报告由付鹏老师进行报告分享)
作为中国科学院信息工程研究所助理研究员,付鹏老师报告的主要内容包括机器阅读概述、传统机器阅读方法、深度学习方法以及竞赛分享四个部分。付鹏老师先介绍了自然语言处理的概念、三个发展的阶段(基于规则的方法、基于统计学习的方法和基于深度学习的方法)和所涉及的四个层面(形式、语义、推理和语用)。然后介绍了自然语言处理所面临的一些挑战,如中文分词(segmentation)困难、歧义现象、未知语言现象以及不同语系的差异的难题。以自然语言处理技术概览(主要包含NLP基础技术、NLP核心技术和NLP+)为引,引出了机器阅读的主题。紧接着介绍了机器阅读的难点挑战和发展历程。在介绍机器阅读方法时,介绍了传统机器阅读方法(早期系统和机器学习时代的系统)和深度学习的方法,并重点讲解了深度学习的方法(机器阅读的主要步骤、机器阅读数据集、注意力机制、机器阅读模型以及最新的研究进展),紧接着介绍了多文档阅读基本概念及难点、国内外研究现状和自己所在团队提出的模型。最后,与大家分享了全国“军事智能-机器阅读”竞赛的参赛经历,包括竞赛任务、问题实例、数据特点、总体框架等。
文瑞洁老师作“深度学习实践快速入门”的报告分享
作为中国科学院信息工程研究所工程师,百度认证布道师,新工科深度学习师资培训实践负责人,文瑞洁老师报告的主要内容包括深度学习框架、深度学习使用步骤、手写数字识别实践以及深度学习常见问题四个部分。文瑞洁老师首先以使用深度学习的目的引入,结合图像识别对深度学习过程进行了详细讲解。同时,介绍了深度学习使用的三大步骤:建立模型、选择合适的损失函数和参数学习。接着介绍了常用的深度学习工具(PaddlePaddle、TensorFlow、PyTorch和 Keras)和一站式深度学习开发平台 AI Studio,然后结合PaddlePaddle 的代码对手写体识别的实践流程进行了详细讲解,主要包括准备数据、配置网络(定义网络、定义损失函数、定义优化方法)、训练网络、模型评估和模型预测。最后,文瑞洁老师讲到了深度学习的常见问题,如参数爆炸、欠拟合和过拟合等,并给出了一些常用的解决方法,如Early-stopping(早停法)、权重正则化、数据增强和dropout等。
“AI未来说·青年学术论坛”系列讲座以贯彻落实国家人工智能发展规划和推动我国人工智能技术水平进步为目标,通过邀请业界专家、青年学者和优秀学生介绍领域前沿技术成果和分享教学、科研和产业化经验,促进产、学、研结合,助力我国人工智能行业的蓬勃发展。
AI未来说*青年学术论坛
第一期 数据挖掘专场
1. 李国杰院士:理性认识人工智能的“头雁”作用
2. 百度熊辉教授:大数据智能化人才管理
3. 清华唐杰教授:网络表示学习理论及应用
4. 瑞莱智慧刘强博士:深度学习时代的个性化推荐
5. 清华柴成亮博士:基于人机协作的数据管理
第二期 自然语言处理专场
1. 中科院张家俊:面向自然语言生成的同步双向推断模型
2. 北邮李蕾:关于自动文本摘要的分析与讨论
3. 百度孙珂:对话技术的产业化应用与问题探讨
4. 阿里谭继伟:基于序列到序列模型的文本摘要及淘宝的实践
5. 哈工大刘一佳:通过句法分析看上下文相关词向量
第三期 计算机视觉专场
1. 北大彭宇新:跨媒体智能分析与应用
2. 清华鲁继文:深度强化学习与视觉内容理解
3. 百度李颖超:百度增强现实技术及应⽤
4. 中科院张士峰:基于深度学习的通用物体检测算法对比探索
5. 港中文李弘扬 :物体检测最新进展
第四期 语音技术专场
1. 中科院陶建华:语音技术现状与未来
2. 清华大学吴及:音频信号的深度学习处理方法
3. 小米王育军:小爱背后的小米语音技术
4. 百度康永国:AI 时代的百度语音技术
5. 中科院刘斌:基于联合对抗增强训练的鲁棒性端到端语音识别
第五期 量子计算专场
1. 清华大学翟荟:Discovering Quantum Mechanics with Machine Learning
2. 南方科技大学鲁大为:量子计算与人工智能的碰撞
3. 荷兰国家数学和计算机科学中心(CWI)李绎楠:大数据时代下的量子计算
4. 苏黎世联邦理工学院(ETH)杨宇翔:量子精密测量
5. 百度段润尧:量子架构——机遇与挑战
第六期 机器学习专场
1. 中科院张文生:健康医疗大数据时代的认知计算
2. 中科院庄福振:基于知识共享的机器学习算法研究及应用
3. 百度胡晓光:飞桨(PaddlePaddle)核心技术与应用实践
4. 清华大学王奕森:Adversarial Machine Learning: Attack and Defence
5. 南京大学赵申宜:SCOPE - Scalable Composite Optimization for Learning
第七期 自动驾驶专场
1. 北京大学查红彬:基于数据流处理的SLAM技术
2. 清华大学邓志东:自动驾驶的“感”与“知” - 挑战与机遇
3. 百度朱帆:开放时代的自动驾驶 - 百度Apollo计划
4. 北理宋文杰:时空域下智能车辆未知区域自主导航技术
留言 点赞 发个朋友圈
我们一起分享AI学习与发展的干货
推荐文章阅读
ACL2018论文集50篇解读
EMNLP2017论文集28篇论文解读
2018年AI三大顶会中国学术成果全链接
ACL2017 论文集:34篇解读干货全在这里
10篇AAAI2017经典论文回顾
长按识别二维码可添加关注
读芯君爱你