对这次分享主题感兴趣的小伙伴,
欢迎在文末留言提问,
我们会收集有价值的问题,
请嘉宾在直播中亲自解答。
主题:《用深度(强化)学习为组合优化寻找更好的启发式搜索策略》
嘉宾:田渊栋博士
时间:北京时间 2020年 2月23号(周日) 早 10:00
地点:『运筹OR帷幄』哔哩哔哩直播间
链接:live.bilibili.com/21459168
本次直播我们有幸请到 Facebook AI Lab 的田渊栋博士,为大家介绍他和团队近期在顶会 NeurIPS 和 ICLR 发表的三篇文章 [1] [2] [3],内容涉及用(深度)强化学习和搜索方法搭配神经网络来寻找复杂优化问题的启发式算法的一些工作。
近年来,深度学习在处理自然数据输入(如计算机视觉、语音识别和自然语言处理)方面成绩斐然。然而,怎样用深度神经网络来处理结构化的数据,(如日志,优化问题的结构化描述,代码),为一些离散优化问题找到一条替代人力启发式策略的神经网络方案,仍然是个未解决的问题。本次直播,我将简要介绍近期我们用强化学习和搜索方法搭配神经网络,来寻找复杂优化问题的启发式算法的一些工作。涉及到的应用领域包括:化简符号表达式、在线事务调度、车辆路径规化、神经网络架构搜索,以及从汇编代码中反编译出C代码。
田渊栋博士,脸书(Facebook)人工智能研究院研究员及经理,研究方向为深度强化学习,多智能体学习,及其在游戏中的应用,和深度学习模型的理论分析。曾担任围棋开源项目 DarkForest 及 ELF OpenGo 项目中研究及工程负责人和第一作者。2013-2014年在Google无人驾驶团队任软件工程师。2005年及08年于上海交通大学获本硕学位,2013年于美国卡耐基梅隆大学机器人研究所获博士学位。曾获得2013年国际计算机视觉大会(ICCV)马尔奖提名(Marr Prize Honorable Mentions)。
扫描二维码直达『运筹OR帷幄』B 站直播间
对这次分享主题感兴趣的小伙伴,欢迎在文末留言提问,我们会收集有价值的问题,请嘉宾在直播中亲自解答
参考文献:
[1]Chen, X., & Tian, Y. (2019). Learning to perform local rewriting for combinatorial optimization. InAdvances in Neural Information Processing Systems(pp. 6278-6289).
[2]Fu, C., Chen, H., Liu, H., Chen, X., Tian, Y., Koushanfar, F., & Zhao, J. (2019). Coda: An end-to-end neural program decompiler. InAdvances in Neural Information Processing Systems(pp. 3703-3714).
[3]Wang, L., Xie, S., Li, T., Fonseca, R., & Tian, Y. (2019). Sample-efficient neural architecture search by learning action space.arXiv preprint arXiv:1906.06832.
相关文章推荐
强化学习已经取得像AlphaGo这样举世瞩目的成绩,也成为最近的一个研究热点。组合优化是应用数学、计算机科学、运筹学等领域的重要问题,在调度、资源分配、物流、城市规划、电路设计、制药等领域应用广泛。强化学习与组合优化结合,能产生什么新机会?本次『运筹OR帷幄』社群线上直播,我们有幸邀请到了人工智能公司attain.ai.创始人,加拿大阿尔伯塔大学计算机系博士李玉喜先生,结合具体场景,为我们讲解强化学习在组合优化中的应用。
往期直播回顾
直播NO.1 | PLM 合伙人李伟:从第一方物流到第五方物流,浅谈物流服务的演进
直播 NO.2 | 胡武华博士:运筹优化理论在物流行业中的应用实践
直播 NO.3 | 滴滴 AI Labs 秦志伟:深度强化学习在网约车交易市场中的应用
本文福利
田博士直播中介绍的三篇文章,以及这次演讲的ppt,小编已经打包好放到公众号后台供各位小伙伴学习参考~,感兴趣的小伙伴可以直接在公众号"运筹 OR 帷幄"后台回复关键词:“田渊栋” 获得,如果觉得有用, 请勿吝啬你的留言和赞哦!