本期为TechBeat人工智能社区第441期线上Talk。
北京时间9月21日(周三)20:00,北京大学人工智能研究院研究员——杨耀东的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “一个合作博弈的通用求解框架”,届时将介绍一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习(Heterogeneosu Multi-Agent Mirror Learning)。
Talk·信息
▼
主题:一个合作博弈的通用求解框架
嘉宾:北京大学人工智能研究院研究员 杨耀东
时间:北京时间 9月21日 (周三) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
点击下方链接,即可观看视频
TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=715
Talk·介绍
▼
通过强化学习方法求解多智能体博弈合作问题具有众多的现实应用,例如灵巧双手操纵、无人机群编队等。在本次分享中,我将会介绍一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习(Heterogeneosu Multi-Agent Mirror Learning)。
HAML提供了一个通用的算法设计范式,它可以催生出一系列的有效的合作博弈求解算法例如HAPPO, HATRPO, MACPO, Mutli-agent Transformer等,并且HAML算法框架中的成员都天然具有严格的单调递增性的保证。此外,HAML框架还提供了一系列新的多智能体算法,例如HADDPG, HADQN, HAA3C。在一系列合作博弈场景,例如星际争霸,灵巧双手操作上,他们都达到了SOTA水平。
Talk·提问交流
▼
通过以下两种方式提问都将获得微信现金红包奖励哦!
方式 ①
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
方式 ②
在本文留言区直接提出你的问题!
Talk·嘉宾介绍
▼
杨耀东
北京大学人工智能研究院研究员
杨耀东,北京大学人工智能研究院研究员、博导,伦敦国王大学客座助理教授。科研领域包括强化学习、博弈论和多智能体系统,重点关注基于强化学习技术的群体智能涌现。在加入北京大学以前,他曾任伦敦国王大学助理教授,华为英国研究所主任研究员,美国国际集团科学部高级经理。杨耀东本科毕业于于中国科学技术大学,硕士毕业于英国帝国理工大学,博士毕业于英国伦敦大学。
个人主页:
www.yangyaodong.com
-The End-
关于TechBeat人工智能社区
▼
TechBeat(TechBeat)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区