俞扬:“审时度势”的高效强化学习

点击上方“深度学习大讲堂”可订阅哦!


编者按:强化学习,本质上是一种在环境中“审时度势”地学习策略的过程。AlpahGo和AlphaGo Zero的相继问世,证明了强化学习在模拟世界中的有效性。然而,现有的强化学习方法对样本量的需求极大、且利用率低,造成其难以在真实世界中应用。因此,如何提高强化学习的效率以应用于真实世界,进而打造真正的人工智能,是该领域的开放性问题。在本文中,来自南京大学的俞扬副教授,将从优化、方法论、模拟器等角度,介绍他近年来在高效强化学习中的一些探索。文末,大讲堂特别提供文中提到所有文章的下载链接。


俞扬:“审时度势”的高效强化学习_第1张图片

我今天主要介绍最近在强化学习方面一些初步的探索。

你可能感兴趣的:(俞扬:“审时度势”的高效强化学习)