新鲜开源:基于TF2.0的深度强化学习平台

新鲜开源:基于TF2.0的深度强化学习平台_第1张图片


整理 | Jane

出品 | AI科技大本营(公众号id:rgznai100)


近日,Github 一位开发者 danaugrs 开源了一个新项目——Huskarl,一个专注研究和快速原型的深度强化学习框架。


此框架基于 TensorFlow 2.0 构建,使用了 tf.keras API,保证了其简洁性和可读性。Huskarl 可以使多环境的并行计算变得很容易,这将对加速策略学习算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 还可以与 OpenAI Gym 环境无缝结合,并将计划支持多代理环境和 Unity3D  环境。


OpenAI Gym:2016 年 OpenAI 发布的一个可以开发、对比强化学习算法的工具包,提供了各种环境、模拟任务等,任何人都可以在上面训练自己的算法。

Unity3D:一个全面整合的专业游戏引擎,由 Unity Technologies 开发的一款可以让玩家轻松创建三维视频游戏、实时三维动画等类型互动内容的多平台综合型游戏开发工具。


目前,Huskarl 已经支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等算法,还有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等算法在计划中。

     

新鲜开源:基于TF2.0的深度强化学习平台_第2张图片


最重要的是,TF 2.0 的 nightly 已经发布,这个开源工具也是基于 TF2.0 开发的,所以大家要先安装一下 tf 2.0 nighty 版本。除此之外,还需要安装以下工具和环境:

     

新鲜开源:基于TF2.0的深度强化学习平台_第3张图片


这个工具还是新鲜出炉烫手的呢,大家赶紧来尝鲜试一下~


地址:

https://github.com/danaugrs/huskarl




(本文为AI科技大本营原创文章,转载请微信联系 1092722531)


群招募


扫码添加小助手微信,回复:公司+研究方向(学校+研究方向),邀你加入技术交流群。技术群审核较严,敬请谅解。

新鲜开源:基于TF2.0的深度强化学习平台_第4张图片

推荐阅读:

  • WinRAR曝遗留19年重大漏洞,可完全控制电脑(附解决方法)

  • 十大经典排序算法动画与解析,看我就够了

  • 那些羞羞的事情,AI能理解吗?

  • 豆瓣已玩烂,来爬点有逼格的——IMDB电影提升你的品位

  • 你与数据科学家只差这26条python技巧

  • 区块链创业公司解散后,我去美团送外卖了 | 链人生

  • 为什么程序员下班后只关显示器从不关电脑?

  • C 语言会比 C++ 快?

  • 月入5万,程序员夫人们过上"贵妇"生活了吗?

                         640?wx_fmt=png

点击“阅读原文”,查看历史精彩文章。

你可能感兴趣的:(新鲜开源:基于TF2.0的深度强化学习平台)