重温强化学习之强化学习模拟平台

1、OpenAI Gym

官网:http://gym.openai.com/

OpenAI Gym是一个用户开发和比较强化学习算法的工具包,与其它的数值计算库兼容,如tensorflow

Openai gym 包含两个部分:

   1)gym开源:

       包含一个测试集,每个问题成为一个环境(environment),可以用于自己的强化学习算法开发,环境有共享的接口,允许用户设计通用的算法,例如:Atari、CartPole等

  2)OpenAI Gym服务

      提供一个站点和api,允许用户对他们训练的算法进行性能的比较

重温强化学习之强化学习模拟平台_第1张图片

OpenAI安装:pip install gym[all]

OpenAI Baselines

它是OpenAI出的一些深度强化学习算法(DQN,PPO,TRPO,DDPG)的实现,基于Tensorflow和OpenAI Gym

源码:https://github.com/openai/baselines

2、MuJoCo

MuJoCo(Multi-Joint dynamics with Contact)是一个模拟的机器人,生物力学,图形和动画等领域的物理引擎

官网:http://www.mujoco.org/index.html

源码:https://github.com/openai/mujoco-py

可以使用源码安装:

  • git clone https://github.com/openai/mujoco-py

  • cd mujoco-py

  • pip install -e. --no-cache

3、rllab

与OpenAI Gym类似,rllab也是一个强化学习算法的框架

官网:https://rllab.readthedocs.io/en/latest/user/installation.html

源码:https://github.com/rll/rllab

与OpenAI Gym的区别在于OpenAI Gym支持更广泛的环境,且提供在线的scoreboard可以用于共享训练结果。

rllab也提供一个基于pygame的可视环境,同时也兼容OpenAI Gym

4、DeepMind Lab

DeepMind Lab是由DeepMind发布的3D迷宫场景的强化学习平台

官网:https://deepmind.com/blog/open-sourcing-deepmind-lab/

论文:https://arxiv.org/pdf/1612.03801.pdf

源码:https://github.com/deepmind/lab

5、TORCS

TORCS(The Open Racing Car Simulator)是一个跨平台的赛车游戏模拟器,也可以作为强化学习的研究平台

官网:http://torcs.sourceforge.net/

gym_torcs是一个TORCS 的强化学习环境,提供类似前面OpenAI Gym的接口

源码:https://github.com/ugo-nama-kun/gym_torcs

 

6、PySC2(StarCraft II)

DeepMind的AlphaGo把围棋搞定之后,业界开始将目光头像即时策略游戏,如StarCraft II(星际争霸II)。DeepMind和Blizzard合作出了个StarCraft II的研究平台,称为PySC2

官网:https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/

论文:https://deepmind.com/documents/110/sc2le.pdf

源码:https://github.com/deepmind/pysc2

 

重温强化学习之强化学习模拟平台_第2张图片

重温强化学习之强化学习模拟平台_第3张图片

 

 

你可能感兴趣的:(强化学习)