官网:http://gym.openai.com/
OpenAI Gym是一个用户开发和比较强化学习算法的工具包,与其它的数值计算库兼容,如tensorflow
Openai gym 包含两个部分:
1)gym开源:
包含一个测试集,每个问题成为一个环境(environment),可以用于自己的强化学习算法开发,环境有共享的接口,允许用户设计通用的算法,例如:Atari、CartPole等
2)OpenAI Gym服务
提供一个站点和api,允许用户对他们训练的算法进行性能的比较
OpenAI安装:pip install gym[all]
它是OpenAI出的一些深度强化学习算法(DQN,PPO,TRPO,DDPG)的实现,基于Tensorflow和OpenAI Gym
源码:https://github.com/openai/baselines
MuJoCo(Multi-Joint dynamics with Contact)是一个模拟的机器人,生物力学,图形和动画等领域的物理引擎
官网:http://www.mujoco.org/index.html
源码:https://github.com/openai/mujoco-py
可以使用源码安装:
git clone https://github.com/openai/mujoco-py
cd mujoco-py
pip install -e. --no-cache
与OpenAI Gym类似,rllab也是一个强化学习算法的框架
官网:https://rllab.readthedocs.io/en/latest/user/installation.html
源码:https://github.com/rll/rllab
与OpenAI Gym的区别在于OpenAI Gym支持更广泛的环境,且提供在线的scoreboard可以用于共享训练结果。
rllab也提供一个基于pygame的可视环境,同时也兼容OpenAI Gym
DeepMind Lab是由DeepMind发布的3D迷宫场景的强化学习平台
官网:https://deepmind.com/blog/open-sourcing-deepmind-lab/
论文:https://arxiv.org/pdf/1612.03801.pdf
源码:https://github.com/deepmind/lab
TORCS(The Open Racing Car Simulator)是一个跨平台的赛车游戏模拟器,也可以作为强化学习的研究平台
官网:http://torcs.sourceforge.net/
gym_torcs是一个TORCS 的强化学习环境,提供类似前面OpenAI Gym的接口
源码:https://github.com/ugo-nama-kun/gym_torcs
DeepMind的AlphaGo把围棋搞定之后,业界开始将目光头像即时策略游戏,如StarCraft II(星际争霸II)。DeepMind和Blizzard合作出了个StarCraft II的研究平台,称为PySC2
官网:https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/
论文:https://deepmind.com/documents/110/sc2le.pdf
源码:https://github.com/deepmind/pysc2