OpenAI Gym--环境

这是目录

Environments

这是Gym环境的列表,包括与Gym打包在一起的环境,官方OpenAI环境和第三方环境。

有关创建自己的环境的信息,请参见创建自己的环境。

Included Environments

每个环境组的代码都位于其自己的子目录gym/envs. 每个任务的规范在gym/envs/__init__.py.两者都值得浏览。

Algorithmic

这些是各种各样的算法任务,例如学习复制序列。

import gym
env = gym.make('Copy-v0')
env.reset()
env.render()

Atari

Atari环境是各种Atari电子游戏。如果您没有进行完整安装,则可以通过pip install -e '.[atari]'(需要cmake安装)安装依赖项,然后按如下所示开始使用:

import gym
env = gym.make('SpaceInvaders-v0')
env.reset()
env.render()

这将安装atari-py并自动编译Arcade学习环境。这可能需要一段时间(在一台像样的笔记本电脑上需要几分钟),因此请做好准备。

Box2d

Box2d是2D物理引擎。您可以通过安装它pip install -e '.[box2d]',然后按以下步骤开始:

import gym
env = gym.make('LunarLander-v2')
env.reset()
env.render()

Classic control

这些是各种经典的控制任务,将出现在典型的强化学习教科书中。如果未进行完整安装,则需要运行pip install -e '.[classic_control]'以启用渲染。您可以通过以下方式开始使用它们:

import gym
env = gym.make('CartPole-v0')
env.reset()
env.render()

MuJoCo

MuJoCo is a physics engine which can do very
detailed efficient simulations with contacts. It’s not open-source, so
you’ll have to follow the instructions in
mujoco-py
to set it up. You’ll have to also run pip install -e '.[mujoco]' if
you didn’t do the full install.

import gym
env = gym.make('Humanoid-v2')
env.reset()
env.render()

Robotics

MuJoCo是一个物理引擎,可以对联系人进行非常详细的高效仿真。它不是开源的,因此您必须按照mujoco-py中的说明 进行设置。pip install -e '.[mujoco]'如果没有完整安装,则还必须运行。

import gym
env = gym.make('HandManipulateBlock-v0')
env.reset()
env.render()

您还可以在随附的技术报告和博客文章中找到其他详细信息。如果使用这些环境,则可以按如下所示引用它们:

@misc{1802.09464,
  Author = {Matthias Plappert and Marcin Andrychowicz and Alex Ray and Bob McGrew and Bowen Baker and Glenn Powell and Jonas Schneider and Josh Tobin and Maciek Chociej and Peter Welinder and Vikash Kumar and Wojciech Zaremba},
  Title = {Multi-Goal Reinforcement Learning: Challenging Robotics Environments and Request for Research},
  Year = {2018},
  Eprint = {arXiv:1802.09464},
}

Toy text

基于Toy text环境。无需安装其他依赖项,因此,只需执行以下操作即可:

import gym
env = gym.make('FrozenLake-v0')
env.reset()
env.render()

OpenAI Environments

Procgen

16个易于使用的程序生成的健身环境,可以直接衡量强化学习代理学习通用技能的速度。这些环境在单个内核上高速(每秒数千步)运行。

在此处了解更多信息:https : //github.com/openai/procgen

Gym-Retro

Gym Retro可让您将经典的视频游戏转变为Gym环境以进行强化学习,并附带约1000种游戏的集成。它使用了各种支持Libretro API的仿真器,因此添加新的仿真器相当容易。

在此处了解更多信息:https : //github.com/openai/retro

Roboschool (已弃用)

我们建议改为使用PyBullet机器人环境

3D物理环境(例如Mujoco环境),但是使用Bullet物理引擎,不需要商业许可。

在此处了解更多信息:https : //github.com/openai/roboschool

Third Party Environments 第三方环境

健身房预包装了许多环境。正是在许多环境中使用的通用API使得Gym变得如此出色。在这里,我们将列出健身房未预装的其他环境。通过拉取请求将另一个提交到此列表。

PyBullet Robotics Environments

3D物理环境(例如Mujoco环境),但使用Bullet物理引擎,不需要商业许可。适用于Mac / Linux / Windows。

在此处了解更多信息:https : //docs.google.com/document/d/10sXEhzFRSnvFcl3XxNGhnD4N2SedqwdAvK3dsihxVUA/edit#heading=h.wz5to0x8kqmr

Obstacle Tower

3D程序生成的塔,您必须在其中爬到最高水平

在此处了解更多信息:https : //github.com/Unity-Technologies/obstacle-tower-env

平台:Windows,Mac,Linux

PGE: Parallel Game Engine

PGE是用于AI模拟的FOSS 3D引擎,可以与Gym进行互操作。包含具有现代3D图形的环境,并将Bullet用于物理。

在此处了解更多信息:https : //github.com/222464/PGE

gym-inventory: Inventory Control Environments

Gym-inventory是一个单一代理域,具有AI代理在库存控制问题中可能遇到的离散状态和动作空间。

在此处了解更多信息:https : //github.com/paulhendricks/gym-inventory

gym-gazebo: 在gazebo中训练机器人

gym-gazebo使用ROS和Gazebo(一种先进的3D建模和渲染工具)展示了最初的OpenAI体育馆的扩展。

在此处了解更多信息:https : //github.com/erlerobot/gym-gazebo/

gym-maze: 2D迷宫环境

一个简单的2D迷宫环境,代理可以从起始位置到达目标。

在此处了解更多信息:https : //github.com/tuzzer/gym-maze/

osim-rl: OpenSim中的肌肉骨骼模型

一个人体肌肉骨骼模型和一个基于物理的仿真环境,您可以在其中合成物理和生理上精确的运动。在此框架中构建的环境之一是针对NIPS 2017挑战的竞争环境。

在此处了解更多信息:https : //github.com/stanfordnmbl/osim-rl

gym-minigrid: 简约的Gridworld环境

简约的gridworld环境。力求最大程度地减少软件依赖性,易于扩展并提供良好的性能,以加快培训速度。

在此处了解更多信息:https : //github.com/maximecb/gym-minigrid

gym-miniworld: 简约的3D室内环境模拟器

MiniWorld是用于强化学习和机器人研究的简约3D室内环境模拟器。它可用于模拟房间,门,走廊和各种物体的环境(例如:办公室和家庭环境,迷宫)。MiniWorld可以看作是VizDoom或DMLab的替代品。它是用Python 100%编写的,旨在易于修改或扩展。

在此处了解更多信息:https : //github.com/maximecb/gym-miniworld

gym-sokoban: 2D运输难题

环境由运输难题组成,玩家的目标是将所有箱子推入仓库的存储位置。该环境的优势在于,每次初始化或重置时,它都会生成一个新的随机级别,这可以防止过度拟合到预定义级别。

在此处了解更多信息:https : //github.com/mpSchrader/gym-sokoban

gym-duckietown: Duckietown的跟随车道模拟器

为Duckietown项目(小型自动驾驶汽车课程)建造的行车跟踪模拟器。

在此处了解更多信息:https : //github.com/duckietown/gym-duckietown

GymFC: 飞行控制调整和培训框架

GymFC是用于合成神经飞行控制器的模块化框架。该体系结构集成了数字孪生概念,可将经过培训的策略无缝传输到硬件。OpenAI环境已用于为世界上第一个开源神经网络飞行控制固件Neuroflight生成策略。

在此处了解更多信息:https : //github.com/wil3/gymfc/

gym-anytrading: 交易市场环境

AnyTrading是OpenAI Gym环境的集合,用于基于强化学习的交易算法,特别注重简单性,灵活性和全面性。

在此处了解更多信息:https : //github.com/AminHP/gym-anytrading

GymGo: 棋盘游戏

棋盘游戏Go的实现

在此处了解更多信息:https : //github.com/aigagror/GymGo

gym-electric-motor: 智能控制电驱动

考虑到不同类型的电动机和转换器,用于模拟各种电驱动器的环境。控制方案可以是连续的,产生电压占空比,也可以是离散的,直接确定转换器的开关状态。

在此处了解更多信息:https : //github.com/upb-lea/gym-electric-motor

你可能感兴趣的:(深度学习,强化学习)