初识gym——why is gym?

who

gym中的环境有几种,都可以在官网找到gym官网—环境

  • Classic control and toy text(经典控制和玩具文本)
  • Atari(Atari游戏)
  • 2D and 3D robots(2D和3D机器人)

使用代码

from gym import envs
print(envs.registry.all())

输出会是一个字典,其中包含gym的全部环境

开发RL算法时,请使用下面的写法,很简单

import gym
env = gym.make('CartPole-v0')

Background: Why Gym? (2016)

基本上官网在分析,RL现在哪里好,在哪里又受到限制。

这里简单摘要

  • 好处
  1. RL的应用可以很广
  2. RL现在在一些困难的场景中已经很厉害了,例如AlphaGo
  • 受到限制
  1. 适用RL的环境缺乏多样性
  2. 适用RL的环境缺乏标准,论文难以浮现

gym的目的就是解决这些

总结

官网的东西就这么多啦,算上这篇我已经总结了三篇gym官网的文档了。

接下来的工作就是

  1. 我会想办法把mujoco搞一套
  2. gym官网github上的代码分析一波
  3. 最后拿几个小环境跑跑一些更新更强大的RL算法
  4. 【附录】我其实水过pysc2,但这次我可能会认真搞一搞

有兴趣加关注啦

你可能感兴趣的:(强化学习)