【强化学习】gym安装及示例

OpenAI Gym是一款用于研发和比较强化学习算法的工具包,其中包含了各种环境、桌面游戏等计算任务。

Windows下安装

Python版本 3.7.0

pip install gym==0.23.1 -i https://pypi.douban.com/simple

示例代码

import gym # 0.23.1
def main():
    env = gym.make('CartPole-v0') 
    for i_episode in range(30):
        # 重置界面(重置环境)
        observation = env.reset()
        for t in range(200):
            # 渲染界面
            env.render()
            # 输出状态
            print(observation)
            # 随机选择一个动作
            action = env.action_space.sample()
            # Agent执行一个动作之后,得到环境的反馈
            observation, reward, done, info = env.step(action) # Agent进入的下一个状态、Agent执行动作得到的奖励、学习过程是否结束、扩展信息  (此处如果gym版本过高 则将返回5个参数)
            if done:
                print("Episode finished after {} timesteps".format(t + 1))
                break

if __name__ == "__main__":
    main()

【强化学习】gym安装及示例_第1张图片

你可能感兴趣的:(强化学习,python,人工智能)