强化学习应用——倒立摆

新建虚拟环境并安装:

pip install gym

pip install pygame

运行下列代码:

import gym
import time
# 生成环境
env = gym.make('CartPole-v1', render_mode='human') # human指在人类显示器或终端上渲染
# 环境初始化
state = env.reset()
# 循环交互
while True:
    # 渲染画面
    env.render()
    # 从动作空间随机获取一个动作
    action = env.action_space.sample()
    # agent与环境进行一步交互
    state, reward, done, truncated, info = env.step(action)
    print('动作 = {0}: 当前状态 = {1}, 奖励 = {2}, 结束标志 = {3}, 日志信息 = {4}'.format(action, state, reward, done,info))
    # 判断当前episode 是否完成
    if done:
        print('done')
        break
    time.sleep(0.1)
# 环境结束
env.close()

参考:

强化学习实践(二)Gym(安装、环境搭建、运行倒立摆(代码可运行))_gym库-CSDN博客

你可能感兴趣的:(DRL,pygame,python,开发语言)