CartPole

（1-3）强化学习的理论基础：OpenAI Gym环境初探

本节将通过两个经典环境——CartPole和VacuumWorld——来展示如何使用OpenAIGym进行强化学习的实战演练。

码农三叔·2025-06-15 17:53

强化学习实战：用Q-learning玩转OpenAI Gym

Q-learning玩转OpenAIGym系统化学习人工智能网站（收藏）：https://www.captainbed.cn/flu文章目录强化学习实战：用Q-learning玩转OpenAIGym摘要引言环境1：CartPole-v1

layneyao·2025-06-14 01:55

强化学习实战：训练AI玩转OpenAI Gym

）：https://www.captainbed.cn/flu文章目录强化学习实战：训练AI玩转OpenAIGym摘要引言强化学习基础与算法分类1.核心概念与数学表示2.算法分类与典型应用场景实战一：CartPole

layneyao·2025-05-29 08:18

OpenAI Gym 提供了丰富的强化学习测试环境

OpenAIGym提供了丰富的强化学习测试环境，以下按类别列举经典环境及其核心特性：一、经典控制（ClassicControl）环境ID目标描述状态空间动作空间终止条件CartPole-v1平衡倒立摆4

大霸王龙·2025-04-14 05:11

PyTorch 深度学习实战（12）：Actor-Critic 算法与策略优化

在上一篇文章中，我们介绍了强化学习的基本概念，并使用深度Q网络（DQN）解决了CartPole问题。

进取星辰·2025-03-18 19:17

PyTorch 深度学习实战（13）：Proximal Policy Optimization (PPO) 算法

在上一篇文章中，我们介绍了Actor-Critic算法，并使用它解决了CartPole问题。

进取星辰·2025-03-14 19:47

强化学习实践 openai gymnasium CartPole-v1 DQN算法实现

文章目录前言DQN简介环境简介任务实现说开来去我的Github实现：gym（GitHub）本篇博客主要是个人实现过程的主观感受，如果想要使用模型可以直接去GitHub仓库，注释完善且规范。觉得有用请给我点个star！前言最近在学习强化学习，大致过了一遍强化学习的数学原理（视频）。视频讲的很好，但是实践的部分总是感觉有点匮乏（毕竟解决gridworld方格世界（GitHub）的问题的很难给人特别大的

abstcol·2025-03-05 14:12

DQN深度强化学习：CartPole倒立摆任务（完整代码）

二、什么是CartPole**推车**倒立摆任务？三、安装环境四、定义QNet五、定义DQNAgent初始配置动作选择（ε-贪婪策略）六、完整代码七、训练结果一、什么是DQN？

林泽毅·2025-02-08 21:45

强化学习代码实践1.DDQN:在CartPole游戏中实现 Double DQN

强化学习代码实践1.DDQN:在CartPole游戏中实现DoubleDQN1.导入依赖2.定义Q网络3.创建Agent4.训练过程5.解释6.调整超参数在CartPole游戏中实现DoubleDQN（

洪小帅·2025-01-23 12:58

强化学习应用——倒立摆

新建虚拟环境并安装：pipinstallgympipinstallpygame运行下列代码：importgymimporttime#生成环境env=gym.make('CartPole-v1',render_mode

ThreeS_tones·2024-03-10 12:39

100天持续行动—Day22

还在网上搜到个简易教程，跟着视频敲代码，简单玩了一下CartPole.

Richard_DL·2024-02-03 21:18

OpenAI Gym 中级教程——强化学习实践项目

我们选择一个简单而经典的问题：CartPole，这是一个控制小车平衡杆的问题。我们将使用深度Q网络（DQN）算法来解决这个问题。

Echo_Wish·2024-02-02 16:22

强化学习 - Policy Gradient Methods（策略梯度方法）

在这个例子中，我们将使用OpenAIGym的CartPole环境。i

草明·2024-01-25 21:53

Pytorch 实现强化学习策略梯度Reinforce算法

`伪代码：二、核心代码defmain():env=gym.make('CartPole-v0')obs_n=env.observation_space.shape[0]act_n=env.action_space.nlogger.info

爱喝咖啡的加菲猫·2024-01-25 14:31

深度强化学习算法PPO训练CartPole

PPO代码部分，训练离散动作1.导入必须要的包importtorchimporttorch.nnasnnimporttorch.nn.functionalasfimporttorch.optimasoptimfromtorch.distributionsimportCategoricalfromcollectionsimportdequeimportrandomimportmatplotlib.p

槑槑紫·2024-01-17 06:27

PPO 跑CartPole-v1

gym-0.26.2cartPole-v1参考动手学强化学习书中的代码,并做了一些修改代码importgymimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFimportnumpyasnpimportmatplotlib.pyplotaspltfromtqdmimporttqdmclassPolicyNet

NoahBBQ·2024-01-17 06:52

Actor-Critic 跑 CartPole-v1

gym-0.26.1CartPole-v1Actor-Critic这里采用时序差分残差ψt=rt+γVπθ(st+1)−Vπθ(st)\psi_t=r_t+\gammaV_{\pi_\theta}(s_

NoahBBQ·2024-01-06 17:17

Noisy DQN 跑 CartPole-v1

gym0.26.1CartPole-v1NoisyNetDQNNoisyNet就是把原来Linear里的w/b换成mu+sigma*epsilon,这是一种非常简单的方法，但是可以显著提升DQN的表现。

NoahBBQ·2024-01-06 17:16

Gym强化学习自定义环境的搭建

Gym环境标准基本的Gym环境如下图所示：importgymenv=gym.make('CartPole

棋圣阳阳阳·2024-01-04 06:25

用一个小游戏入门深度强化学习

今天我们来用深度强化学习算法deepQ-learning玩CartPole游戏。

不会停的蜗牛·2024-01-01 13:54

普通策略梯度算法原理及PyTorch实现【VPG】

然后，我们将训练它完成著名的CartPole挑战—学习从左向右移动购物车以平衡杆子。在此过程中，我们还将完成对OpenAI的SpinningUp学习资源的第一个挑战。

新缸中之脑·2023-12-06 08:39

【强化学习】10 —— DQN算法

文章目录深度强化学习价值和策略近似RL与DL结合产生的问题深度强化学习的分类Q-learning回顾深度Q网络（DQN）经验回放优先经验回放目标网络算法流程代码实践CartPole环境代码结果参考深度强化学习价值和策略近似我们可以利用深度神经网络建立这些近似函数深度强化学习使强化学习算法能够以端到端的方式解决复杂问题

yuan〇·2023-10-29 08:56

RL 实践（7）—— CartPole【TPRO & PPO】

本文介绍PPO这个onlineRL的经典算法，并在CartPole-V0上进行测试。

云端FFF·2023-08-15 17:22

强化学习-DDQN和Duelling Network实践(倒立摆CartPole代码解读)

一、说明在这个项目中，即便你对强化学习一无所知，学习这个视频(DDQN+DuellingNetwork+优先经验回放-强化学习CartPole代码解读_哔哩哔哩_bilibili)，你也能完成简单的强化学习项目

机智翔学长·2023-08-15 15:22

DQN教程-CartPole

这个教程展示了如何在gym库里的cartpole环境中用pytorch去训练一个DQN代理。任务这个代理有两个动作，将小车左移或者右移动，以便让这个附着的杆保持直立。

木头人puppet·2023-08-12 14:56

强化学习(DQN）教程

强化学习(DQN）教程本教程介绍了如何使用PyTorch在OpenAIGym上的CartPole-v0任务上训练深度Q-learning(DQN)智能体。

yanglamei1962·2023-08-04 08:15

强化学习笔记

强化学习笔记1.环境配置2.CartPole游戏参考工作需要，可能要自己了解一些DQN方面的知识，所以记录一下自己的学习笔记吧。

我是小z呀·2023-08-02 00:45

cartpole的轨迹优化的环境配置与安装_casadi c++

1.安装CasADi优化库2.安装cartpole_casadi_cplusplus库3.运行例程1.安装CasADi优化库使用运行机器狗仿真的yobogo的ubuntu16.04系统，这样不用重复安装

阿狸OKay·2023-07-29 15:42

RL 实践（6）—— CartPole【REINFORCE with baseline & A2C】

本文介绍REINFORCEwithbaseline和A2C这两个带baseline的策略梯度方法，并在CartPole-V0上验证它们和无baseline的原始方法REINFORCE&Actor-Critic

云端FFF·2023-07-29 03:54

ubuntu不能显示env.render() 画面全黑/Your graphics drivers do not support OpenGL 2.0.

错误记录今天博主在执行importgymenv=gym.make('CartPole-v1')env.reset()env.render()出现了以下错误：YourgraphicsdriversdonotsupportOpenGL2.0

行业边缘的摸鱼怪·2023-06-16 21:26

AttributeError:‘CartPoleEnv‘ object has no attribute ‘seed‘解决方案

前言在尝试运行gym的classiccontrol模块中的CartPole的相关代码时，想用随机种子重置一下环境，结果不停的报AttributeError:'CartPoleEnv'objecthasnoattribute'seed

行业边缘的摸鱼怪·2023-06-16 21:25

如何使用PyTorch 在 OpenAI Gym 上的 CartPole-v0 任务上训练深度 Q 学习（DQN）智能体

强化学习（DQN）教程本教程说明如何使用PyTorch在OpenAIGym上的CartPole-v0任务上训练深度Q学习（DQN）智能体。

yanglamei1962·2023-06-16 10:36

【二】gym初次入门一学就会---代码详细解析简明教程----平衡杆案例

【五】gym搭建自己的环境____详细定义自己myenv.py文件【六】gym搭建自己环境升级版设计，动态障碍------强化学习gym简明教程创建CartPole-v0的环境.importgymenv

汀、人工智能·2023-06-10 21:32

OpenAI gym:安装与简单使用

ice_bear221·2023-04-15 00:23

测试gym的cartPole 出错后的更改

今天回去重新跑gym的cartPole用例，更新了包的版本后出现错误python版本：Python3.9.13gym版本：gym0.26.2网上看到的代码块：importgym #导入Gym的Python

insid1out·2023-02-07 11:07

深度强化学习算法(朴素DQN,DDQN,PPO,A3C等)比较与实现

用的算例是OpenAI官网gym提供的算例环境"CartPole-v1"游戏,代码实现部分在谷歌全家桶(Colab,tensorflow2,wandb)中完成1.朴素DQN原论文：[DQN]PlayingAtariwithDeepReinforcementLearning

lblbc·2023-02-01 07:25

用tensorflow 创建一个基于策略网络的Agent来解决CartPole问题

所谓的策略网络，即建立一个神经网络模型，它可以通过观察环境状态，直接预测出目前最应该执行的策略（policy），执行这个策略可以获得最大的期望收益（包括现在的和未来的reward）。和之前的任务不同，在强化学习中可能没有绝对正确的学习目标，样本的feature和label也不在一一对应。我们的学习目标是期望价值，即当前获得的reward和未来潜在的可获取的reward。所以在策略网络中不只是使用当

河南骏·2023-01-27 11:03

ppo玩cartpole(离散动作)

https://github.com/hitgub123/rlratio=pi_prob/(oldpi_prob+1e-5)，表示真实选择的行为的在两个概率分布下概率的比值。更新模型参数时，保证该比值在一定范围内。importtensorflowastffromtensorflowimportkerasfromkeras.layersimport*importnumpyasnpimportgymn

安達と島村·2023-01-19 15:15

【强化学习】基于tensorflow2.x 的 PPO2（离散动作情况）训练 CartPole-v1

算法流程代码importmatplotlib.pyplotaspltimporttensorflowastfimportnumpyasnpimportgymimportcopydefbuild_actor_network(state_dim,action_dim):model=tf.keras.Sequential([tf.keras.layers.Dense(units=128,activati

昵称已被吞噬~‘(*@﹏@*)’~·2023-01-19 15:38

攻克强化学习技术难题记录

第1次迭代的设计思路：强化学习demo游戏“cartpole”重述游戏目标：向左/右移动小车cart，保证杆pole始终在小车上方，是大多数强化学习入门教材都会介绍的一个经典案例。

刘元职业车队·2023-01-14 11:30

dqn dueling 算法 CartPole-v0 三网络实现

原文链接:dqndueling算法CartPole-v0三网络实现上一篇:python捕获warning下一篇:faststyletransfer快速风格转换tfjsdueling单输出,变为双输出,一个为价值输出

阿豪boy·2023-01-14 11:55

【RL】Tensorflow2实现DQN，CartPole环境

代码参考修改自：PARL实现DQN，CartPole环境内容参考视频：世界冠军带你从零实践强化学习【RL】Tensorflow2实现DQN，CartPole环境代码地址DQN的两大创新点经验回放（ExperienceRepaly

LittleSeedling·2023-01-14 11:54

【强化学习实战-05】Dueling DQN保姆级教程(1)：以Cart Pole为例

【强化学习实战-05】DuelingDQN保姆级教程：以CartPole为例DuelingDQNAdvantagefunction(优势函数)DuelingNetworkDuelingNetwork实战

刘兴禄·2023-01-14 11:53

强化学习（实践）：DQN，Double DQN，Dueling DQN，格子环境

1，DQN算法1.1，CarPole环境以车杆（CartPole）环境为例，它的状态值就是连续的，动作值是离散的。

燕双嘤·2023-01-14 11:22

DQN tensorflow2 + OpenAI gym 实战

手动编环境是一件很耗时间的事情,所以如果有能力使用别人已经编好的环境,可以节约我们很多时间.OpenAIgym就是这样一个模块,他提供了我们很多优秀的模拟环境.我们的各种强化学习算法都能使用这些环境.CARTPOLE-V1

super晓权·2023-01-13 10:03

gym库文档学习（一）

最近老板突然让我编写一个自定义的强化学习环境，一头雾水（烦），没办法，硬着头皮啃官方文档咯~第一节先学习常用的API：1初始化环境在Gym中初始化环境非常简单，可以通过以下方式完成：importgymenv=gym.make('CartPole-v0

Cary.·2023-01-13 10:20

(1) 如何写一个gym环境——学习笔记

以CartPole-v0为一个简单的例子step1:导入gym模块importgymstep2:创建一个小车倒立摆模型env=gym.make('CartPole-v0')step3:初始化环境env.reset

永不言弃的小颖子·2023-01-13 10:20

强化学习 --gym env.render()报错

importgymenv=gym.make('CartPole-v0')env.reset()for_inrange(10):env.render()env.step(env.action_space.sample

weixin_30586257·2023-01-13 10:19

强化学习（DQN）教程

ReinforcementLearning(DQN)Tutorial—PyTorchTutorials1.12.0+cu102documentation作者：AdamPaszke本教程说明如何使用PyTorch在OpenAIGym上的CartPole-v0

元宇宙iwemeta·2023-01-13 10:18

深度强化学习专栏 —— 1.研究现状

戳这里猜你想看：深度强化学习专栏——1.研究现状深度强化学习专栏——2.手撕DQN算法实现CartPole控制深度强化学习专栏——3.实现一阶倒立摆pybullet杂谈：使用深度学习拟合相机坐标系与世界坐标系坐标变换关系

bug404_·2023-01-13 08:02

推荐频道