[环境] OpenAI gym经典控制环境CartPole-v0 介绍

[环境]CartPole-v0

聊一聊我对强化学习的理解
对应的代码请访问我的GitHub:fxyang-bupt(可能你进去之后发现什么都没有,那是因为我注册了新的账号还在整理,这并不影响你先follow一下我的GitHub~)
目前正在把我的文字内容和代码整理成网络书籍的方式发布出来,敬请期待…

我很想把它做成一套简单易懂的白话系列,奈何做这种事真的不简单。我参考了很多资料,比如:
《白话强化学习与PyTorch》
《深入浅出强化学习:原理与入门》
《强化学习入门:从原理到实践》
“莫烦Python”
博客园 “刘建平Pinard” 的博客
北大 “ShusenTang” 的GitHub
……
这是一门比较前言的理论,目前正在发光发热。我并不推荐大家一开始就阅读大部头的《Reinforcement Learning》这本书,假期我花了一个月的时间去啃,效果并不好。反而是这种“平易近人”的教程更适合入门。不过各种“平易近人”的教程都会充斥着笔者自己的理解,这种事容易陷入到自嗨的怪圈,笔者自认为自己举了一个特别通俗的例子,而读者却一头雾水。
所以我把我在学习和实践过程中遇到的困惑,又做了二次解读的加工。有了这个系列的文章,希望能够有所贡献。成为帮助你入门的N多资料的其中之一。
我的代码用的框架比较杂,PyTorch TensorFlow1 TensorFlow2……都有。有人会在意TensorFlow2出来以后,1不是被淘汰了,为什么还要用?
5G都出了多长时间了,你那个卡的要死的4G手机换了吗?企业也是一样的。所以还是得用

希望毕业后我也能成为像 莫烦 和 Charlotte77 一样的知识分享者~这是自己的一个小兴趣

关于环境的介绍可以通过下面几篇文章了解,还能搞清楚gym包的组织规则。

OpenAI Gym: the CartPole-v0 environment

OpenAI Gym 经典控制环境介绍–CartPole(倒立摆)_思绪无限的博客-CSDN博客_cartpole

openai/gym

强化学习实践二 理解gym的建模思想

深度剖析 OpenAI Gym(持续更新)_taoyafan的博客-CSDN博客


但是,打开cartpole.py的源码可以发现,官方文档写的居然是错的![环境] OpenAI gym经典控制环境CartPole-v0 介绍_第1张图片
果然最靠得住的还是源码,如果编程中碰到一些问题感觉可能有错误,就大胆怀疑吧,找到源码去验证你的猜想~

你可能感兴趣的:(强化学习,gym,CartPole,强化学习)