Deep Reinforcement Learning

今天受同学启发,决定写日志记录一下我的毕设之旅。

题目是CS294-112 Deep Reinforcement Learning HW2:Policy Gradients

Win10+Anaconda3+Python3.6

零基础 目前用一个礼拜看了吴恩达的机器学习课程,一礼拜看了吴恩达深度学习的第一课+第二课中tensorflow那一讲

David Sliver强化学习的第一讲、李宏毅的ML Lecture 28、莫烦Python强化学习的内容

基本上还是只有一些理论概念,无法系统编程,庆幸的是作业中已经给好了架构,降低了难度。


到现在为止遇到最大的问题就是gym的环境配置,在安装好gym后用最简单的代码测试

import gym
env=gym.make('CartPole-v0')
env.reset()

报错: NotImplementedError:abstract

Deep Reinforcement Learning_第1张图片

踩了无数坑最后在github的issue里找到了办法,很简单,在Anaconda Prompt中输入

pip install pyglet==1.2.4

因该是pyglet版本太高而导致的一些问题,回退到pyglet1.2.4就能够解决这个问题。



第二个坑是Mujoco以及Mujoco_py的安装

到现在也没有解决问题,甚至懒得总结,不知道有没有人在win64上成功安装了,如果有,希望可以告诉我。。我已经领取了mujoco的一个月免费,希望在一个月里我可以解决这个问题。(申请了学生的一年免费,但是一直没有收到邮件)





你可能感兴趣的:(强化学习,python)