今天受同学启发,决定写日志记录一下我的毕设之旅。
题目是CS294-112 Deep Reinforcement Learning HW2:Policy Gradients
Win10+Anaconda3+Python3.6
零基础 目前用一个礼拜看了吴恩达的机器学习课程,一礼拜看了吴恩达深度学习的第一课+第二课中tensorflow那一讲
David Sliver强化学习的第一讲、李宏毅的ML Lecture 28、莫烦Python强化学习的内容
基本上还是只有一些理论概念,无法系统编程,庆幸的是作业中已经给好了架构,降低了难度。
到现在为止遇到最大的问题就是gym的环境配置,在安装好gym后用最简单的代码测试
import gym
env=gym.make('CartPole-v0')
env.reset()
报错: NotImplementedError:abstract
踩了无数坑最后在github的issue里找到了办法,很简单,在Anaconda Prompt中输入
pip install pyglet==1.2.4
因该是pyglet版本太高而导致的一些问题,回退到pyglet1.2.4就能够解决这个问题。
第二个坑是Mujoco以及Mujoco_py的安装
到现在也没有解决问题,甚至懒得总结,不知道有没有人在win64上成功安装了,如果有,希望可以告诉我。。我已经领取了mujoco的一个月免费,希望在一个月里我可以解决这个问题。(申请了学生的一年免费,但是一直没有收到邮件)