ML-Agents + PyTorch遇到的问题

参考:https://www.cnblogs.com/gentlesunshine/p/12452360.html

虽然是之前的 ML-Agents v0.15.0,基于TensorFlow的,但是安装环境的道理都差不多

 

一、PyTorch、CUDA、cuDNN的版本问题

按着教程装了一遍,训练的时候出现这个:

ML-Agents + PyTorch遇到的问题_第1张图片

意思是PyTorch要1.6.0以上的版本,但是CUDA10.0最高版本也只是支持到PyTorch1.1.0,所以要重新安装CUDA和cuDNN。

参考:https://blog.csdn.net/HaoZiHuang/article/details/107878351

 

到这里我眉头一皱,感觉问题大了呀,于是从来不看官方文档的我去瞄了一喵

官方文档:https://github.com/Unity-Technologies/ml-agents/blob/release_12_docs/docs/localized/zh-CN/docs/Readme.md

还是官方文档好

 

 

下了一手CUDA11.2

ML-Agents + PyTorch遇到的问题_第2张图片

再来一手最新的cuDNN(没办法,虽然它是写的支持CUDA11.1,但我没得选)

ML-Agents + PyTorch遇到的问题_第3张图片

 

使用PyCharm安装PyTorch(失败了)

ML-Agents + PyTorch遇到的问题_第4张图片

出错了

ML-Agents + PyTorch遇到的问题_第5张图片

去官网看看

ML-Agents + PyTorch遇到的问题_第6张图片

这下总算好了吧

pip install C:\Users\liyuanhang\Desktop\torch-1.7.1+cu110-cp38-cp38-win_amd64.whl

ML-Agents + PyTorch遇到的问题_第7张图片

ML-Agents + PyTorch遇到的问题_第8张图片

 

验证一下Pytorch是否可以使用GPU和CUDA

意思是我电脑没得NVIDIA GPU?

吓得我赶紧看了看

ML-Agents + PyTorch遇到的问题_第9张图片

真没有

参考:https://blog.csdn.net/weixin_41194129/article/details/107475509

那算了,换台电脑吧

家里有台旧电脑,配置很辣鸡,但是显卡是NVIDIA,所以装一个试试

 

老样子python,cuda,cudnn,Anaconda,pytorch

然后报错

参考:https://blog.csdn.net/weixin_42868552/article/details/107990522

参考:https://blog.csdn.net/hinson0710/article/details/107656971

但是vc的库我装好了也没用,把cafffe2_dectron_ops_gpu删了也没用,其他文件还是会报错

难道版本还是不对?

 

看了所有的地方都没办法

然后想一想,ProgramData这个文件夹好像是默认的“只读”和“隐藏”状态

改了之后还是没好

 

 

然后回到自己的电脑,装了没有cuda的pytorch

跟着官方文档走着

运行mlagents-learn出现这个

mlagents.trainers.exception.UnityTrainerException: Previous data from this run ID was found. Either specify a new run ID, use --resume to resume this run, or use the --force parameter to overwrite existing data.

ML-Agents + PyTorch遇到的问题_第10张图片

引发UnityTraineException(Mlagents.trainers.exception.UnityTrainerException:找到此运行ID中的以前数据。指定新的运行ID,使用--Resume恢复此运行,或者使用--force参数覆盖现有数据。

 

 

运行mlagents-learn --resume

出现这个

mlagents_envs.exception.UnityTimeOutException: The Unity environment took too long to respond. Make sure that :
         The environment does not need user interaction to launch
         The Agents' Behavior Parameters > Behavior Type is set to "Default"
         The environment and the Python interface have compatible versions.

ML-Agents + PyTorch遇到的问题_第11张图片

Unity花了太长时间才做出反应。

确保:该环境不需要用户交互即可启动。

          代理的行为参数>行为类型设置为“Default”

           环境和Python接口具有兼容的版本

查了下有人是因为项目路径有中文——但我没有,PASS

 

 

不管了,先搞一下Demo吧

ML-Agents + PyTorch遇到的问题_第12张图片

 

但是tensorboard没出来

ML-Agents + PyTorch遇到的问题_第13张图片

装个tensorflow吧

pip install tensorflow-cpu -i https://pypi.douban.com/simple/

装着装着就报错了

 

 

记录下几个命令:

//  mlagents-learn config/try1_config.yaml --run-id=try1-1 --train

// mlagents-learn config\trainer_config.yaml --run-id=test01 --train

 

// mlagents-learn config\ppo\3DBall.yaml --run-id=tryball01 --train

//C:\Users\liyuanhang\Desktop\mirrors-Unity-ML-Agents-master\Unity-ML-Agents\config\ppo

// tensorboard --logdir="C:\Users\liyuanhang\Desktop\mirrors-Unity-ML-Agents-master\Unity-ML-Agents\results\tryball01\run_logs"-host=127.0.0.1 

// mlagents-learn config\ppo\WalkerDynamic.yaml --run-id=tryWalker01 --train

// mlagents-learn config\ppo\WalkerDynamic.yaml --run-id=tryWalker0416 --train

 

 

总结:

没有英伟达显卡的要装cpu版的pytorch,ml-agents照旧,但是部分项目结构和原来的不同,命令也有些改变,跟着官方文档不会错

咱这小白好惨的

【0118】隔了好多天发现这个还在草稿箱,先占个坑

 

【0120】发现tensorboard出不来是因为浏览器的原因,原来用的QQ浏览器,现在换了谷歌就好了

运行命令要另开一个环境进入目录运行tensorboard --logdir results

ML-Agents + PyTorch遇到的问题_第14张图片

ML-Agents + PyTorch遇到的问题_第15张图片

ML-Agents + PyTorch遇到的问题_第16张图片ML-Agents + PyTorch遇到的问题_第17张图片

 

 

训练小球追方块

ML-Agents + PyTorch遇到的问题_第18张图片

(base) C:\Users\liyuanhang\Desktop\mirrors-Unity-ML-Agents-master\Unity-ML-Agents>mlagents-learn config/try1_config.yaml --run-id=firstTry01

ML-Agents + PyTorch遇到的问题_第19张图片

ML-Agents + PyTorch遇到的问题_第20张图片

ML-Agents + PyTorch遇到的问题_第21张图片

ML-Agents + PyTorch遇到的问题_第22张图片

 

 

 

2021-0219:新建项目时,先在packages management里面装ml-agent再升级

ML-Agents + PyTorch遇到的问题_第23张图片

当我换了工程的地方,再次训练的时候报错

ML-Agents + PyTorch遇到的问题_第24张图片

这个时候需要

pip install -e ml-agents-envs -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

pip install -e ml-agents -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

然后又报错

ML-Agents + PyTorch遇到的问题_第25张图片

可能是要更新pip工具

但是又发现没用

应该是包的版本问题,但是是哪些包呢

不管了,又开了个新环境,装了pytorch然后是上面俩命令开搞,欧克了

 

 

进行Walk换模型的步骤大概是,建模,骨骼,蒙皮,进unity,对walkagent脚本绑定骨骼,生成ragdoll,删除角色控制器,添加覆写的那个,各个刚体的关系,碰撞器,地面接触脚本

0416发现没有谷歌的,有链接关系的骨骼会让模型动不起来,把模型做的分开就好,不用蒙皮

 

 

--resume的话,要改配置,不然只到500000步,就没达到要求

ML-Agents + PyTorch遇到的问题_第26张图片

但是改了配置就不能用了

ML-Agents + PyTorch遇到的问题_第27张图片

呃,是因为behavior的名字没改,改了之后后开始全新的冒险

0423出现Target不刷新,原因是自己的模型上面没有agent标签

 

你可能感兴趣的:(unity,unity,强化学习)