Anacoda + pytorch 环境下安装 DGL_GPU

首先假设您已安装了 pytorch 虚拟环境

在 cmd 中输入命令查看 cuda 版本

nvcc --version

打开 https://www.dgl.ai/pages/start.html 选择本地 CUDA 对应的 DGL_GPU 版本

然后复制下图红框里的命令,粘贴在 pycharm 终端即可

Anacoda + pytorch 环境下安装 DGL_GPU_第1张图片

亲测不需要再安装 GDL_CPU 版本

下面是本人踩的坑:

我刚开始先直接 pip install dgl 默认安装的 DGL_CPU 版本,但是跑起来又慢又卡

由于我的 pycharm 使用的 anacoda+pytorch 虚拟环境,因此我妄图去 anacoda 中安装 DGL_GPU

在 anacoda 命令行输入以下命令,先激活(进入)虚拟环境,再使用 conda 命令安装

#激活虚拟环境,envs_name为虚拟环境名
activate envs_name  

#安装 cuda 版本对应的 DGL_GPU
conda install -c dglteam dgl-cuda11.1  

#查看当前虚拟环境中安装了哪些包
pip list

然后 anacoda 这边显示安装好了,pip list 之后也能看到,但是 pycharm 的解释器里面就是找不到这个包。。。

无论我是 reload from disk,还是新建项目,甚至关机重启,它都执着地找不到。。。

于是我在 cmd 里用 nvidia-smi 命令查看了我的 cuda 版本,并且在 pycharm 的终端天真地按照它告诉我的版本安装了对应的 DGL_GPU

大概就是下面这条命令,其中 cuda 11.1

pip install dgl-cu111 dglgo -f https://data.dgl.ai/wheels/repo.html

经过了好几次锲而不舍的安装后,我以为我终于安好了,然而我还是太天真了。。。。。。

我不甘心地反复验证了好几次,每次都是同样的错误

FileNotFoundError: Could not find module ‘D:\anaconda\envs\envs_name\lib\site-packages\dgl\dgl.dll’ (or one of its dependencies). Try using the full path with constructor syntax.

然后又是同样的 reload from disk,新建项目,关机重启,而且我还专门去这个文件夹底下看了这个文件,它明明就在那里,鬼知道它为啥找不到。。。(可能还是跟 cuda 版本不匹配的问题)

然后因为时间来不及了,我就用 DGL_CPU 跑了,那感人的速度。。。50个epoch跑了半个小时

而且由于中间代码有错,就这速度还跑了好几遍,我真是服了它这个老六了

跑完(不代表跑对)最后一遍之后,我抓住把 DGL 不管是 GPU 还是 CPU 版本全卸了

卸载命令:

anacoda 中的虚拟环境

conda uninstall -c dglteam dgl-cuda11.1

pycharm 终端(GPU 和 CPU 版本)

pip uninstall dgl-cu111 dglgo
pip uninstall dgl

卸载的感觉真好!

最后的最后,我按照 nvcc --version 命令告诉我的 cuda 版本安装了 DGL_GPU(只安了它自己,没安装 DGL_CPU),反正它现在能跑了,不报错了(大抵也勉勉强强算是个好程序吧。。。)
 

你可能感兴趣的:(pytorch,python,机器学习,神经网络)