深度学习环境配置必看!(CUDA11.2、cudnn8.1.1、pytorch 1.8.0 Python3.9、Anaconda)

个人配置规格:python3.9 + CUDA 11.2 + Cudnn8.1.1 + pytorch1.8.0 + Anaconda4.14.0

自己捯饬该配置用了一天左右的时间,现在分享一下自己安装的时候使用的资料和踩过的坑,避免大家重复我的错误【唉一声哀叹】

安装前

(6条消息) 深度学习环境配置超详细教程【Anaconda+PyTorch(GPU版)+CUDA+cuDNN】_傲寒。的博客-CSDN博客_深度学习环境配置

这些环境配置对于版本一致性的要求很高,所以在下载这些组件前,最好查看CUDA、cuDNN、pytorch和python对应关系,不然后期就可能会出现:

  1. CUDA和cudnn的版本不一致,本子无法检测出CUDA或cudnn;
  2. CUDA和cudnn是一致了,但下载pytorch的时候发现官网Previous PyTorch Versions | PyTorch没有匹配的CUDA和cudnn,这样就会很麻烦;
  3. 明明想安装的是pytorch的gpu版本,但下载下来的确实cpu版本,找不到相对应的gpu的版本,就默认下载个cpu的版本,一看下好了高高兴兴,检查一下发现运行不了;

下载建议参考下方网站进行查看:

Index of /anaconda/cloud/pytorch/linux-64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

深度学习环境配置必看!(CUDA11.2、cudnn8.1.1、pytorch 1.8.0 Python3.9、Anaconda)_第1张图片

与此同时也应该考虑自己的本子的显卡支持CUDA的上限,在NVIDIA控制面板中可以查看,我的是11.6.1,在考虑CUDA的版本时只要比11.6.1低就可以;

深度学习环境配置必看!(CUDA11.2、cudnn8.1.1、pytorch 1.8.0 Python3.9、Anaconda)_第2张图片

 安装中可能会出现的问题:

1. 使用conda安装库时出错,failed with initial frozen solve. Retrying with flexible solve

可以采用以下命令:

conda config --set channel_priority flexible

 或

conda update -n base conda //更新一下conda,再下载一遍,如果你是使用的虚拟环境,base要改成虚拟环境的名称

看看是不是自己挑选的库的版本出现问题了,建议换一个其他的库下载看看

2.ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory: ‘C:\ProgramData\anaconda3\envs\tensorflow_gpu\lib\site-packages\numpy-1.20.3.dist-info\METADATA

直接把numpy-1.20.3.dist-info这个文件夹删除,重新下载即可

3. 安装pytorch时出现,Could not find a version that satisfies the requirement xxx (from versions: none)

卸载当前的pytorch

conda uninstall pytorch
conda uninstall libtorch

按照“安装前”部分给的网站找到和自己的CUDA以及cudnn匹配的pytorch版本,再去pytorch官方网站Previous PyTorch Versions | PyTorch找到指令重新下载。“镜像网站里没有自己安装的CUDA和cudnn怎么办?”CUDA对于一些版本是兼容的,我个人使用的是CUDA11.2,在镜像网站也没有找到完全匹配的版本,于是使用了CUDA11.1进行匹配,也成功了。

4. python版本一不小心设置成3.10,不支持一些组件怎么办?

conda install python=3.9

3.9是支持的,不要用3.10!!

5. 在Pycharm下创建Anaconda虚拟环境,但envs目录下没有interpreter解释器

深度学习环境配置必看!(CUDA11.2、cudnn8.1.1、pytorch 1.8.0 Python3.9、Anaconda)_第3张图片

 使用

conda config --show //看一下envs dirs的位置在哪儿,很可能虚拟环境不在那个目录下

我自己是在第一个目录下成功找到了python.exe

6. 安装pytorch时,出现Traceback (most recent call last): File “<stdin>“, line 1, in <module>NameError: name

pycharm中import torch显示No module named 'torch' - 知乎 (zhihu.com)

 很有可能是选择了错误的解释器

附版本查询方式:

CUDA:

nvcc -V //v必须是大写,小写报错

cuDNN:

进入CUDA的安装目录找到cudnn_version.h文件,我的文件在:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\include下,8.1.1即为cuDNN版本

深度学习环境配置必看!(CUDA11.2、cudnn8.1.1、pytorch 1.8.0 Python3.9、Anaconda)_第4张图片

 Anaconda:

conda -V

pytorch:

import torch
torch.__version__

python:

Python

你可能感兴趣的:(深度学习,pytorch,python)