cuda 10, cudnn7.3.1, vs2017, anaconda5.3(python3.7的)。装的虚拟环境(python3.6.6). pytorch 1.0.1, tensorflow 1.13.1.
windows电脑里本来就已结有了driver。如果没有要自己下载。在英伟达的官网。
在下载cuda前先安装vs2017.(我电脑之前后,后来因为装错被我删了,这事后面说)。总之,先安装vc2017,否则后面运行tensorflow之类的会报错。我费了好大的劲找到的。之前一直显示sorry,我不能下载,发现好多人都有这个问题,反正这个可以下载。
https://docs.microsoft.com/en-us/visualstudio/releasenotes/vs2017-relnotes
安装的时候看别人的博客说要把C/C++的一个选项勾上。现在找不到这个博客了。我安装的时候把所有带C/C++字眼的选项都勾上了。
然后就是下载cuda了。现在官网给的是10.1,但是根据以前的经验,别下最新版的,但是根据这次的经验,也不要下载太旧的版本。所以我下的10.0的。
[link]https://developer.nvidia.com/cuda-toolkit-archive
接下来是cudnn。我下载的是7.3.1。全名是cuDNN v7.3.1 Library for Windows 10. 注意下载的时候要注册一下的,我直接用微信扫了一下。
https://developer.nvidia.com/rdp/cudnn-archive
下载后的cudnn是一个压缩包。解压后会有三个文件夹。然后找到你安装的cuda的文件夹。我安装在C盘的,默认路径C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0.
然后打开相应的文件夹,把cudnn文件夹中的文件复制到对于cuda的文件夹中就可以了。
cmd, 输入nvcc -V。 但是我显示找不到cuda.
然后我找到cuda的安装路径,我的是默认路径。…\extras\demo_suite,然后执行bandwidthTest.exe,最后显示pass. deviceQuery.exe,也是显示pass。
然后关掉cmd,重新打开,再输入nvcc -V。这下可以了。
接着是Anaconda。我没有安装最新的版本。请在下面的链接找自己想要的版本。
https://repo.anaconda.com/archive/
这里有anaconda 和python版本的对应关系
https://blog.csdn.net/yuejisuo1948/article/details/81043823
我下载的5.3的那个。这个版本支持python3.7.但是我之后创建了一个虚拟环境是python3.6的。
安装好了以后,准备安装pytorch。
按win键,在字母A中找到Anaconda3.点开下方的prompt。类似于cmd的。
首先创造虚拟环境
conda create -n pytorch1.0p3.6 python=3.6.6
pytorch1.0p3.6 是我虚拟环境的名字。
然后激活
conda activate pytorch1.0p3.6
我安装的是pytorch1.0.1版本的。看官网上会有详细的解释。最好用conda吧,之前用pip一直有问题。
装好之后找一段代码试一下,之前安装就是到这个一步出问题,什么cudnn报错,发现是版本不兼容。这个下文说。
测试完后关闭环境 conda deactivate
因为我经常要用tensorflow,所以我又创了一个环境叫tensorflow, python同样是3.6.6。
激活tensorflow的环境
首先是更新一下pip(之前用pip装pytorch,因为没更新,一直报错)
python -m pip install --upgrade pip
然后我安装的是1.13.1版本的。
之前看了这个博客
https://blog.csdn.net/qq_27825451/article/details/89082978
想装1.13.0的,但是显示没有这个版本。
pip install tensorflow-gpu==1.13.1
安装完成后,测试一段代码
import tensorflow as tf
hello=tf.constant('hello,world')
sess=tf.Session()
print(sess.run(hello))
最初的开始,我安装的是10.0的cuda,然后,安装了一半突然想到可能cuda太新会有问题。(我可能活在一年前)所以我还卸了10.0的cuda.然后装了9.0。卸载的时候发生了很多插曲。因为10.0的cuda需要vs2017,9.0的cuda需要vs2015。我卸载cuda10的时候一起把vs2017卸了(因为不卸装不了2015)。然后装9.0的cuda,和对应的cudnn。装anaconda的时候,使用5.2版本,安装pytorch,会报错,具体我也不清楚,但是安装5.1版本的时候就没问题了,可以正常import torch。但是!!!!!!跑程序的时候报错。error: CUDNN_STATUS_EXECUTION_FAILED
搜了一个是因为版本不兼容,那问题就复杂了,cuda cudnn,anaconda, python, pytorch。排列组合我要试到什么时候。
后来发现了一个问题,由于我最先是安装的cuda10, 导致我的driver升级成了411版本的,所以我觉得可能有问题。然后看到博客上有人用python3.6.6成功安装。所以我也这么做了。
https://blog.csdn.net/qq_39938666/article/details/86611474
后来看了别人的博客发现2080ti 不支持9.0,但是支持9.2。虽然师姐说她用的9.0成功了,但是,我还是安装的10.0。
装环境首先要看一下自己的cuda状态还有检查一下自己要装的所有东西支持什么,因为装错了要卸很麻烦。当然这件事是靠运气的。我没有遇到环境变量的问题,所以文中没有提到。唉,能用ubuntu就用ubuntu吧。
发现一个问题 cudnn还是装7.4.1,否则tensorflow报错