注1:这是给我的windows配置的记录
注2:已有安装包/安装程序均在D:\installpackage
注3:今年上半年写的了,懒得排版就发发好了
CUDA + cuDNN
关系:显卡,显卡驱动,nvcc,cuda driver,cuda toolkit,cuDNN
0. 如果没有nvidia driver,也要安装!
1. 首先安装CUDA(已有),要注意CUDA版本和显卡驱动版本是一一对应的
2. 配置环境变量
3. 测试安装成功否(打开命令行窗口,输入nvcc -V)
4. 再用官方示例测试,切换到CUDA自带测试用例路径:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\demo_suite。打开cmd,运行.\deviceQuery.exe得到下面结果说明安装成功。 注:这一步可能会失败,但是应该不太影响后续(还不清楚原因)。
5. 登录NVIDIA并下载深度学习GPU加速库cuDNN(已有)
6. 将解压后得到的.h .lib 和.dll 文件分别复制到cuda的include, lib/x64, bin 文件夹下(后者路径C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2)
7. 用官方示例测试,运行CUDA的官方示例,在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\demo_suite路径下打开cmd,运行.\deviceQuery.exe显示如下结果说明安装成功。
查询
cmd输入以下内容,查看显卡驱动版本(Driver Version: 442.19),显卡版本(GeForce MX250)
nvidia-smi
cmd输入以下内容,查询CUDA版本(V10.2.89)
nvcc --version
Anaconda + Pycharm
1. 安装Anaconda(已有),新建环境
2. 下载安装Pycharm(社区版即可,已有)
3. 使用自己创建的环境配置Pycharm
4. 更换清华镜像源
5. 查看需要下载的pytorch版本,用conda下载,去掉“-c python"便不再强制从官网下载了,参考 (torchvision,cudatoolkit会一并下载)
6. conda下载cudnn(如果已有这个包,就不必了) 注意:进入自己的环境再用此命令,否则会装到base下
conda install cudnn
7. 测试是否能使用CUDA
importtorch
flag=torch.cuda.is_available()
print(flag)
ngpu=1
# Decide which device we want to run on
device=torch.device("cuda:0"if(torch.cuda.is_available()andngpu>0)else"cpu")
print(device)
print(torch.cuda.get_device_name(0))
print(torch.rand(3,3).cuda())
如果flag=false
* 如果出现flag是False,检查一下驱动版本,有时需要手动下载最新的驱动(高级设置-清洁安装)。
* 检查pytorch版本,可能是pytorch与CUDA版本冲突
同等环境下使用python3.7,pytorch1.3,cudatoolkit10.1,上述示例一直失败,但是tensorflow可以正常使用GPU。挨个排查,直到修改完pytorch版本为1.2才成功。
配置环境
OS:win10(×64)
显卡:AMD GeForce MX250
显卡驱动:Driver Version: 442.19
CUDA:V10.2.89
cuDNN:7.6.5(与CUDA版本对应)
torch36环境:python3.6、pytorch(1.2.0,py3.6_cuda100_cudnn7_1)、cudatoolkit(10.0.130)、cudnn(7.6.5)