WIN10+CUDA10.1+torch+tensorflow-gpu=1.15.0安装时踩过的坑

WIN10+CUDA10.1+CUDNN+torch+tensorflow-gpu安装踩过的坑

  • CUDA+CUDNN的重新安装
  • Tensorflow-gpu与torch兼容的问题
  • 总结:
    • 希望能帮到大家!

这一整个周末都在踩坑的过程中,把我踩过的坑记录一下,也希望能帮到大家!

CUDA+CUDNN的重新安装

网上已经有很多CUDA与CUDNN安装的教程了,还有CUDA和显卡驱动匹配的细节,这里就不再多说了。主要说说踩过的坑。。

因为我的电脑之前安装的是CUDA9.0,因为需要用最新版的torch1.4.0,但是没有适合CUDA9.0的版本,于是想卸载掉CUDA9.0,安装其他版本。

坑1: 卸载CUDA9.0:这里不要怕多卸载东西,除了NVIDIA图形驱动程序、NVIDIA Physx系统软件其余的全部卸载掉,包括GeForce Experience,音频驱动等等,这些都会在CUDA重新安装过程中安装的。

坑2: 完整删除NVIDIA相关的文件夹:跟着操作即可需要注意的是,在重启之后,安装不要全部点,要把VS安装那项去掉,不然还是会安装失败。WIN10+CUDA10.1+torch+tensorflow-gpu=1.15.0安装时踩过的坑_第1张图片
跟着操作单独安装VS即可,之后安装CUDNN就可以了

Tensorflow-gpu与torch兼容的问题

这里还需要提一下,CUDA10是不支持WIN10系统最新版torch1.4.0的(LINUX可以),于是我就又把CUDA10卸载,安装了CUDA10.1,此时又有了新的问题。(此处省略口吐芬芳)
tensorflow-gpu1.13.0以上目前仍然不支持CUDA10.1,CUDA10才可以正常使用,但是torch1.4.0又不支持CUDA10。
这时候重点来了!虽然我们本地安装的是CUDA10.1,tensorflow-gpu1.15.0会无法调用,但是我们可以安装一个叫做cudatoolkit==10.0的包,安装之后神奇的变好了。
在知乎上看见一个帖子说在anaconda里调用的实际上是cudatoolkit。emm,不用太在意细节,反正配好环境就好了。

import tensorflow as tf
hello= tf.constant('Hello, TensorFlow!')
sess= tf.Session()
print(sess.run(hello))
print(tf.test.is_gpu_available())

WIN10+CUDA10.1+torch+tensorflow-gpu=1.15.0安装时踩过的坑_第2张图片
如果显示显卡型号并且输出Hello,TensorFlow!表示tensorflow是可用的,输出True表示tensorflow-gpu是可用的。
如果我们不安装cudatoolkit==10.0 则会输出False,并且右上角的红框内,会显示cudart64_100.dll等一系列not found。

import torch
print(torch.cuda.is_available())

可以测试torch-gpu是否可用
在这里插入图片描述

总结:

1.重新安装CUDA需要再安全模式删除原本的驱动,重启后去掉安装VS的选项。
2.需要用tensorflow-gpu时可以在anaconda里安装对应版本的cudatoolkit。

希望能帮到大家!

你可能感兴趣的:(深度学习)