2080ti,驱动安装,CUDA安装,CUDNN安装,CUDA10.1的不兼容问题

-发现问题:哎呦,我跑的是CPU,不是GPU
-解决问题:Tensorflow目前不支持CUDA10.1
-继续解决问题:哎呦,驱动被不小心删掉了,那就全部重新安装吧!
-最终解决好了,跑起来了!

– 看似GPU,其实跑的是CPU:

之前写了代码发现,能跑起来,而且感觉像成功的调用了GPU。然后我的模型开始跑,但是我发现了?虽然我每次跑模型,但是我的GPU的显存占用很低,感觉只是存取数据的,而且利用率是0%。关键:就是在于GPU内存占用少,而且没有用GPU计算。这是从我们表面上看到的。
2080ti,驱动安装,CUDA安装,CUDNN安装,CUDA10.1的不兼容问题_第1张图片

然后继续发现,的确使用了CPU跑而不是用GPU跑。因为这些错误都出来了。所以以后就算跑起来了,也要仔细看看你是不是调用了GPU还是说只调用了CPU。
2080ti,驱动安装,CUDA安装,CUDNN安装,CUDA10.1的不兼容问题_第2张图片

然后后面没有截图,但是大概的意思是这些包我都找不到,那我就跳过GPU的注册用CPU啦~~~呵呵。

为什么会这样呢?服务器上安装的是CUDA10.1但是为什么跑去了10.0呢?因为目前tensorflow,就算是2.0.0也是只能支持到10.0,所以10.1的话当前不支持。所以不是最新的就是最好的,要稳定的。
参考链接——

–安装新的驱动,安装CUDA10.0和CUDNN

  1. 驱动安装:

首先我的驱动是2080ti,安装NVIDIA的驱动的话,就去上面的链接找你对应的型号,一般来说不难。安装驱动。下载连接

要对应你的GPU的型号。然后放到自己的服务器下对应的文件,接着$sudo ./NVIDIA-Linux-x86_64-415.13.run -no-x-check -no-nouveau-check -no-opengl-files

参考链接1

里面有些y和n的问题,自行百度。

  1. CUDA10.0安装

首先去官网下载对应的版本,一般选择for linux 如果你是Ubuntu系统,不管你是18.08还是16.04都无所谓。

然后放到你的服务器。接着:

sudo chmod +x ~/cuda_10.0.130_410.48_linux.run
sudo sh ~/cuda_10.0.130_410.48_linux.run
# 稍后会出现很多提示信息,可以长按空格键直接跳过

然后还是一堆y和n的问题,自行百度吧。

接着就安装完成了,你就在你的usr/local/ 下看到了CUDA和CUDA-10.0这些字眼的文件。然后你要配置你的环境,让你的环境知道,这里安装了CUDA。

vim ~/.bashrc

复制这些进去,记得根据你的路径改一改

export PATH=~/anaconda3/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin

然后保存然后输入 source ~/.bashrc 大功告成。

3.CUDNN的安装

去官网找到你对应的CUDNN,然后下载下来一半都是压缩包,你可以本地解压上传,也可以上传后在解压,反正就是解压。然后将里面的文件复制到对应的路径即可。这个最简单了,官网都告诉你怎么复制!

(1)下载安装文件
按需求下载cudnn的安装文件:https://developer.nvidia.com/rdp/cudnn-archive

(2)安装cudnn
我们从Nvidia官网上下载下来的cudnn for linux的文件格式是.solitairetheme8,想要解压的话需要先转成tgz格式再解压:

cp  cudnn-10.0-linux-x64-v7.3.1.20.solitairetheme8 cudnn-10.0-linux-x64-v7.3.1.20.tgz
tar -xvf cudnn-10.0-linux-x64-v7.3.1.20.tgz

解压下载的文件,可以看到cuda文件夹,在当前目录打开终端,执行如下命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

(3)查看cudnn版本
在终端输入

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

– Conda如何更好的安装组件

conda list
conda search tensorflow-gpu (这句话最关键了)
conda install tensorflow-gpu==1.13.1

然后就用conda安装你的tensorflow吧!

成功后的显示:
在这里插入图片描述

你可能感兴趣的:(图像处理,人工智能)