ubuntu+tensorflow1.5.0gpu版+cuda9.0+cudnn7.0深度学习环境配置

Tensorflow深度学习环境相关配置

    这两天配置这个GPU深度学习环境也是费劲脑汁,参考了很多网上教程,但是有些已经过时了,参考意义不大,下面开始总结一下整个配置过程:

一、配置准备

1、首先查看电脑显卡是否支持cuda加速,贴出官方链接:https://developer.nvidia.com/cuda-gpus,

ubuntu+tensorflow1.5.0gpu版+cuda9.0+cudnn7.0深度学习环境配置_第1张图片

    选第四个,一般算力大于3.0的就可以进行cuda加速了。

2、考虑安装的tensorflow版本,不同tf版本对应支持的cuda+cudnn加速版本也不一样。

    题主安装的是最新的tensorflow-gpu-1.5.0版本,对于cuda支持的版本是cuda9.0,对于cudnn支持的版本是cudnn.v7.1.1_for_cuda9.0(别下错了,我最开始下的是cuda9.1,发现测试导入tensorflow总是找不到cuda,查了一下发现是版本不支持,于是删了重下的cuda9.0)。

    贴出官方下载链接:cuda——https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=deblocal

    cudnn——https://developer.nvidia.com/rdp/cudnn-download

二、开始配置

    安装教程按照官方安装说明:

    cuda安装,需要修改一下版本号,不然每次默认安装最新的cuda9.1

    1、安装cuda包,查看对于路径下的版本号

sudo dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
sudo apt-key add /var/cuda-repo-/7fa2af80.pub   
sudo apt-get update
sudo apt-get install cuda-9-0

安装完进测试一下是否正确安装版本

cd /usr/local/cuda/samples/1_Utilities/deviceQuery
make    #我的make过了
sudo ./deviceQuery

结果如图:

ubuntu+tensorflow1.5.0gpu版+cuda9.0+cudnn7.0深度学习环境配置_第2张图片

2、安装cudnn包

    解压包

tar -xzvf cudnn-9.0-linux-x64-v7.tgz

  复制下列文件到cuda文件路径下

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

    安装、测试样本文件,&HOME指定任意路径,需要新建一个文件夹,可以在Home下进行:mkdir CudnnTest

cp -r /usr/src/cudnn_samples_v7/ $HOME
cd  $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN

    如果测试出现了下述代码:

Test passed!

    说明整个Cudnn环境安装无误。

3、安装tensorflow-gpu

    我设置默认的是python3.5.2,所以用的pip3; 如果是python2的话对应的pip就行:

sudo pip3 install --upgrade tensorflow-gpu

    最后的导入效果如下:

ubuntu+tensorflow1.5.0gpu版+cuda9.0+cudnn7.0深度学习环境配置_第3张图片

可以用这篇文章的小程序跑一下是否能够支持GPU运行:http://blog.csdn.net/u011108244/article/details/77868546

(渣电脑就不发我跑的结果了,如果正确按照上述安装过程的话应该是没有错的。)

    ————————————————————————————手动分割线—————————————————————————————

三、配置失误看这里

    当然,如果不小心误操作了Cuda安装错了也没关系,用下述指令删除,(这里版本是9.1,对应不同情况自行修改):

sudo apt-get --purge remove cuda-9.1

    然后删除其余残余文件夹(如果还有的话,没有就不用删了):

sudo rm -r /usr/local/cuda-9.1 

    如果还不行,删除无用的依赖包,(谨慎使用,虽然我用了没什么事):

sudo apt autoremove
    删除了上一个版本cuda后,就可以重新下载安装自己想要的版本就行啦。

你可能感兴趣的:(computer)