安装tensorflow-gpu+CUDA+cuDNN--基于linux和win10环境

1、下载地址

(1) tensorflow-gpu和CUDA版本要对应,否则可能会引起某些错误,下面的地址可以查询tensorflow和CUDA的对应关系。

https://tensorflow.google.cn/install/source

(2) CUDA下载地址  

https://developer.nvidia.com/cuda-toolkit-archive

(3) cuDNN下载地址(需要注册Nvidia帐号后下载)

https://developer.nvidia.com/rdp/cudnn-archive

不想注册的可以在这里下载

Linux版本:

  • cuda_9.0.176_384.81_linux.run
    链接:https://pan.baidu.com/s/1Dm0X3x_2smWKUScr6S37JQ  提取码:krc7 
  • cuda_10.0.130_410.48_linux.run   
    链接:https://pan.baidu.com/s/1ckwsljWDW1Z56SHCaL87HA    提取码:grf1 
  • cudnn-9.0-linux-x64-v7.4.2.24.tgz (cudnn7.4.2 对应 CUDA9.0)
    链接:https://pan.baidu.com/s/14VNiFgR4VSPY_XT3PRgrZw    提取码:cddo
  • cudnn-10.0-linux-x64-v7.6.2.24.tgz (cudnn7.6.2 对应 CUDA10.0)
    链接:https://pan.baidu.com/s/1CDsvs9Vo_aTq7Ip15U8_3Q     提取码:x0fd

Windows版本:

  • cuda_9.0.176_windows.exe   
    链接:https://pan.baidu.com/s/1q614ZsTrnm63TnDJzl-I8A    提取码:sv25 
  • cudnn-9.0-windows7-x64-v7.4.2.24.zip (cudnn7.4.2 对应 CUDA9.0)
    链接:https://pan.baidu.com/s/1pM1cTdybfwLTyRnHvgIMew   提取码:ueag

在开始下面的安装之前请确保显卡驱动已经正确安装,win10环境下的显卡安装很简单,直接运行安装文件即可,linux下的显卡驱动安装方法及遇到的问题解决方法可以参考这里https://blog.csdn.net/root_clive/article/details/100175108。

2、linux环境下安装

系统是Ubuntu16.04,在GTX1050Ti和RTX2080Ti上分别安装下面的版本(我自己实验的结果)。

GTX1050Ti:python3.5.2+tensorflow-gpu1.11.0+CUDA9.0+cuDNN7.4.2

RTX2080Ti:python3.6.6+tensorflow-gpu1.13.1+CUDA10.0+cuDNN7.6.2

(1) 使用pip安装tensorflow

sudo pip3 install tensorflow-gpu==1.11.0

这里的版本号根据需要安装,不同的显卡支持的版本有区别。

(2) 在https://developer.nvidia.com/cuda-downloads下载相应版本CUDA的runfile(local)安装包,直接运行runfile即可,安装完后配置环境变量。

export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=$CUDA_HOME/lib64
export PATH=$CUDA_HOME/bin:$PATH

(3) 在https://developer.nvidia.com/rdp/cudnn-archive下载对应版本的cuDNN,选择cuDNN Library for Linux。

安装tensorflow-gpu+CUDA+cuDNN--基于linux和win10环境_第1张图片

直接将cuDNN解压出来的文件复制到CUDA安装的目录即可。进入cuDNN解压缩的目录,然后执行

sudo cp -r ./* /usr/local/cuda-9.0

重启后安装就结束了。如果需要更详细的步骤,可以参考网上的教程。

3、win10环境下安装

win10环境为:python3.5.2+tensorfow-gpu1.12.0+CUDA9.0.176+cuDNN7.6.1

(1) 使用pip安装tensorflow

sudo pip install tensorflow-gpu==1.12.0

(2) 下载CUDA9.0

下载地址 https://developer.nvidia.com/cuda-toolkit-archive,下载完成后直接安装即可。

(3) 安装cuDNN下载地址 https://developer.nvidia.com/rdp/cudnn-archive,如下图所示选择下载文件。
安装tensorflow-gpu+CUDA+cuDNN--基于linux和win10环境_第2张图片

将安装文件解压到CUDA的安装目录(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0)即可。

4、安装使用中遇到的问题

1、安装CUDA9.0后出现下面的错误

ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory

这个错误是由于tensorflow版本和CUDA不匹配造成的,安装对应版本的tensorflow即可。

sudo pip3 install tensorflow-gpu==1.11.0

2、找不到libcublas.so.9.0

ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

有可能是环境变量LD_LIBRARY_PATH配置的有问题,或者执行 sudo ldconfig /usr/local/cuda/lib64/ 也可以解决这个问题。

3、在GTX1050Ti上安装的版本是 python3.5.2+tensorflow-gpu1.11.0+CUDA9.0+cuDNN7.4.2,但是这个版本配置在RTX2080Ti上出现了下面的错误

E tensorflow/stream_executor/cuda/cuda_dnn.cc:81] CUDNN_STATUS_EXECUTION_FAILED

tensorflow.python.framework.errors_impl.InternalError: cuDNN launch failure

经过摸索,最终在RTX2080Ti上安装的版本是python3.6.6+tensorflow-gpu1.13.1+CUDA10.0+cuDNN7.6.2,上面的报错就解决了。

你可能感兴趣的:(安装调试)