(1) tensorflow-gpu和CUDA版本要对应,否则可能会引起某些错误,下面的地址可以查询tensorflow和CUDA的对应关系。
https://tensorflow.google.cn/install/source
(2) CUDA下载地址
https://developer.nvidia.com/cuda-toolkit-archive
(3) cuDNN下载地址(需要注册Nvidia帐号后下载)
https://developer.nvidia.com/rdp/cudnn-archive
不想注册的可以在这里下载
Linux版本:
Windows版本:
在开始下面的安装之前请确保显卡驱动已经正确安装,win10环境下的显卡安装很简单,直接运行安装文件即可,linux下的显卡驱动安装方法及遇到的问题解决方法可以参考这里https://blog.csdn.net/root_clive/article/details/100175108。
系统是Ubuntu16.04,在GTX1050Ti和RTX2080Ti上分别安装下面的版本(我自己实验的结果)。
GTX1050Ti:python3.5.2+tensorflow-gpu1.11.0+CUDA9.0+cuDNN7.4.2
RTX2080Ti:python3.6.6+tensorflow-gpu1.13.1+CUDA10.0+cuDNN7.6.2
(1) 使用pip安装tensorflow
sudo pip3 install tensorflow-gpu==1.11.0
这里的版本号根据需要安装,不同的显卡支持的版本有区别。
(2) 在https://developer.nvidia.com/cuda-downloads下载相应版本CUDA的runfile(local)安装包,直接运行runfile即可,安装完后配置环境变量。
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=$CUDA_HOME/lib64
export PATH=$CUDA_HOME/bin:$PATH
(3) 在https://developer.nvidia.com/rdp/cudnn-archive下载对应版本的cuDNN,选择cuDNN Library for Linux。
直接将cuDNN解压出来的文件复制到CUDA安装的目录即可。进入cuDNN解压缩的目录,然后执行
sudo cp -r ./* /usr/local/cuda-9.0
重启后安装就结束了。如果需要更详细的步骤,可以参考网上的教程。
win10环境为:python3.5.2+tensorfow-gpu1.12.0+CUDA9.0.176+cuDNN7.6.1
(1) 使用pip安装tensorflow
sudo pip install tensorflow-gpu==1.12.0
(2) 下载CUDA9.0
下载地址 https://developer.nvidia.com/cuda-toolkit-archive,下载完成后直接安装即可。
(3) 安装cuDNN下载地址 https://developer.nvidia.com/rdp/cudnn-archive,如下图所示选择下载文件。
将安装文件解压到CUDA的安装目录(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0)即可。
1、安装CUDA9.0后出现下面的错误
ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory
这个错误是由于tensorflow版本和CUDA不匹配造成的,安装对应版本的tensorflow即可。
sudo pip3 install tensorflow-gpu==1.11.0
2、找不到libcublas.so.9.0
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
有可能是环境变量LD_LIBRARY_PATH配置的有问题,或者执行 sudo ldconfig /usr/local/cuda/lib64/ 也可以解决这个问题。
3、在GTX1050Ti上安装的版本是 python3.5.2+tensorflow-gpu1.11.0+CUDA9.0+cuDNN7.4.2,但是这个版本配置在RTX2080Ti上出现了下面的错误
E tensorflow/stream_executor/cuda/cuda_dnn.cc:81] CUDNN_STATUS_EXECUTION_FAILED
tensorflow.python.framework.errors_impl.InternalError: cuDNN launch failure
经过摸索,最终在RTX2080Ti上安装的版本是python3.6.6+tensorflow-gpu1.13.1+CUDA10.0+cuDNN7.6.2,上面的报错就解决了。