Ubuntu16.04安装nvidia驱动+cuda9.0+cudnn7.0.5以及训练keras-frcnn

显卡型号:GTX 1070

安装驱动过程中参考博客

但遇到X server没有关闭的问题,后来查找解决方法在sudo service lightdm stop命令后增加了一条命令

sudo init 3

安装驱动成功。

cuda9.0+cudnn7.0.5过程按上述博客安装方法进行安装

这里遇到一个很问题,我一直也没想清楚原因。在安装cuda前,通过nvidia-smi查看此时显示

NVIDIA-SMI 418.56

但是安装cuda、cudnn结束后,显示NVIDIA-SMI 384.130 驱动换成了设置——>软件和更新——>附加驱动中的版本

Ubuntu16.04安装nvidia驱动+cuda9.0+cudnn7.0.5以及训练keras-frcnn_第1张图片

为了切换不同版本的python,安装了anaconda,添加了清华源,参考博客

 通过conda install tensorflow-gpu==1.6.0 安装tensorflow

conda install keras-gpu==2.2.2安装keras

接下来安装需要用的opencv3

我在使用conda install -c menpo opencv3安装时,一直提醒我将tensorflow降为1.3.0。这里我担心以后出现问题没有更改。

使用一下命令安装了opencv3.4.2

conda install libopencv

conda install py-opencv

到这里需要的一些环境基本配置好,打算开始训练keras-frcnn

但是又遇到新的问题,没有截图,问题类似于

Loaded runtime CuDNN library: 7103 (compatibility version 7100)

我以为时cudnn问题,把cudnn改为7.1.4(实验室服务器安装的这个版本,服务器其他配置和上面安装的一下,代码在服务器上能跑通),但还是没能解决。

后来把tensorflow升到1.8.0问题得到解决。

你可能感兴趣的:(Ubuntu16.04安装nvidia驱动+cuda9.0+cudnn7.0.5以及训练keras-frcnn)