Ubuntu16.04安装cuda+cudnn+Tensorflow踩坑全过程

小菜鸟一枚,用了两天的时间才把环境装好,下面小小的记录一下这两天的踩坑过程。

首先介绍几个名词(copy自雷神师兄的文章):

(1)ubuntu16.04:大名鼎鼎的一个linux发行版,以桌面系统的强大得到广大用户青睐(特别是刚入门的小白用户),16.04表示2016.04发布的,该系统每年4月和10月发布两个版本,即04和10,年份为偶数的版本最稳定,比如12.04,14.04,16.04等就被广泛使用。

(2)tensorflow:一个google开源的深度学习框架,封装了很多机器学习的算法即模型,我们拿来就可以用了,鉴于谷歌的影响力,tensorflow目前也是大红大紫。目前(2017-3-20)最新版本为1.0,该框架更新很快。

(3)CUDA:显卡厂商NVIDIA推出的通用并行运算平台,由于机器学习数据量很大,通常要用GPU来加速运算,而当今显卡厂商唯NVIDIA一家独大,自然要用打它家的CUDA了。

(4)cudnn:NVIDIA专门为深度学习设计的一套GPU计算加速方案。

一.安装NVIDIA驱动和CUDA

    这个驱动安装比较麻烦,弄不好就会遇到各种问题。在网上搜索教程,我先去官网上搜索合适自己的显卡驱动(下载runfile文件),按照安装步骤装了一遍。虽然安装成功,但遇到了Ubuntu开机循环输入密码不能登录的问题。在网上搜了一下原因,是因为驱动版本不对。不得已只好卸载了。后面选择了直接在安装cuda的时候装NVIDIA驱动。

以下内容参考https://blog.csdn.net/chenhaifeng2016/article/details/68957732

1.ubuntu 16.04默认安装了第三方开源的驱动程序nouveau,安装nvidia显卡驱动首先需要禁用nouveau,不然会碰到冲突的问题,导致无法安装nvidia显卡驱动。

2.编辑文件blacklist.conf

sudo vim /etc/modprobe.d/blacklist.conf

在文件最后部分插入以下两行内容

blacklist nouveau

options nouveau modeset=0

3.更新系统

sudo update-initramfs -u

4.重启系统(一定要重启)

5.验证nouveau是否已禁用

lsmod | grep nouveau

Ubuntu16.04安装cuda+cudnn+Tensorflow踩坑全过程_第1张图片

没有信息显示,说明nouveau已被禁用,接下来可以安装nvidia的显卡驱动。

6.按ctrl+alt+f1进入文本模式(不然不能安装成功)

   sudo service lightdm stop(关闭图形界面)

7.运行cuda_8.0.61_375.26_linux.run

   sudo ./cuda_8.0.61_375.26_linux.run 

我的没截图,下图参考https://blog.csdn.net/chenhaifeng2016/article/details/68957732

Ubuntu16.04安装cuda+cudnn+Tensorflow踩坑全过程_第2张图片

我的跟以上的一样的。

不要安装opengl,不然即使安装成功,也会出现循环登录的情况(至少本人碰到了这样的情况)。

不要安装/usr/local/cuda的符号连接(这一步可选)

8.sudo service lightdm start (打开图形界面)

Ubuntu16.04安装cuda+cudnn+Tensorflow踩坑全过程_第3张图片

注:nvidia驱动不要重复安装,否则会碰到无法进入图形界面的黑屏问题。只要卸载掉多余的驱动就可以了。

卸载:sudo apt-get purge nvidia-*

二.安装CUDNN
1.安装CUDNN过程参考https://blog.csdn.net/lldbsd/article/details/64213949 没什么问题
Ubuntu16.04安装cuda+cudnn+Tensorflow踩坑全过程_第4张图片
2.验证NVIDIA:在终端输入nvidia-smi遇到:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

上面问题参考:https://blog.csdn.net/w5688414/article/details/78287199

Ubuntu16.04安装cuda+cudnn+Tensorflow踩坑全过程_第5张图片

然后重启一下就可以了。

三.安装Tensorflow-gpu
1.安装python-pip和python-dev
sudo apt-get install python-pip python-dev

2.安装Tensorflow-gpu(python 2.7)

pip install tensorflow-gpu

但我执行这个安装失败,后来在后面加1.0就可以了

sudo pip install tensorflow-gpu==1.0

3.测试:终端输入: python

再输入:import tensorflow as tf

Ubuntu16.04安装cuda+cudnn+Tensorflow踩坑全过程_第6张图片


成功!中间遇到了很多问题,也学习到了很多东西,由于安装的时间太久了,记录的可能有所欠缺。后面会继续努力!




你可能感兴趣的:(Ubuntu16.04安装cuda+cudnn+Tensorflow踩坑全过程)