Ubuntu16.04配置tensorflow-gpu环境(CUDA+cuDNN)

        • 介绍
        • 写在前面
        • 准备工作
        • 安装NVIDIA官方驱动
        • 安装CUDA
        • 安装cuDNN
        • 安装tensorflow-gpu

介绍

  • 搞深度学习使用GPU,将会大大加快训练速度
  • CUDA(Compute Unified Device Architecture):是显卡厂商NVIDIA推出的运算平台。 CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎
  • cuDNN(CUDA Deep Neural Network library):是NVIDIA打造的针对深度神经网络的加速库,是一个用于深层神经网络的GPU加速库。如果你要用GPU训练模型,cuDNN不是必须的,但是一般会采用这个加速库
  • 本文的目的是简单了解在ubuntu16.04上配置tensorflow-gpu环境的的大致流程,绕过大坑,仅供参考,一定要熟读官方文档,根据官方文档配置,因为本文内容不全
  • 本文在ubuntu16.04上配置环境的版本为(tensorflow-gpu1.5)+(CUDA9.0)+(cuDNN v7.0.5 (Dec 5, 2017), for CUDA 9.0)

写在前面

  • 操作系统:原生ubuntu16.04
  • gcc/g++:5.4.0
  • 显卡:NVIDIA GeForce 840M
  • 当前CUDA官网最新版本是CUDA Toolkit 9.1
  • 当前cuDNN官网最新版本是cuDNN v7.0.5 (Dec 11, 2017), for CUDA 9.1(cuDNN要注册一下才能下载)
  • 由于tensorflow当前版本是1.5,最高只能支持CUDA9.0,所以要安装的是CUDA9.0

准备工作

  • 找到所有的相应的官方文档,仔细阅读文档
  • 参照cuDNN Install Guide,查看一些注意事项,检查自己的硬件和软件是否符合要求
  • 比如 检查GPU of compute capability和NVIDIA官方驱动版本是否符合要求
  • 还要检查kernel版本,gcc,glibc等版本是否符合要求,原生ubuntu16.04虽然和要求有些出入,但仍然可以配置成功

安装NVIDIA官方驱动

  • ubuntu16.04原来安装的是开源的nouveau驱动,但是CUDA要使用NVIDIA官方驱动,所以要更换显卡驱动
  • 系统设置->软件与更新->附加驱动->选择NVIDIA官方驱动,应用更改并重启,至此驱动安装完毕
  • 注意:这里的NVIDIA官方驱动一定要选择NVIDIA binary dirver-version384.111来自nvidia-384(专有,tested),因为这个版本的驱动才能符合准备工作中NVIDIA官方驱动版本的要求
  • 注意:以上只是操作的一种最简单的方法,你也可以手动卸载nouveau驱动,安装NVIDIA官方驱动,但是配置比较麻烦,操作不当会导致两种驱动冲突,电脑无限重启

安装CUDA

  • 当前最新版本是CUDA9.1,下载CUDA9.0
  • 下载ubuntu16.04的runfile(local)版本
  • 参照官方教程进行安装
Do you accept the previously read EULA?
accept/decline/quit: accept      

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: no

Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: yes

Enter Toolkit Location
 [ default is /usr/local/cuda-9.0 ]: 

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: yes

Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: yes

Enter CUDA Samples Location
 [ default is /home/wsx ]: 
  • 注意要重启一下使环境变量生效

安装cuDNN

  • 下载cuDNN v7.0.5 Library for Linux,参照官方文档操作
  • 注意要重启一下使环境变量生效

安装tensorflow-gpu

你可能感兴趣的:(other)