从头安装——Ubuntu16.04 + Tensorflow-GPU==1.9 (可更新为1.11)+ CUDA9.0 + cuDNN7.0

平台:Ubuntu16.04 + Tensorflow-GPU== 1.11+ CUDA9.0 + cuDNN7.0

  • 一、几个坑点:
  • 二、步骤:
    • 1. 确定版本
    • 2. 安装TitanXp显卡驱动
    • 3. 安装CUDA
    • 4. 安装cuDNN
    • 5. 安装Anaconda
    • 6. 用Anaconda安装tensorflow
    • 7. 开发环境 Jupyter notebook

耗时11小时(三天),从安装GPU:Titian Xp 到使用tensorflow。本方法必须采用Anaconda。

一、几个坑点:

  1. 确定Tesorflow的版本后,没有装配套的Nvidia驱动+CUDA+cuDNN,返工3次
  2. 使用Anaconda中安装tensorflow,未在虚拟环境tensorflow-gpu中安装
  3. 指望在一篇帖子中一次性解决所有问题,做梦~!(不得不说Anaconda很省事)

二、步骤:

1. 确定版本

以终为始,要用tensorflow,先确定配套的 Tensorflow + CUDA + cuDNN版本,这里我用了较新的【Tensorflow-GPU==1.9 (更新为1.11)+ CUDA9.0 + cuDNN7.0】,版本参见这里(此处我没有找到tensorflow官网的配套表)
【更新】:tensorflow-gpu更新至1.11版本,实测可用。旧版本中函数Conv1D存在一个bug. 参考这里

2. 安装TitanXp显卡驱动

确定了CUDA版本,我们来确定CUDA9.0对应的显卡驱动版本,9.0对应的驱动是nvidia-384,安装参见“Nvidia的驱动”,从“基础知识”部分开始,摆脱各种删除更新的烦恼。

3. 安装CUDA

建议从官网下载 cuda toolkit ,选择“Legacy release”,到旧版本界面,找到CUDA9.0版本,选择你电脑对应的选项,下载文件一定要选择runfile
安装详见“安装cuda8”部分。
【注】:
① 按Ctrl+c直接跳过介绍,问题 “Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?“一定选择No
② 配置环境变量不可少,命令是 sudo gedit ~/.bashrc ,直接粘贴在里面,source ~/.banshrc 生效。
③ 测试CUDA安装好了没有,参见图文"5.4 测试"部分

4. 安装cuDNN

参见“十、 安装cuDNN”部分,碰到“microsoft…VS”问题选No
版本支持选择cnDNN:https://developer.nvidia.com/rdp/cudnn-archive
安装指导的原版:https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#verify
注:

  1. cuDNN支持的gcc版本不超过6.,所以需要gcc降级:https://blog.csdn.net/CAU_Ayao/article/details/83987120
  2. 下载debian版本,runtime、developer和example三个版本全部下载,依次安装。但是ubuntu还是推荐安装linux版本的,最后使用命令“cat /usr/local/include/cudnn.h | grep CUDNN_MAJOR -A 2”确定安装的版本

5. 安装Anaconda

linux版本,根据“七 安装Anaconda及Python”部分
【注】:这里linux系统会有三个python版本,两个系统自带的,python 2.7与python 3.5,不需要删除,否则系统会崩,Anaconda自己装python 3.6

6. 用Anaconda安装tensorflow

参见“Anaconda初步学习”部分,虽然是windows系统,但是linux可以用同样的命令安装,务必按照他的步骤安装完。
【注】:
① tensorflow有一个虚拟环境的概念,在Anaconda中,tensorflow必须安装到虚拟环境中,命令conda info --envs 查看有哪些环境, source activate XXX (环境名称,本文名称是tensorflow-gpu)后,再安装。

② Linux没有 Anaconda Prompt-python,只需要 source activate XXX 就行

③ tensorflow区别GPU和CPU版本,下载可以用 “pip install tensorflow-gpu==1.9”来锁定版本。

7. 开发环境 Jupyter notebook

参见“tensorflow开发环境”的tensorflow安装

伴随始终的问题:No module named tensorflow ——解决:
① 确保在activate虚拟环境后,在虚拟环境里安装tensorflow
② 在终端里可以 import tensorflow,在jupyter里不可以,需要用anaconda 安装tensorflow,参见“tensorflow开发环境”的步骤7

良心帖子:tensorflow 安装GPU版本,个人总结,步骤比较详细1


  1. 良心帖子 ↩︎

你可能感兴趣的:(基础安装帖)