Tensorflow 入门(一)环境搭建

基本环境:

硬件:双路E5 + 3 * Tesla P100,64位
操作系统:CentOS 7.4
python 2.7.14 ( Anaconda2 )
python 3.6.3 ( Anaconda3 ) # 这个不单独列出了,类比吧~

目标环境:

CUDA 9.0
CUDNN 7.0.4
tensorflow-gpu 1.4.0

本文 CUDA 的安装采取了官网的 rpm(network) 形式,简单粗暴。

一、驱动安装

yum upgrade

顺便说一句 python 3 命令行交互模式下 Backspace 等键乱码问题的解决方案:

yum install readline-devel   # 然后重新编译安装 python 3.6

驱动安装/更新,官方说明见这里(注意按自己的实际环境勾选选项),过程摘要如下:

驱动有可能原本就装了,在 yum upgrade 中就帮你更新了

如果原本没装,那就自己装一下(请根据上面的官方说明填写最新文件名):

sudo rpm -i cuda-repo-rhel7-9.0.176-1.x86_64.rpm

二、CUDA、CUDANN 安装

CUDA 安装

sudo yum clean all
sudo yum install cuda

cuda 安装在了 /usr/local/cuda-9.0,并有链接到它的 /usr/local/cuda 目录,使用后者作为后续安装的依据。
环境变量配置,在启动项(~/.bash_profile)中添加一行:

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}

CUDNN安装
首先上官网下载压缩包,这里有点坑,必须要注册,得到的文件:cudnn-9.0-linux-x64-v7.tar,解压后得到的目录也叫 cuda.

这里 CUDNN 的安装其实只是把 CUDNN的一些库文件拷贝到 CUDA 的安装目录下,然后改改权限:

tar xzvf cudnn-9.0-linux-x64-v7.tar
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

三、Tensorflow-GPU 编译安装

参照[官网]的(https://www.tensorflow.org/install/install_sources)源码安装形式,本章给出步骤摘要。

安装部分依赖

pip install numpy dev pip wheel
yum install python-devel

注意:博主安装 dev 的时候报了个 好像叫“None Ascii”什么什么的错误,反正是哪个文件编码有问题(开头多了个什么字符),这个问题通过解压安装包、进入目录、修改那个文件(删掉报错信息指示的几个字符),然后:

python setup.py install 

可以完美解决。

编译安装 bazel

参照官网,步骤如下:
从Fedora COPR把相应的 .repo 文件下载到 /etc/yum.repos.d/ 目录下(加了个源),然后:

yum install bazel

编译安装 tensorflow-gpu

git clone https://github.com/tensorflow/tensorflow 
cd tensorflow/
../configure

这个有一堆交互式配置,看着选就行,大部分默认值都是合适的值,需要注意的就是 python 的路径要确保无误(python 3 / python 2.7.14 / 有的系统自带 python 2.6 或者 2.7.5),有需要再贴图吧。

配置完了之后:

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package

注意:如果想编译 MKL 之类的库,也要事先安装,这里没管。

下一步:

bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg

这个时候 .whl 文件已经出来了,用 pip install 指定即可:

pip install /tmp/tensorflow_pkg/tensorflow-1.4.0-py2-none-any.whl

四、检验

python

然后

import tensorflow as tf

自己测吧哈。

你可能感兴趣的:(python,centos,cuda,python3,开发环境配置)