深度学习环境配置tensorflow+cuda9.1+cudnn-v7.1

首先是这次配置的所有软件:
ubuntu16.04
anaconda3
tensorflow_gpu
cuda9.1+cudnn-v7.1

一、安装 Anaconda

详细阅读下载此官网对应python版本的anaconda
https://docs.anaconda.com/anaconda/faq#id5
##建立一个 conda 计算环境
为了管理多个环境, 那么我们至少要有两个环境, 以便能够进行移除或者切换.
命令行进入到Anaconda3-5.0.1-Linux-x86_64.sh文件所在的路径下后执行:

sudo bash Anaconda3-5.0.0-Linux-x86_64.sh

一路继续,注意中间有一处可以修改安装路径的地方。

Anaconda3 will now be installed into this location:
/home/zerozone/anaconda3
- Press ENTER to confirm the location
- Press CTRL-C to abort the installation
- Or specify a different location below
- [/home/zerozone/anaconda3] >>> /你的路径

这一步不会出太大的问题。

激活环境,使用 conda 安装 TensorFlow-gpu 这里有一个坑!!!!!

 conda create -n tensorflow python=3.5

1、如果你已经安装或准备安装cuda9.1 ,需要看此步,否则跳到第2步
!!目前官方的tensorflow发行还不支持cuda9.1
不过有大神编译好了,这里有非官方的支持cuda9.1和cudnn7.1的预编译版TensorFlow。
https://github.com/mind/wheels/releases/
下载好后进入目录继续:

sudo aptitude install python3-pip
pip3 install 上面下载的 .whl 文件

安装好后自行测试tensorflow
2 、正常安装移步官网
https://www.tensorflow.org/install/install_linux?hl=zh-cn#gpu_support

pip install --ignore-installed --upgrade \
> https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.6.0-cp35-cp35m-linux_x86_64.whl

CUDA+cuDNN安装

1、进入官网,下载并根据知道安装9.1版本
https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=deblocal

一般会将工具安装到诸如 /usr/local/cuda 之类的路径.

2、下载并安装 CUDNN
若是向我一样官网注册不了。这里有备份
链接: https://pan.baidu.com/s/1DiQYF8KFnuwfVDnmlxBw7w 密码: ga6s

解压并拷贝 CUDNN 文件到 安装路径下. 假设 Cuda 安装 在 /usr/local/cuda, 在下载位置执行以下命令:

tar xvzf cudnn文件
sudo cp cudnn-。。。/cudnn.h /usr/local/cuda/include
sudo cp cudnn-。。。/libcudnn* /usr/local/cuda/lib64

此外还需要设置 LD_LIBRARY_PATH 和 CUDA_HOME 环境变量. 可以考虑将下面的命令 添加到 ~/.bash_profile 文件中, 这样每次登陆后自动生效. 注意, 下面的命令 假定 CUDA 安装目录为 /usr/local/cuda:

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export CUDA_HOME=/usr/local/cuda

至此就可以测试tensorflow gpu环境了。
经过一天多的安装,结合参考才过了一些坑。写下来记录和参考。

主要参考:

完整教程:
http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/os_setup.html#install_cuda
https://www.tensorflow.org/install/install_linux?hl=zh-cn#gpu_support

Ubuntu16.04下Anaconda3的安装:
https://blog.csdn.net/ksws0292756/article/details/79143460
conda 环境操作 :
https://blog.csdn.net/simple_the_best/article/details/74351769

更新!!!测试后发现会在运行跑网络时 kernel died 的情况。又重新换成了 cuda9.0+cudnn-v7.0

在卸载 cuda9.1时由于是deb安装 找不到.pl文件
找到方法

sudo apt-get remove cuda-*

cuda9.0 官网可下,这次下deb安装很不顺利,下载慢

sudo dpkg -i cuda-repo-ubuntu1704-9-0-local-rc_9.0.103-1_amd64.deb
sudo apt-key add /var/cuda-repo-9-0-local-rc/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

安装失败后 下载runflie文件安装
终端进入cuda_9.0.176_384.81_linux.run文件所在目录,执行以下命令开始安装:


sudo bash cuda_9.0.176_384.81_linux-run

安装过程需要输入一些确认选项,过程如下:

Description
 
The NVIDIA CUDA Toolkit provides command-line and graphical
tools for building, debugging and optimizing the performance
Do you accept the previously read EULA?
accept/decline/quit: accept
 
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: n
 
Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y
 
Enter Toolkit Location
 [ default is /usr/local/cuda-9.0 ]: 
 
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
 
Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y
 
Enter CUDA Samples Location
 [ default is /home/cqc ]: 
 
Installing the CUDA Toolkit in /usr/local/cuda-9.0 ..

cudnn-v7.0 还是因为注册不了 不能下载。 找了好久

链接: https://pan.baidu.com/s/1L_xKd2dlR5-tQX41wvKluQ 密码: u53u

ok 一切照常。。。

参考:https://blog.csdn.net/lwplwf/article/details/79881699

你可能感兴趣的:(DL)