使用anaconda安装tensorflow-gpu

前提:已经安装好了驱动、cuda、cudnn等,再进行安装tensorflow。

anaconda安装TensorFlow-gpu过程

1.借助 清华大学开源软件镜像站,实现快速下载对应版本的Anaconda ,使用bash进行安装

$ bash Anaconda3-4.2.0-Linux-x86_64.sh

#注意:在这个过程中,全选“yes”。其中最后一个默认为“no”,要更改为“yes”。

若是,一不小心错过了更改最后一个“no”为“yes”,拯救方法如下:

   (1) $ vim ~/.bashrc                         #打开~/.bashrc
   (2) $ exportPATH=~/anaconda3/bin:$PATH.        #写入路径
   (3) $ source ~/.bashrc                         #激活
   (4) $ conda --version                       #验证是否安装成功 

2.激活~/.bashrc
$source ~/.bashrc
3.创建tensorflow2.7虚拟环境,并激活环境

 $  conda create -n tensorflow2.7 python=2.7 
 $  source activate tensorflow2.7 #创建成功之后,$之前会出现虚拟环境名字(tensorflow2.7)提示

4.安装tensorflow-gpu
$ pip install tensorflow-gpu==1.1.0
5.编辑.bash_profile
$ vim ~/.bash_profile
在其中,设置好cuda安装的路径:

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64"
export CUDA_HOME=/usr/local/cuda-8.0

6.激活.bash_profile
$ source ~/.bash_profile
7.使用进行验证:
$ python

$ >>import tensorflow as tf
  >>tf.Session(). 

8.出现creating Tensorflow device,表示Tensorflow-gpu安装成功
9.退出tensorflow2.7的计算环境
$ source deactivate
再次进行python import测试的时候,显示缺失tensorflow模块

产生的原因:tensorflow的安装是在tensorflow2.7的计算环境中进行的。
所以,再次使用tensorflow的时候,再次激活即可:source activate tensorflow


自己在用的时候,感觉每次进入在退出,很麻烦。

所以重新在退出计算环境的情况下,重新安装了一下pip Install tensorflow-gpu==1.1.0.显示已安装成功

so .........

$ source ~/.bash_profile 
$ source ~/.bashrc 

再次,使用python的时候,即时是在退出tensorflow2.7的计算环境下也显示成功。


遇到的坑

1.在进行检测的过程中,import tensorflow的时候,出现ImportError:libcublas.so.9.0: cannot open shared object file: No such file or directory。

产生原因:所安装的tensorflow的版本和cuda的版本不一致(之前安装tensorflow-gpu的时候使用的是pip Install tensorflow-gpu。结果自动安装的是1.5.0版本tensorflow-gpu,而系统的cuda的版本为8.0——>不匹配)

解决方法:降低tensorflow-gpu的版本,在安装的时候,指定pip Install tensorflow-gpu==1.1.0即可


2.在同一台服务器上,使用iterm终端运行的使用gpu可用,但是在使用可视化桌面运行的使用gpu不可调用。
产生原因:在调用tensorflow-gpu失败的时候,大多数都是由于cuda的路径出错了

发现问题:
(1) 使用 import tensorflow 进行测试,发现在终端,存在tensorflow模块,但是在可视化桌面缺失tensorflow模块。
(2) 检查LD_LIBRARY_PATH
$ echo $LD_LIBRARY_PATH
此时,终端显示出cuda的路径,但是在可视化界面输出为空。则说明是tensorflow的路径出现了错误。

解决方法:
(1). $ sudo vim ~/.bashrc

exportLD_LIBRARY_PATH=”$LD_LIBRARY_PATH:/usr/local/cuda/lib64
exportCUDA_HOME=/usr/local/cuda”

(2). $ sudo vim ~/.bashrc
source之后,再次echo 两个终端中,都有路径的存在,并且import tensorflow 成功


3.在修改了/[.bashrc](https://www.jianshu.com/writer)或者是/.bash_profile 文件之后,一定、一定、一定要使用source进行激活。
4.解决pip的龟速安装
5.pip安装tensorflow时:

[115 ~]$ pip install tensorflow-gpu==1.1.0

Collecting tensorflow-gpu==1.1.0
Could not find a version that satisfies the requirement tensorflow-gpu==1.1.0 (from versions: )

No matching distribution found for tensorflow-gpu==1.1.0

解决方法:使用清华源进行安装,即可安装成功。
6.实际上,2017.12的时候,tensorflow 1.4及以下的不支持cuda9.0,且tensorflow1.0版本以上是不支持cuda8.0以下的。tensorflow-gpu1.5以后不支持使用CUDA8.0。cuda8.0对应的cuDNN必须是6.0版的。


参考教程:
TensorFlow 官方文档中文版
Linux下安装配置Tensorflow(GPU版本)

你可能感兴趣的:(使用anaconda安装tensorflow-gpu)