Deepin15.11下搭建TensorFlow开发环境

Deepin15.11下TensorFlow环境搭建

作者:dusuanyun 日期:20190909

特别说明:

我也只是一个想要学习深度学习的萌新,所以下面的过程可能有些冗余或者不合理的地方,不过结论是配好了,跑通了;

配置期间参考了相关的书籍(书上版本很低),以及网络上的很多资料,依然翻车一次----系统安装废了,重装系统!

所以,我的总结的对其他人应该有参考意义,另外友情提醒:操作前最好备份一下系统,以防万一!

 

环境说明:

硬件:小米笔记本Pro-GTX版

CPU: Intel Core i7-8550U CPU @ 4GHz

GPU: GeForce GTX 1050 Max-Q

RAM: 16GB

OS: Deepin 15.11 stable

Kernel: x86_64 Linux 4.15.0-30deepin-generic

 

步骤如下:

1.搜索下载并安装基于Python3.7.3的Anaconda3

我安装的是Anaconda3-2019.07-Linux-x86_64.sh环境;

(base) dbdu@dbdu:~$ python 
Python 3.7.3 (default, Mar 27 2019, 22:11:17) [GCC 7.3.0] :: Anaconda, Inc. on linux Type "help", "copyright", "credits" or "license" for more information. 
>>> exit() 
(base) dbdu@dbdu:~$ ipython 
Python 3.7.3 (default, Mar 27 2019, 22:11:17) Type 'copyright', 'credits' or 'license' for more information IPython 7.6.1 -- An enhanced Interactive Python. Type '?' for help. 
In [1]: exit

2.搜索、下载、安装JDK8并配置环境变量:

我安装的是:

(base) dbdu@dbdu:~$ java -version 
java version "1.8.0_221" 
Java(TM) SE Runtime Environment (build 1.8.0_221-b11) 
Java HotSpot(TM) 64-Bit Server VM (build 25.221-b11, mixed mode)

3.安装 Bazel:

C1.安装bazel-0.29.0 ----独立软件包下载困难,且安装失败!

使用apt repository的安装方式:https://docs.bazel.build/versions/master/install-ubuntu.html

配置安装apt 源注意:这是一次性设置步骤。


echo "deb [arch=amd64] https://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list 
curl https://bazel.build/bazel-release.pub.gpg | sudo apt-key add -

如果要安装Bazel的测试版本,请替换stable为testing。

开始安装Bazel

sudo apt-get update && sudo apt-get install bazel

升级到较新版本的Bazel: ----非必须

sudo apt-get install --only-upgrade bazel

C2.安装 TensorFlow 的其他依赖工具包 :

sudo apt-get install python3-numpy swig python3-dev python3-wheel

C3.配置bazel的环境变量:

通过apt安装终端可以直接使用bazel命令,环境变量暂不配置!

C4.通过在新的终端输入 bazel 命令可以验证其是否安装成功

base) dbdu@dbdu:~$ bazel
WARNING: --batch mode is deprecated. Please instead explicitly shut down your Bazel server using the command "bazel shutdown".
                                                          [bazel release 0.29.0]
Usage: bazel   ...
...省略其他输出...

4.安装显卡驱动

我的笔记本在Deepin15.11上默认没有安装独立显卡驱动---GeForce GTX 1050 Max-Q,我这一步必须做不可以跳过

如果跳过,下面安装CUDA和cuDNN虽然过程不报错,但是验证安装的时候发现是失败的!提示驱动版本不匹配

从https://www.nvidia.com/Download/index.aspx 选择自己的显卡匹配的驱动,下载并安装;----如果没有中文版就选择英文版。

我下载显卡驱动是NVIDIA-Linux-x86_64-435.21.run,安装方式如下:

以root身份在Ctrl+Alt+F2终端,执行service lightdm stop后,再执行安装!!----终端会自动提示你怎么做!

 

5.安装 CUDA

下载地址:https://developer.nvidia.com/cuda-downloads

下载安装CUDA10.1参考 https://www.findhao.net/easycoding/2562.html

原文有点小错误,也可以参考我整理的:http://note.youdao.com/noteshare?id=937aefd0e93e808cbdecc3b357348f7e

验证CUDA安装:

(base) dbdu@dbdu:~/NVIDIA_CUDA-10.1_Samples/1_Utilities/deviceQuery$ ./deviceQuery 
./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 1050 with Max-Q Design"
  CUDA Driver Version / Runtime Version          10.1 / 10.1
  CUDA Capability Major/Minor version number:    6.1
....省略其他内容的输出....
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.1, CUDA Runtime Version = 10.1, NumDevs = 1
Result = PASS

最后一行说明安装成功了!

 

6安装cuDNN

安装cuDNN参考官网:https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installlinux

我是使用deb文件的安装方式。

下载地址:https://developer.nvidia.com/cudnn 注意下载需要先注册账号!

我选择的是最新版,如下:

Download cuDNN v7.6.3 (August 23, 2019), for CUDA 10.1

-------------------------------------------------------------------------------------------------

需要3个deb的文件,如下:

cuDNN Runtime Library for Ubuntu16.04 (Deb)

cuDNN Developer Library for Ubuntu16.04 (Deb)

cuDNN Code Samples and User Guide for Ubuntu16.04 (Deb)

开始安装:

A.cd到deb文件所在的本地目录,依次安装:安装运行时库,安装开发人员库,代码示例和cuDNN Library用户指南:

sudo dpkg -i libcudnn7_7.6.3.30-1+cuda10.1_amd64.deb

sudo dpkg -i libcudnn7-dev_7.6.3.30-1+cuda10.1_amd64.deb

sudo dpkg -i libcudnn7-doc_7.6.3.30-1+cuda10.1_amd64.deb

B.验证cudnn的安装

要验证cuDNN是否已安装且运行正常,请编译位于中的mnistCUDNN示例 的/usr/src/cudnn_samples_v7 debian文件中的目录。

将cuDNN示例复制到可写路径。

$cp -r /usr/src/cudnn_samples_v7/ $HOME

转到可写路径。

$ cd $HOME/cudnn_samples_v7/mnistCUDNN

编译mnistCUDNN示例。

$make clean && make

运行mnistCUDNN示例。

$ ./mnistCUDNN

如果在Linux系统上正确安装并运行了cuDNN,您将看到类似于以下内容的消息:

Test passed!

以下为安装成功实例:

(base) dbdu@dbdu:~/cudnn_samples_v7/mnistCUDNN$ ./mnistCUDNN 
cudnnGetVersion() : 7603 , CUDNN_VERSION from cudnn.h : 7603 (7.6.3)
Host compiler version : GCC 6.3.0
There are 1 CUDA capable devices on your machine :
device 0 : sms  5  Capabilities 6.1, SmClock 1328.5 Mhz, MemSize (Mb) 4042, MemClock 3504.0 Mhz, Ecc=0, boardGroupID=0
Using device 0
....省略其他输出的内容.....
Test passed!

最后行说明安装成功!

 

7.使用conda方式(最简单)安装Tensorflow1.14.0(当时最新):

说明:conda是Anaconda自带的,安装Anaconda后就自动会有!

A.安装使用GPU的方式:https://blog.csdn.net/mogoweb/article/details/83018474

conda install tensorflow-gpu

如果使用CPU的版本,请使用tensorflow替换tensorflow-gpu。

B.从安装过程看conda也下载cuda和cudnn,或许前面的cuda和cudnn的安装步骤可以省略。

 

8.测试Tensorflow安装是否正确:

测试的过程其实就是在代码中调用 TensorFlow 库并运行,如果调用库的过程没有报错,那么就说明 TensorFlow 已经安装好了。

base) dbdu@dbdu:~$ python
Python 3.7.3 (default, Mar 27 2019, 22:11:17) 
[GCC 7.3.0] :: Anaconda, Inc. on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import tensorflow as tf
>>> a = tf.constant([1.0,2.0],name="a")
>>> b = tf.constant([3.0,4.0],name="b")
>>> result = a+b
>>> sess = tf.Session()
...此处省略多行输出...
>>> sess.run(result)
array([4., 6.], dtype=float32)

说明OK!

9.选择IDE

Pycharm或者IDEA,个人因用IDEA开发久了,习惯使用IDEA然后安装Python插件即可!

你可能感兴趣的:(开发坑解决,环境配置)