Ubuntu深度学习环境搭建

  近一段时间,由于工作繁忙,一直没有时间来好好总结、梳理自己的知识体系。最近一段时间趁着比较得空,会陆续将对近一年来的笔记进行梳理,记录。一来巩固所学,进一步消化吸收;二来,供各位读者参考,共同学习进步。

  • 安装Anaconda
      在Anaconda installer archive选择合适的Anaconda版本右键复制下载链接,然后在Ubuntu命令行使用wget下载:
 $ wget https://repo.anaconda.com/archive/Anaconda3-2019.10-Linux-x86_64.sh

下载完成后运行脚本安装:

$ bash  Anaconda3-2019.10-Linux-x86_64.sh

下载vim编辑器:

$ sudo apt install vim

在命令行运行:

$ conda --version

如果报错,说明conda没有被加入环境变量,需要配置.bashrc文件:

$ vim .bashrc

在文件的最后一行设置当前的Anaconda安装路径为环境变量,以我的路径为例:/home/***/anaconda3/

$ export PATH="/home/***/anaconda3/bin:$PATH"

再运行:

$ source .bashrc

执行修改好的.bashrc文件

$ conda --veriosn
$ conda 4.7.12

此时会输出你当前的conda版本


  • 安装显卡驱动

运行ubuntu-drivers devices查看GPU型号和系统推荐驱动

image

可以使用

$ sudo ubuntu-drivers autoinstall

命令安装系统推荐版本(nvidia-driver-440 - distro non-free recommended),当然也可以安装指定版本的驱动:

$ sudo apt install nvidia-435

如果安装错误可以卸载显卡驱动

$ sudo apt-get --purge remove "*nvidia*"
$ sudo apt autoremove

卸载CUDA Toolkit

$ sudo apt-get --purge remove "*cublas*" "cuda*"

3.安装tensorflow

  目前的Anaconda已经支持安装Tensorflow2.x版本,并且默认安装GPU版本。使用conda安装,会自动安装对应版本的CUDA和cuDNN,一劳永逸。

$ conda install tensorflow==2.1

不准备用conda安装的读者,可以参考经过Tensorflow官方测试的构建配置:

Tensorflow-GPU版本对应

安装指定版本的cudnn

$ conda install cudnn=7.4.0
  • 安装常用软件

安装Git

$ sudo apt install git

安装Opencv

$ sudo apt install opencv-python

安装神经网络可视化所需要的包

$ pip install pydot
$ sudo apt install graphviz

在模型训练时,最常遇见的就是OOM,倍感头疼,最后附一个张量显存计算的说明:

  • 1 G = 1000 MB

  • 1 M = 1000 KB

  • 1 K = 1000 Byte

  • 1 B = 8 bit

    一般一个8-bit的整型变量所占的空间(8/8)为1B也就是8bit。而32位的float则占(32/8)4B也就是32bit。而双精度浮点型double和长整型long在平常的训练中一般不会使用。

如一个shape位[64,600,1067]的float张量,总共呦64*600*1067个float型的数字,每个float为32bit即4B,则该张量在GPU中占用的显存大小为,将近164M。

关于显存计算的跟详细内容可以参考:
浅谈深度学习:如何计算模型以及中间变量的显存占用大小

你可能感兴趣的:(Ubuntu深度学习环境搭建)