ubuntu深度学习环境的搭建(ubuntu18.04的安装教程 & GPU驱动安装 & CUDA安装 & CUDNN安装)

1.1 制作ubuntu系统安装盘

1.1.1 下载ubuntu18.04的镜像

链接:https://pan.baidu.com/s/1kK9OD1dYyleq1BGBiMXpvA
提取码:6666

1.1.2 准备一个8G以上的U盘,把系统烧录进去

烧录软件我使用的是rufus

官方下载地址:rufus官网

使用教程:在 Windows 中制作 Ubuntu 系统的USB启动盘

1.2 U盘启动安装ubuntu系统

不同机器进入bios的按键和切换启动项的按键不同,一般是F2,F11,DEL其中一个进入BIOS或者切换启动项的目录。选择刚刚制作的ubuntu系统盘的U盘启动。

安装教程:Ubuntu18.04安装教程

安装ubuntu的时候,比windows安装多了一个分配空间的问题。

我的硬盘是128G的,实际上只有120G。我没有分配上面博客说的那么多的分区。而只是分了4个区域。

/ 30G (apt-get install 的软件是安装在根目录) 主分区,空间起始位置

/boot 1G 主分区,空间起始位置

swap 16G (我的电脑内存16G,所以分给他16G)。逻辑分区, 空间起始位置

/home 分配完上面的分区,剩下的内存都给/home。 逻辑分区,空间起始位置

**安装好系统后第一件事情就是更换软件源。**因为系统自带的源在国外,速度比较慢,容易卡死。所以一般要切换到国内的源。

我一般是使用阿里源.更换方法有两种。1.更改sources.list文件更换 2.在软件与更新中去更换源地址。

  1. 更改文件修改:Ubuntu更换阿里云软件源

  2. 在设置中更换源(更简单,推荐用这种方式)

    Ubuntu 20.04 apt 更换国内源


2.安装GPU驱动 & cuda & cudnn环境

2.1 三者之间的关系

我一开始并不是很懂得,安装一个GPU相关的东西,就需要安装这么多东西。因为在windows上,不弄深度学习之前,我电脑一般就只会安装一个显卡驱动。现在又是驱动,cuda搞的好复杂。

参考网址:gpu 的驱动,cuda,cudnn的关系

ubuntu深度学习环境的搭建(ubuntu18.04的安装教程 & GPU驱动安装 & CUDA安装 & CUDNN安装)_第1张图片

按我的理解,GPU作为硬件平台,电脑要驱动它,需要一个GPU驱动。CUDA是为了提高GPU并行计算能力做的一个架构(可能就是算法去实现并行运算)。cudnn像是加速计算的插件一样。(因为他不用安装,只是放到cuda安装目录下的文件夹)

2.2 明白自己的需求

安装之前先确定自己需要什么环境。我以百度paddle为例分析

ubuntu深度学习环境的搭建(ubuntu18.04的安装教程 & GPU驱动安装 & CUDA安装 & CUDNN安装)_第2张图片

tf不同版本支持的cuda也是不同的。选择你要运行代码的环境进行相对应的安装。

tf对显卡算力也有要求的。N卡算力查询。

安装cuda的时候,cuda对GPU驱动版本限制,

cuda的要求表格

比如:

ubuntu深度学习环境的搭建(ubuntu18.04的安装教程 & GPU驱动安装 & CUDA安装 & CUDNN安装)_第3张图片

确定好版本后,下面开始安装。

接下来的安装网上有好多教程,教程太多文章质量就是层次不齐。很多好文章因为发布的晚,搜索引擎把它放的比较后面,很难找。我推一下我觉得比较好的两个课程:

1.ubuntu 18.04安装CUDA环境,包括nvidia驱动、cuda 10.1、cudnn 10.1,人工智能、机器学习必备技能(强烈推荐这个,我就是根据这个安装上的)

2.如何在Ubuntu18.04下安装CUDA10.1和cudnn

2.3 GPU驱动的安装

2.3.1 卸载nouveau nvidia驱动

安装新GPU驱动之前,需要禁止nouveau nvidia驱动。

1.删Ubuntu系统除旧驱动

# 删除
sudo apt-get purge nvidia*

2.禁止自带的nouveau nvidia驱动

# 打开配置文件
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf

3.填写禁止配置的内容:

把下面两行添加到文件的最后面,保存后退出。

blacklist nouveau
options nouveau modeset=0

4.更新配置文件,并重启电脑。

sudo update-initramfs -u

5.重启计算机(一定要重启!)

sudo reboot

6.重启后输入

lsmod | grep nouveau #没有输出,即说明安装成功

2.3.2 开始安装驱动

2.3.2.1 自动更新驱动(要先更换前面说的国内源,比如阿里源)

优点:省事

缺点:一般是安装最新版本的驱动,所以可能不符合tf,paddle需要的cuda环境。

sudo ubuntu-drivers autoinstall

2.3.2.2 手动更新源

1.最新版N卡驱动下载地址

2.老版N卡驱动下载地址

开始安装

1.在driver run文件目录下打开命令行,运行

sudo chmod a+x (driver.run) 以你下载的文件名为主

2.运行run文件

sudo sh xx.run 或者 sudo ./ xx.run

3.测试驱动是否安装完成

nvidia-smi

应该要输出你电脑的信息,有输出下面这样的信息,说明GPU驱动安装成功。

ubuntu深度学习环境的搭建(ubuntu18.04的安装教程 & GPU驱动安装 & CUDA安装 & CUDNN安装)_第4张图片

可能遇到的问题:

Unable to find the development tool cc in your path;


可能是你的系统里没有装gcc,那就装上gcc,类似的,报找不到make,就装一下

sudo apt-get install gcc
sudo apt-get install make

或者使用命令:

sudo apt install build-essential -y 一键安装那些必要软件

2.4 CUDA驱动的安装

2.4.1 cuda安装包的下载

官网下载地址

2.4.2 安装命令

1.安装命令和安装驱动一样

sudo chmod a+x (driver.run) 以你下载的文件名为主

2.运行run文件

sudo sh xx.run 或者 sudo ./ xx.run

将会进入下面的安装界面,直接点击install。

ubuntu深度学习环境的搭建(ubuntu18.04的安装教程 & GPU驱动安装 & CUDA安装 & CUDNN安装)_第5张图片
之后设置环境变量。

输入 sudo gedit ~/.bashrc 打开主目录下的 .bashrc文件添加如下路径:

export LD_LIBRARY_PATH=

$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64

export PATH=$PATH:/usr/local/cuda-10.1/bin

export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1

在命令行输入source ~/.bashrc使之生效。

输入 nvcc --version,如果显示如下文字就说明安装成功了:
ubuntu深度学习环境的搭建(ubuntu18.04的安装教程 & GPU驱动安装 & CUDA安装 & CUDNN安装)_第6张图片

如果没有这个指令,他应该会提示没有找到

Command ‘nvcc’ not found, but can be installed with: sudo apt install nvidia-cuda-toolkit

然后根据提示安装即可。

sudo apt install nvidia-cuda-toolkit

验证cuda是否能够正常运行:

因为我们是有安装smaple demo的,所以在最开始~目录下,要有一个nvidia_cuda…._samples 这个文件夹的,进入这个文件夹。

  1. cd 1_Utilities

  2. cd deviceQuery

  3. 在deviceQuery这个文件夹中make,会多出一个deviceQuery可执行文件

  4. ./deviceQuery 执行,会输出相应的信息

2.5:Cudnn 下载安装

驱动的下载:CuDNN Archive

ubuntu深度学习环境的搭建(ubuntu18.04的安装教程 & GPU驱动安装 & CUDA安装 & CUDNN安装)_第7张图片

选择对应cuda的版本下载下来。这个下载需要登陆nvidia,需要有一个nvidia账号,注册一个就行。

安装cudnn

这个就是一个加速的文件,无需安装。

把准备好的cudnn文件复制到已经安装好的cuda文件夹里。cuda安装在usr文件夹里。点开主目录里下面的计算机就可以找到。但是在这里没有办法用拖拽的方式进行复制黏贴(因为没有超级权限),需要使用命令行的方式。安装过程参考自[3]

首先进入cudnn对应的文件夹里。之后敲如下命令

sudo cp cuda/include/* /usr/local/cuda/include
sudo cp cuda/lib64/* /usr/local/cuda/lib64

复制成功就可以了。

最后额外说一点,如果你想卸载显卡驱动的话,可以用这个命令来卸载:

sudo apt-get remove nvidia*

如果想查看隐藏文件夹,可以通过Ctrl + h组合键。

你可能感兴趣的:(深度学习,ubuntu,深度学习,CUDA,cudnn,环境搭建)