Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU

我安装的是系统是:Ubuntu 18.04.5 LTS
显卡是 2080TI
参考文章:点这里~

一、换国内源
打开终端:

sudo gedit /etc/apt/sources.list

在 deb 前面添加 # (将其备注)

选择自己系统对应的阿里源阿里源地址复制粘贴进去
比如我的系统就是选择:
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第1张图片
保存之后更新:

sudo apt-get update
sudo apt-get upgrade

!!!我在这里遇到了lock的问题:解决办法

sudo rm /var/lib/dpkg/lock-frontend       

顺便下载一下vim

sudo apt-get install vim

二、gpu驱动

  1. 禁用nouveau
sudo chmod 666 /etc/modprobe.d/blacklist.conf  
//用gedit打开
sudo gedit /etc/modprobe.d/blacklist.conf
// 在最后一行加入以下几句,保存退出
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
// 对刚才修改的文件进行更新
sudo update-initramfs -u

记得重启计算机,打开终端检查nouveau是否被禁用

lsmod | grep nouveau 

\若执行完该句,没有任何输出,则nouveau被成功禁用
2. 卸载旧的驱动(因为我是新装的系统,所以这一步没有执行)
如果你是第一次安装gpu驱动,这一步可以省略。当然如果你不是第一次安装驱动,亲测也可以忽略这一步。

sudo apt-get remove --purge nvidia*

执行完上述命令后会有提示有残留,按照提示进行删除。
3. 安装gcc
必须先安装gcc, 才能安装gpu驱动。

sudo apt-get  install  build-essential

安装gcc,不要怀疑,就是build-essential,我也不知道为啥

gcc --version 

检查gcc是否安装成功

这里我只安装了gcc,gpu驱动就可以成功安装了,如果你执行到下面,提示你make,g++没有安装的话,再回来执行以下语句进行安装即可。

sudo apt-get install g++
sudo apt-get install make

4、下载对应版本的gpu驱动
根据你的显卡类型选择合适的run文件下载,官网下载链接
按照自己系统的规格选择,“开始搜索”,我选择了第一个进行下载
!!!下载的路径不要有中文!!!
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第2张图片5、安装驱动
在上面的博文里面 是要去命令行界面,但是我没去命令行界面执行好像也可以
Ctrl+Alt+F7,关闭图形界面(F1~F7都尝试一下,总有一个能进命令行界面)
cd到.run文件所在的位置:(注意要路径还有.run文件名替换为自己的)

//以移动后的目录为/home/xxx/为例
$cd /home/xxx/
//修改权限
$sudo chmod a+x NVIDIA-Linux-x86_64-xxx.run
//执行安装
$sudo ./NVIDIA-Linux-x86_64-xxx.run -no-x-check -no-nouveau-check -no-opengl-files

Ctrl+Alt+F2,恢复图形界面

nvidia-smi

出来显卡信息,则说明安装成功
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第3张图片
三、Anacoda安装
1、去官网下载,linux选择第一个下载
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第4张图片
cd到Anaconda3-2021.05-Linux-x86_64.sh安装包所在的位置:

bash Anaconda3-2021.05

然后一直按回车键,直到出现“Do you accept the license terms”, 输入“yes”

出现“Anaconda3 will now be installed into this location: /home/xxx/anaconda3”,直接按回车键,安装在该目录中。

出现“Do you wish the installer to initialize Anaconda3 by running condo init?”, 输入“no”。

这时anaconda已经基本安装完成了。
2、区分Ubuntu自带python和anaconda中的python
Linux中会自带python, Ubuntu18.04中自带python3,已经没有python2了。这时不区分不影响anaconda的正常使用,但pytorch和tensorflow对这Linux中自带的python3和anaconda中的python的使用需求不同,后期需要进行两者的切换。所以最好在这里就对他们进行区分。

先退回到根目录

cd ~

在1. 换国内源中已经安装过vim文本编辑器了,这里我们用vim打开.bashrc文件,并进行修改。

sudo vim .bashrc

输入小写字母i,进行vim的编辑模式。此时可以在.bashrc文件进行编辑了,在文件最后加入以下命令:

alias python3="/usr/bin/python3.6"
export PATH="/home/xxx/anaconda3/bin:$PATH"

给系统自带的python起一个别名,就叫python3(注意自己系统自带的python版本,ubuntu 18是3.6,ubuntu20 是3.8)

然后按下esc键,再输入:wq!进行保存,再按esc键退出vim编辑器。

继续在终端中对刚才修改的. bashrc文件执行以下。

source .bashrc

试试刚才进行区分的设置。
本条命令应该启动anaconda3中的python

python 

退出

exit() 

本条命令应该启动系统的python

python3

退出

exit()

3、创建pytorch环境

\\这步中pytorch可以换成任何你喜欢的名字
conda create -n pytorch python=3.8
\\查看你创建的环境
conda env list
\\激活创建的环境
conda activate Deeplearning
\\关闭环境
conda deactivate

注意!!!我执行conda activate Deeplearning语句会提示错误,将该句换为“source activate Deeplearning”即可
四、pytorch-cpu版本安装

为了可以在不使用GPU时也可以方便地对代码进行调试,先安装一个pytorch-cpu版本的。

激活你创建的pytorch环境,系统需要下载一些东西,这里会耗费一点时间。

conda activate pytorch

进入PyTorch官网,选择CPU版本
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第5张图片
利用官网给的命令进行安装

python 
import torch 

若没有输出,则说明安装成功,然后退出

exit()

Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第6张图片
五、cuda安装
CUDA官网
–>Download Now
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第7张图片按照自己的系统进行选择,最后一个选择runfile(local)
对应的安装语句在下面展示【CUDA11.4大约3.3G,要等待一会】
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第8张图片执行完 sudo sh…这句之后,需要等待几分钟出来一个黑框
"Do you accept the above EULA?"输入accept
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第9张图片在下一个界面,有 X 代表 安装
将Driver前面的 X 取消(通过Enter 键),其余都有X 要安装
选择Install
等待几分钟,出现这个界面则安装完成
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第10张图片2、配置环境

sudo vim ~/.bashrc 

进入vim界面。输入字母i,进入编辑模式
在bashrc文件中输入以下命令,注意修改你的cuda版本

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.4/lib64
export PATH=$PATH:/usr/local/cuda-11.4/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.4

输入完成后,点击esc键并输入:wq!,再按esc键退出vim。
这时候返回终端了,运行.bashrc文件

source ~/.bashrc

3、检查安装是否成功

nvcc --version

或者

nvcc -V

注意!!!这里是大写的V,要不然报错
六、cudnn安装
cudnn的安装相比以上过程就简洁多了~但是在Nvidia下载cudnn文件时稍微有点麻烦,你需要先注册一个Nvidia账号,再填写一个调查问卷。
进入官网
根据你的cuda版本和电脑系统,选择合适的cudnn进行下载(大概1G多,需要一段时间进行下载)。我这里选择的是第二个Linux(x86_64)
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第11张图片
下载好后,将.tz文件进行解压缩。
并打开终端,进入解压缩后的目录,
在这里插入图片描述
记得在你创建的虚拟环境中进行:

source activate pytorch

输入以下命令:

$sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/
 
$sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
 
$sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

七、pytorch-gpu安装
原博主是在官网下载的,但是我的不行
这个步骤!是我第一次安装时才的最大的坑了,通过在PyTorch安装的GPU版本并不行,找了好久才找到解决办法:
在确定CUDA和cudnn版本都没有下载错误后,安装完发现torch.cuda.is_available始终返回false,无论重装多少次,都一样。如果你遇到这个问题,不用担心你的步骤是不是错了,因为你被conda镜像安装给坑了。 解决办法:手动去镜像网站下载gpu版的包并离线安装
虽然我安装的CUDA 是11.4 cudnn是8.2,但是pytorch-gpu版本就只到11.1版本,就下载这个!
下载下来可以用的!

在这里插入图片描述在虚拟环境中

source activate pytorch

注意选择路径

conda install --offline /home/zyc/Downloads/pytorch-1.9.0-xxxx.tar.bz2

等待一会就可以安装100%了,然后验证是否安装成功
!!!但是我这里又报错了,直接找不到torch模块,但是上面cpu版本已经经验证过安装好了,所以不应该报错阿!
这个时候请重启!!!
重启电脑!!!

python
import torch
torch.cuda.is_available()

再进入虚拟环境执行上面的语句

Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第12张图片
输出为 True 代表安装成功!
八、tensorflow-gpu安装
踩坑+1的地方,当时按照原博主的方案,花了我三四十G的流量不说,还没有安装好。
所以我仍采用的是:自己下载好包,再安装
清华的镜像网站
我选择了tensorflow2.5版本
在这里插入图片描述
创建虚拟环境:

conda create -n tensorflow python=3.8 

进入环境:

source activate tensorflow

安装:注意路径

pip install /home/zyc/Downloads/tensorflowxxxxx.whl

进行验证:

python
import tensorflow as tf 
print(tf.test.is_gpu_available())

Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU_第13张图片最后输出 为True 代表安装成功!!

终于!完结!
撒花~

你可能感兴趣的:(目标检测模型,ubuntu,tensorflow,pytorch)