ubuntu20.04 anaconda3虚拟环境安装 paddlepaddle-gpu 2.2.0

官网教程:
快速安装的命令语句:
https://www.paddlepaddle.org.cn/

官网的详细安装教程:
https://www.paddlepaddle.org.cn/documentation/docs/zh/install/conda/linux-conda.html
两个网址都可以,都是官网的方法,实测可行。

安装的前提环境是:
先装好系统的NVIDIA显卡驱动先【本人的Ubuntu系统自带了显卡驱动,所以这步我可以省略了。】,然后就是安装好Anaconda,最后再依照官网的方法执行paddlepaddle环境的安装搭建。

检测是否安装成功的方法:
安装完成后您可以使用 python 或 python3 进入python解释器,输入import paddle ,再输入 paddle.utils.run_check()

出现 PaddlePaddle is installed successfully ONLY for single GPU! Let’s start deep learning with PaddlePaddle now. 这一句表示安装成功一半了,能勉强用,但只能使用单个GPU或者CPU。
ubuntu20.04 anaconda3虚拟环境安装 paddlepaddle-gpu 2.2.0_第1张图片
接下来就是解决多GPU使用的问题了。
解决办法我是参考这个博主的办法去解决的:https://xiulian.blog.csdn.net/article/details/112507826
安装nccl:
nccl下载的地址:https://developer.nvidia.com/nccl/nccl-legacy-downloadshttps://developer.nvidia.com/nccl/nccl-legacy-downloads
具体步骤是:先按照自己的cuda版本找到相应的nccl去下载(我是cuda是11.2的,所以就找回11.2对应的。选择自己的系统版本,然后根据自己想要的操作方式跟着官网的步骤去操作就好了。)ubuntu20.04 anaconda3虚拟环境安装 paddlepaddle-gpu 2.2.0_第2张图片

我的操作方式是:
1.在pc端下载nccl的deb软件包。
操作是:选择 “Local installers (x86)”项 的 “Local installer for Ubuntu 20.04”,
下载了一个.deb后缀的文件【nccl-local-repo-ubuntu2004-2.8.4-cuda11.2_1.0-1_amd64.deb】
然后传去服务器上操作。

2.安装镜像库
sudo dpkg -i nccl-local-repo-ubuntu2004-2.8.4-cuda11.2_1.0-1_amd64.deb

3.更新源镜像
sudo apt update

4.安装nccl
sudo apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

剩下就是配环境了。
将nccl添加到环境变量中
nccl默认的安装目录是/usr/lib/x86_64-linux-gnu
修改~/.bashrc文件,命令:sudo vim ~/.bashrc
在最末尾添加如下内容到文件中:
在这里插入图片描述

注意:我还装了cuda,我cuda的安装方式是安装另外的一个博主的cuda文章去安装的,但我觉得应该是不用装cuda的,直接装nccl就好了,
如果是直接安装nccl的话,配环境的时候写
“export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu”	

cuda文章链接:https://blog.csdn.net/weixin_43742643/article/details/115355545

环境配置写好后,输入命令source ~/.bashrc
都搞好之后就测试一下:
在这里插入图片描述
如果出现PaddlePaddle is installed successfully!,恭喜你,说明您是 真的 真正 完全成功安装了。

最后,我声明一下,我安装了anaconda,然后用conda去安装paddlepaddle,此时能用的,但我需要多卡训练,但多卡不了,此时心态被paddlepaddle的环境搞到有点崩了,太麻烦了,所以接着我就迷迷糊糊的去安装了cuda,装完之后还是不行,接着我就安装nccl。装完了nccl之后才完全正常能训练了。

我是在训练的时候报的错误:
RuntimeError: (PreconditionNotMet) The third-party dynamic library (libnccl.so) that Paddle depends on is not configured correctly. (error code is libnccl.so: cannot open shared object file: No such file or directory)
ubuntu20.04 anaconda3虚拟环境安装 paddlepaddle-gpu 2.2.0_第3张图片

你可能感兴趣的:(深度学习,paddlepaddle,深度学习,python)