nccl 安装

nccl 安装

  • paddle 无法使用多卡分布式
  • 安装 nccl
  • nccl 安装完成

paddle 无法使用多卡分布式

python -c "import paddle; paddle.utils.run_check()"

看 warning 信息可知,是缺少 nccl

You may need to install ‘nccl2’ from NVIDIA official website: https://developer.nvidia.com/nccl/nccl-downloadbefore install PaddlePaddle.

nccl 安装_第1张图片

安装 nccl

英伟达官网 https://developer.nvidia.com/nccl/nccl-legacy-downloads
根据自己的 cuda 选择对应的nccl,这里以cuda11.2为例,
后面根据自己的 nccl2 和 cuda 版本修改相关命令

# 查看cuda版本
nvcc -V

nccl 安装_第2张图片
也可使用命令行下载
nccl 安装_第3张图片
下载完成
在这里插入图片描述
安装镜像库

apt-key add /var/nccl-local-repo-ubuntu1804-2.8.4-cuda11.2/7fa2af80.pub
dpkg -i nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

nccl 安装_第4张图片
安装nccl

apt update
apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

nccl 安装_第5张图片
将nccl添加到环境变量中

# 修改~/.bashrc文件
vim ~/.bashrc

# 将以下内容写入文件末尾,cuda版本修改成自己的版本
export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu
# 使文件的配置生效
source ~/.bashrc

nccl 安装完成

nccl 安装_第6张图片

你可能感兴趣的:(深度学习,linux,深度学习,paddlepaddle,nccl)