Ubuntu安装libnccl.so.2

最近需要使用mxnet-gpu框架来跑深度学习,在安装好mxnet-gpu后,在python中执行 “import mxnet” 时出现以下OSError:

OSError: libnccl.so.2: cannot open shared object file: No such file or directory

显然这是提示缺少libnccl.so.2这个库文件,采用 “find / -name libnccl.so.2” 命令全局搜索了一下,确实也未找到,于是百度一下,原来这是一个与NVIDIA CUDA相关的库文件,下面记录一下离线安装方式。

下载

NVIDIA官方给出的nccl安装文档
进入nccl主页下载前需要注册账号并完成相关调查问卷,这个随便填填就好啦,好了,下面进入正文。
Ubuntu安装libnccl.so.2_第1张图片
进去之后显示的是最新版本,可点击链接进入历史版本下载,因为nccl是与cuda配套的,所以需要根据自己安装的cuda版本选择对应的版本下载。我的cuda版本是11.0,ubuntu16.04系统,因为当时服务器无法连接互联网,所以自然想法是选择 "Local installers(x86) " 安装方式,但我点击进去直接提示链接失效,后来我又试了几个历史版本的,发现也都是链接失效。
Ubuntu安装libnccl.so.2_第2张图片
后来,看了一下"Network installers (x86)"安装方式,总结一下,就是先配置一下apt安装的源,然后通过apt命令安装,如果能连接互联网的话,应该就能正常安装了。
Ubuntu安装libnccl.so.2_第3张图片
但我机器无法联网,索性就将其中的url用另一台联网的机器直接用浏览器打开,嗯,管用,这里还列出来了许多其他与cuda相关的安装包。然后选择cuda11.0对应的libnccl2下载就行,另外在"Network installers (x86)"安装方式中可以看到还一起安装了libnccl-dev,所以把它一起下载下来了,注意这二者版本号一致。
Ubuntu安装libnccl.so.2_第4张图片

安装

下载过后就是安装啦,把这两个deb文件拷贝过去后,直接使用dpkg命令安装。

dpkg -i libnccl2_2.11.4-1+cuda11.0_amd64.deb
dpkg -i libnccl-dev_2.11.4-1+cuda11.0_amd64.deb

验证

安装之后,再执行 “import mxnet” ,不再报错,完美。

其他

今天在写这篇博文的时候,又试了一下"Local installers(x86) "安装方式,点击后,它又可以直接下载了,链接又有效了,哈哈,挺好,这样大家可以直接选择这种方式下载,方便。。

你可能感兴趣的:(Linux系统环境配置,ubuntu,cuda)