离线Linux服务器上使用docker-pytorch在gpu运行踩坑与解决办法

1. 服务器 docker 版本 18.04

可是 docker 早期版本,不支持gpu
没有 --gpu 参数

第一种思路: 离线升级 docker版本,docker 19以后,可以使用 --gpus,但是权限不够,不能安装docker
第二种思路:在用户目录下,安装docker-rootless,更高版本(尝试了4天)
不能下载 .deb包,只能下载,压缩包,解压,运行,然后报错
请添加图片描述离线Linux服务器上使用docker-pytorch在gpu运行踩坑与解决办法_第1张图片
所有权限高一点的指令,全部不能运行

2. 解决办法——从获得root权限开始

其实在docker早期版本(docker18.04)上,运行 pytorch,需要安装 nvidia-docker
全部安装命令,及使用的包如下:

全部的安装命令

sudo dpkg -i libnvidia-container1_1.4.0-1_amd64.deb
sudo dpkg -i libnvidia-container-tools_1.4.0-1_amd64.deb 
sudo dpkg -i nvidia-container-toolkit_1.5.1-1_amd64.deb 
sudo dpkg -i nvidia-container-runtime_3.5.0-1_amd64.deb
sudo dpkg -i nvidia-docker2_2.6.0-1_all.deb

https://download.csdn.net/download/Inuyasha_1314/85759445

你可能感兴趣的:(机器学习,docker,linux,pytorch)