Ubuntu18.04 安装nvidia-docker及解决问题

一. 安装步骤

1. 清除系统原有docker, 如果提示找不到就不用理会

sudo apt-get remove docker docker-engine docker.io 

2. 更新apt-get源

sudo apt-get update 

3. 配置apt允许以 HTTPS方式拉取镜像安装,即安装docker的依赖

sudo apt-get install apt-transport-https ca-certificates curl software-properties-common

456的作用是把docker仓库添加到apt库内

4. 添加Docker官方 GPG key

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - 

5. 校验 9DC8 5822 9FC7 DD38 854A E2D8 8D81 803C 0EBF CD88.

sudo apt-key fingerprint 0EBFCD88

6. 利用如下命令配置稳定镜像

sudo add-apt-repository “deb [arch=amd64] https://download.docker.com/linux/ubuntu \ 
$(lsb_release -cs) \ 
stable”

7. 再次更新

sudo apt-get update

8. 安装最新版Docker

sudo apt-get install docker-ce 

9. 验证docker是否安装成功。此命令会下载一个测试镜像,并且启动一个container来运行该镜像,打印下图信息后退出。

sudo docker run hello-world

在这里插入图片描述

10. 安装nvidia-docker:Install nvidia-docker and nvidia-docker-plugin

wget -P /tmp https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.1/nvidia-docker_1.0.1-1_amd64.deb
sudo dpkg -i /tmp/nvidia-docker*.deb && rm /tmp/nvidia-docker*.deb

11. Test nvidia-smi 验证是否安装成功执行以下命令看到如下回复就是成功了

sudo nvidia-docker run –rm nvidia/cuda:9.0-devel nvidia-smi   # 留意需输入cuda的版本+devel

在这里插入图片描述

二. 报错及解决办法

1. 解决 docker WARNING: Error loading config file: /home/xxj/.docker/config.json: stat /home/xxj/.docker

在终端执行docker images命令,会看到如下提示,
在这里插入图片描述
原因:
当前用户没有加入docker用户组

解决办法:
1). 创建 组

sudo groupadd docker

2). 将用户添加到该 组,例如我的xxj用户

sudo gpasswd -a ${USER} docker

在这里插入图片描述
3). 重启docker-daemon

sudo systemctl restart docker

在这里插入图片描述
4). 设置目录及其所有文件的权限

sudo chown "$USER":"$USER" /home/"$USER"/.docker -R
sudo chmod g+rwx "/home/$USER/.docker" -R

在这里插入图片描述
5). 验证,则无警告显示
在这里插入图片描述

2. 解决 Docker启动Get Permission Denied

问题描述:
安装完docker后,执行docker相关命令,出现

”Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get http://%2Fvar%2Frun%2Fdocker.sock/v1.26/images/json: dial unix /var/run/docker.sock: connect: permission denied“

原因:
摘自docker mannual上的一段话:
Manage Docker as a non-root user
The docker daemon binds to a Unix socket instead of a TCP port. By default that Unix socket is owned by the user root and other users can only access it using sudo. The docker daemon always runs as the root user.
If you don’t want to use sudo when you use the docker command, create a Unix group called docker and add users to it. When the docker daemon starts, it makes the ownership of the Unix socket read/writable by the docker group.
大概的意思就是:docker进程使用Unix Socket而不是TCP端口。而默认情况下,Unix socket属于root用户,需要root权限才能访问。

解决方法1:
使用sudo获取管理员权限,运行docker命令。

解决方法2:
docker守护进程启动的时候,会默认赋予名字为docker的用户组读写Unix socket的权限,因此只要创建docker用户组,并将当前用户加入到docker用户组中,那么当前用户就有权限访问Unix socket了,进而也就可以执行docker相关命令。

sudo groupadd docker     # 添加docker用户组
sudo gpasswd -a $USER docker     # 将登陆用户加入到docker用户组中
newgrp docker     # 更新用户组
docker ps    # 测试docker命令是否可以使用sudo正常使用

3. 解决 container_linux.go:247: starting container process caused “exec: “nvidia-smi”: executable file not found in $PATH”

解决办法:
run一个docker容器的时候指定你安装的cuda版本:如我的是cuda:9.0-devel.

 
https://blog.csdn.net/qq_41493990/article/details/81624419
2. 在Ubuntu上安装Docker
3. 解决 docker WARNING: Error loading config file: /home/xxj/.docker/config.json: stat /home/xxj/.docker
4. Docker启动Get Permission Denied
5. nvidia-dokcer常见问题总汇(博主踩过的各种各样的坑)

 https://blog.csdn.net/mzpmzk/article/details/105193377

你可能感兴趣的:(docker,linux,ubuntu)