docker深度学习环境配置

docker配置深度学习环境是非常容易的,只需要装好nvidia驱动即可,cudann和cuda不需要装。
还有一个需要说明的是nvidia-docker2已经弃用,现在都是装nvidia-container-toolkit,具体看以下教程。

1.docker清除旧版本:

sudo apt-get remove docker docker-engine docker-ce docker.io
sudo rm -rf /var/lib/docker
dpkg -l | grep docker
sudo apt-get purge docker-ce

2.更新apt-get

apt-get update

3.安装添加使用 HTTPS 传输的软件包

sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common

4.添加软件源的GPG密钥---阿里源

curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"

5.更新apt-get,安装docker

apt-get update
sudo apt-get install docker-ce

6.查看docker版本

docker version

8.安装docker-nvidia

参考官方git https://github.com/NVIDIA/nvidia-docker

9.安装nvidia-container-runtime
https://github.com/nvidia/nvidia-container-runtime#environment-variables-oci-spec
最后编辑的daemon.json文件内容如下:
{
"runtimes": {
"nvidia": {
"default-runtime":"nvidia",
"path": "/usr/bin/nvidia-container-runtime",
"runtimeArgs": []
}
}
}

https://www.cnblogs.com/journeyonmyway/p/11234572.html

https://blog.csdn.net/Letitia96/article/details/102535600#2_nvidiadocker_12

distribution=IDdistribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

docker run --gpus all --rm nvidia/cuda:10.1-base nvidia-smi
cuda:后面要写自己的cuda版本

拉取deepo镜像

先配置镜像为阿里的镜像
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
"registry-mirrors": ["https://jlk8gx5v.mirror.aliyuncs.com"]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker

之后
docker pull ufoym/deepo
即可高速拉取镜像

docker run --runtime=nvidia -it --name mytest ufoym/deepo

你可能感兴趣的:(docker深度学习环境配置)