Docker安装TensorFlow1.15.0

Docker 安装TensorFlow1.15.0

由于一些代码仍然是基于TensorFlow1.x版本,而目前服务器TensorFlow版本2.2.0,虽然可以用:

import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()

运行1.x版本的TensorFlow,但由于contrib模块在2.0中被删去,导致包含该模块时需要自己去修改代码,比较麻烦。因此借助Docker安装TensorFlow1.15.0,避免对服务器中的2.2.0版本产生影响。
安装过程参考TensorFlow安装教程,链接: link.

准备工作

安装NVIDIA驱动

服务器已装好,驱动版本:440
(可使用cat /proc/driver/nvidia/version查看)

安装NVIDIA Docker

19.03之前的版本需要使用 nvidia-docker2 和 --runtime=nvidia 标记。此处我们使用的是19.03版本,只需要使用nvidia-container-toolkit 软件包和 --gpus all 标记。安装地址link

Ubuntu:

# Add the package repositories
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

执行后就安装好了。
(安装过程中会添加nvidia的源和密钥,安完了就想删掉,删除方法:
源:编辑/etc/apt/sources.list文件即可
密钥:sudo apt-key list列出所有添加的仓库密钥,然后找到要删除的密钥sudo apt-key del [密钥16进制值后8位(注意没有空格)]即可删除,删完别忘了sudo apt update一下)

测试是否安装好了:

#### Test nvidia-smi with the latest official CUDA image
docker run --gpus all nvidia/cuda:10.0-base nvidia-smi

这里会自动安装cuda:10.0的镜像

下载TensorFlow Docker镜像

镜像位于link,选择自己想要下载的版本即可。
这里我们选择了1.15.0版本,对应的镜像名:tensorflow/tensorflow:1.15.0rc2-gpu

docker pull tensorflow/tensorflow:1.15.0rc2-gpu

启动TensorFlow Docker容器

docker run --gpus all -it --rm tensorflow/tensorflow:1.15.0rc2-gpu bash

启动成功。
后续使用待续。

你可能感兴趣的:(日常,docker,tensorflow)