Docker tensorflow serving GPU libcuda.so.1问题

在docker中创建一个tensorflow-serving:latest-gpu容器时,报出如下BUG:

tensorflow_model_server: error while loading shared libraries: libcuda.so.1: 
cannot open shared object file: No such file or directory

解决方法1:

安装nvidia-docker,教程见:https://github.com/NVIDIA/nvidia-docker
创建容器时,添加参数:–runtime=nvidia
问题解决!
安装nvidia-docker过程中可能遇到如下题:/opt/anaconda3/envs/py36/lib/liblzma.so.5: version `XZ_5.1.2alpha’ not found (required by /lib64/librpmio.so.3)
解决方法:
下载liblzma.so.5.2.2文件(https://github.com/u-root/midori/tree/master/lib/x86_64-linux-gnu)复制到/opt/anaconda3/envs/py36/lib目录下
执行软连接:sudo ln -s -f liblzma.so.5.2.2 liblzma.so.5
问题解决,继续执行安装过程。

解决方法2:

重新拉取镜像:docker pull tensorflow/serving:latest-devel-gpu
创建容器:docker run -it tensorflow/serving:latest-devel-gpu
进入容器,找到文件 libcuda.so.1所在目录
此时可有两种处理方法
1)将libcuda.so.1文件放到对应目录下

cp /usr/local/cuda-10.0/compat/libcud* /usr/local/cuda/lib64/
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda

(但此方法退出容器后再进入需要重新EXPORT,所以可以用第二种处理方法)
2)将libcuda.so.1文件所在目录加入环境变量中
升级apt-get: apt-get update
安装vim: apt-get install vim
vi ./root/.bashrc
添加:

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64:/usr/local/cuda-10.0/compat"
export CUDA_HOME=/usr/local/cuda

执行:
source ./root/.bashrc
EXPORT根据个人目录自行更改

本人亲测有效方法

$ docker run -it --rm --runtime=nvidia tensorflow/tensorflow:latest-gpu-py3 python

你可能感兴趣的:(Machine,Learning,OTHERS)