Docker tensorflow serving GPU libcuda.so.1问题

Docker tensorflow serving GPU 版 tensorflow_model_server: error while loading shared libraries: libcuda.so.1: cannot open shared object file: No such file or directory

  • 问题描述
  • 解决方案
    • 方法1:
    • 方法2:

问题描述

如题,在docker中创建一个tensorflow-serving:latest-gpu容器时,报出如下BUG:tensorflow_model_server: error while loading shared libraries: libcuda.so.1: cannot open shared object file: No such file or directory

解决方案

方法1:

  1. 安装nvidia-docker,教程见:https://github.com/NVIDIA/nvidia-docker
  2. 创建容器时,添加参数:–runtime=nvidia
  3. 问题解决!

安装nvidia-docker过程中可能遇到如下题:/opt/anaconda3/envs/py36/lib/liblzma.so.5: version `XZ_5.1.2alpha’ not found (required by /lib64/librpmio.so.3)
解决方法:
下载liblzma.so.5.2.2文件(https://github.com/u-root/midori/tree/master/lib/x86_64-linux-gnu)复制到/opt/anaconda3/envs/py36/lib目录下
执行软连接:sudo ln -s -f liblzma.so.5.2.2 liblzma.so.5
问题解决,继续执行安装过程。

方法2:

  1. 重新拉取镜像:docker pull tensorflow/serving:latest-devel-gpu
  2. 创建容器:docker run -it tensorflow/serving:latest-devel-gpu
  3. 进入容器,找到文件 libcuda.so.1所在目录
  4. 此时可有两种处理方法
    1)将libcuda.so.1文件放到对应目录下
    cp /usr/local/cuda-10.0/compat/libcud* /usr/local/cuda/lib64/
    export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
    export CUDA_HOME=/usr/local/cuda
    (但此方法退出容器后再进入需要重新EXPORT,所以可以用第二种处理方法)
    2)将libcuda.so.1文件所在目录加入环境变量中
    升级apt-get: apt-get update
    安装vim: apt-get install vim
    vi ./root/.bashrc
    添加:
    export
    LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64:/usr/local/cuda-10.0/compat"
    export CUDA_HOME=/usr/local/cuda
    执行:
    source ./root/.bashrc

EXPORT根据个人目录自行更改
推荐使用方法1,方法2为个人解决问题时的尝试方法

你可能感兴趣的:(docker使用)