在启动tensorrt server服务时提示"libopencv_highgui.so not found"

在使用tensorrt server的ensemble models功能时,笔者把预处理打包成了一个.so文件,分类模型使用的是.pb文件,但是当使用nvidia-docker命令启动trt server镜像时,报了错误"libopencv_highgui.so.2.4 not found",笔者踩了一些坑,终于找到了问题的原因,这里记录下来,方便以后随时翻看。

预处理的.so调用了opencv库中的函数,当启动server服务时,会执行如下的命令,

nvidia-docker run --rm --shm-size=1g --ulimit memlock=-1 --ulimit stack=67108864 -p8000:8000 -p8001:8001 -p8002:8002 -v/path/to/model/repository:/models <tensorrtserver image name> trtserver --model-store=/models

命令运行后会需要加载.so和.pb模型,而.so必须依赖于opencv库中的函数才能执行,那么怎么让.so找到对应的libopencv_high.so呢?

一种直接的思路,在当前系统环境中的~/.bashrc中增加LD_LIBRARY_PATH路径,使指向libopencv_highgui.so所在的文件夹,然后source一下,但是这种方式只能被系统路径下的可执行文件访问到,而上面的命令是在当前系统中启动docker镜像,把当前系统中的model repository映射到docker镜像内,然后在docker镜像内执行trtserver可执行文件。因此,.so所依赖的opencv库也应该放在docker镜像内

笔者一开始是把所有依赖的opencv库拷贝到docker镜像内,然后在镜像内的~/.bashrc中添加LD_LIBRARY_PATH,但是在执行nvidia-docker命令时,仍然提示"libopencv_highgui.so.2.4 not found",为什么会这样呢?

笔者找了可执行文件在运行时调用.so的搜索顺序,然后找到了下面的这个链接,

https://www.cnblogs.com/vanishfan/archive/2013/01/15/2861211.html

笔者于是通过在docker镜像内增加ld.so.conf的方式添加依赖库路径,再次执行nvidia-docker命令时,终于能找到libopencv_highgui.so.2.4了,那么问题来了,为什么修改~/.bashrc就不行呢?参见下面的链接,

https://blog.csdn.net/wisgood/article/details/14644203

也即,在登录linux系统时,才会执行.bashrc文件,显然,在运行nvidia-docker命令时,并没有登录该docker镜像内的系统,所以就不会执行镜像内部的~/.bashrc,导致LD_LIBRARY_PATH环境变量未生效。

到此,问题就已经解决了。其实,一种更简单的方式,如果只是增加opencv依赖库的话,可以在docker镜像内执行命令apt-get install libopencv-highgui-dev,经过验证,这种安装方式会自动把opencv依赖库的路径添加到/etc/ld.so.conf中,避免了手动添加依赖库路径到环境变量的麻烦。

你可能感兴趣的:(工程应用)