将docker容器通过docker export命令打包,传输到另外的服务器,再通过docker import命令导入后,发现原来docker容器中的环境变量失效了。
export LD_LIBRARY_PATH=/home/shared/TensorRT-8.2.4.2/lib:/usr/local/nvidia/lib:/usr/local/nvidia/lib64
显然,export命令配置的环境变量只能临时生效,重新进入容器后环境变量失效。
a. 在docker容器中,在/etc/profile的末尾添加环境变量配置:
export LD_LIBRARY_PATH=/home/shared/TensorRT-8.2.4.2/lib:/usr/local/nvidia/lib:/usr/local/nvidia/lib64
b. 然后执行环境变量刷新:
source /etc/profile
在/etc/profile中配置环境变量是令环境变量永久生效的通用做法,但对于docker,这一做法失败了,表现为,重新进入docker后,环境变量失效,并且重启docker容器同样无效。
在docker容器中,在/root/.bashrc的末尾添加环境变量配置:
export LD_LIBRARY_PATH=/home/shared/TensorRT-8.2.4.2/lib:/usr/local/nvidia/lib:/usr/local/nvidia/lib64
重新进入容器,可以发现环境变量保持生效。
在docker容器的/etc/profile中配置环境变量,然后在/etc/bash.bashrc或/etc/bashrc中增加环境变量刷新命令。
a. 在docker容器中,在/etc/profile的末尾添加环境变量配置:
export LD_LIBRARY_PATH=/home/shared/TensorRT-8.2.4.2/lib:/usr/local/nvidia/lib:/usr/local/nvidia/lib64
b. 在/etc/bash.bashrc或/etc/bashrc的文件末尾增加环境变量刷新命令:
source /etc/profile
将docker容器通过docker export命令打包,传输到另外的服务器,再通过docker import命令导入后,发现在docker容器外部无法执行docker容器中的命令,而原始的,export之前的docker,则不存在此问题。
例如:在docker容器中,可以正常执行python、ll等命令,但在dockers外部,则会出现command not found错误。
docker exec gpu21 /bin/bash -c"ll"
/bin/bash: ll: command not found
docker exec gpu21 /bin/bash -c "cd/home/server && ./start.sh"
/bin/bash: python: command not found
简单分析可以认为,在docker容器中,bash能够正常找到执行程序,而在docker外部,bash找不到执行程序,所以还是环境变量的PATH变量的问题,并且是PATH变量的值在容器中是正确的,而在容器外部调用bash执行命令时,PATH变量失效。
暂时能想到的解决方案是,直接在docker中需要执行的脚本里边再次设定环境变量。例如,对于以下执行需求:
docker exec gpu21 /bin/bash -c "cd/home/server && ./start.sh"
/bin/bash: python: command not found
我们可以直接进入容器,查看PATH变量的值:
echo $PATH
/root/anaconda3/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
以及查看在容器外部执行时PATH变量的值:
docker exec gpu21 /bin/bash -c "echo$PATH"
/usr/local/cuda-11.2/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin
可以发现两者并不一致,这也正是问题所在。我们可以改写start.sh脚本,在脚本的开始处添加设置环境变量的内容,使得在容器外部时PATH变量的值与docker容器内部一致。
在start.sh文件的开头处添加以下内容:
exportPATH=/root/anaconda3/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
再次在容器外部执行start.sh,发现可以成功执行了:
docker exec gpu21 /bin/bash -c "cd/home/server && ./start.sh"
在传递docker镜像时,请避免使用
docker export
命令;请改用
docker save
命令,已避免可能出现的环境变量问题。
两者区别在于:
docker export命令针对容器执行,对应的,导入命令为:
docker import
docker save命令针对镜像执行,对应的,导入命令为:
docker load
以如下容器为例:
b379e350987d vsr_trt "/bin/bash" 6 weeks ago Up 6 weeks enhancefox
容器名称为enhancefox,其镜像为vsr_trt,迁移镜像的操作步骤如下:
如果容器在原镜像的基础之上有变更,需提交变更,创建一个新版本的镜像。
docker commit enhancefox vsr_trt:20230215
这里我们将容器enhancefox在通过原镜像vsr_trt创建之后可能产生的变更进行提交,创建版本号为20230215的新镜像。
docker save vsr_trt:20230215 > /home/vsr_trt_20230215_save.tar
将保存的镜像传递至新的服务器,在新的服务器上执行:
scp -P 22 [email protected]:/home/vsr_trt_20230215_save.tar/home/vsr_trt_20230215_save.tar
打包容器相关文件等:
cd /mnt/data
tar -czvf enhancefox.tar enhancefox
scp -P 22 [email protected]:/mnt/data/enhancefox.tar/mnt/data/enhancefox.tar
在新服务器上导入镜像:
docker load -i /home/vsr_trt_20230215_save.tar
解压容器相关文件等:
cd /mnt/data
tar -xvf enhancefox.tar
创建新容器:
docker run -itd --gpus all --ipc=host--network host -p 9501:9501 -v /mnt/data/enhancefox:/home/server -v/etc/timezone:/etc/timezone -v /etc/localtime:/etc/localtime --name enhancefoxvsr_trt:20230215