docker 相关问题整理

1,docker 无法重启

Error response from daemon: cannot stop container: default-hive-hotel-hadoop-070-035.bigdata.ly: Cannot kill container aa7e1fbfec32728fdd6700548b2d7c28f7b9e98bf3f76a7efb1de54f430e5ea9: connection error: desc = "transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused": unknown

现象:

docker 无法对容器进行启动,关闭,重启操作;报错如上

docker 运行5个月以上,服务出现异常

解决方法:

增加 /usr/lib/systemctl/system/docker.service  --live-restore

重启docker 服务 

systemctl daemon-reload

service docker restart

2,进入容器报错

unable to find user root: no matching entries in passwd file

原因

版本:17.12.0

1、物理服务器负载高了

2、docker服务出问题的,需要重启物理服务器

网上说:

执行docker cp命令,无论是从容器内部cp到容器外部,还是从容器外部cp到容器内部!

操作

重启需要先停在启动

docker stop

docker start

或者重启docker 服务,docker container

3,docker 重启失败,


重启机器后。启动docker ,最好的办法就是等,及时报错启动失败,也要等!!!


4,docker 启动服务的端口只能本地访问

重启docker服务,即可;

5,出现 文件流关闭错误。导致系统操作变慢;

单台机器重启docker service 并重新发布 cadvisor 可以解决;

有台机器直接卡死;

可能是因为health check 问题导致,本身的cadvisor 服务没有问题;

尝试关闭 cadvisor 健康检查功能;

bug

docker版本 17.12

https://github.com/moby/moby/issues/35891

6,docker service 增加 live-store 模式。重启;然后在去掉 live-store 模式。再重启;部分容器就会处于游离状态;docker

服务重启,容器不会重启;

6,docker service 产生大量的 closewait


升级 docker

7, container 无法关闭,无法登录,等操作无法执Å行;

解决方法:直接kill掉docker runc 的进程;通过container id 找到进程;

8,无法创建容器;


重启,升级

9,docker-proxy 占用端口

dockerproxy 占用未绑定端口,不释放。且kill dockerproxy 变僵尸进程,处理办法,iptables 删除规则;

查看 nat 链

iptables -nvL -t nat

删除该链第二条

iptables -D DOCKER 2 -t nat

10,

docker 启动服务,端口无法绑定,容器状态正常

ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'

查看有僵尸进程;

只能关掉docker 重启机器;升级版本;



总结:

以上这些问题主要是17.12 目前出现问题后就是重启,有些时候重启docker service 无法关停 container 进程,需要进行手动关掉container 通过 ps aux|grep docker|awk '{print $2}' |xargs kill ,如无法正常kill 建议 kill -9。之后进行docker 的升级操作。

目前我在用的18.3 版本相对稳定,但也会出现 docker service 出现问题,导致无法操作容器。建议考虑新版本。

你可能感兴趣的:(docker 相关问题整理)