docker swarm manager节点异常记录

今天早上研发童靴找到我,说是我们自己机房的docker swarm集群有报错,manager节点无法控制集群了,就连节点都看不了。(机房是测试环境,正式环境没有见过这个问题。)
报错如下:

[root@test-218 ~]# docker node ls
Error response from daemon: rpc error: code = Unknown desc = The swarm does not have a leader. It's possible that too few managers are online. Make sure more than half of the managers are online.

[原因]: 没有找到原因,不过在网上看到有说是manager节点异常导致的。

[集群环境]: 一共两台,一台manager,一台node。

解决思路:

首先我先把两台的docker进行重启操作,重启之后还是同样的报错。(测试环境,可以随时操作。)后来在网上看到可以重新选举leader就会恢复正常,我试了下,果然是恢复了,不过node节点需要重新加入集群。
重新选举操作:

[root@test-218 ~]# docker swarm init --force-new-cluster

重新选举之后就恢复正常了。
在这里插入图片描述

你可能感兴趣的:(docker,容器,运维)