redis集群某主节点宕机,其从节点未自动接管(故障转移未生效)问题解决

故障转移未生效可能有很多种原因,这里只记录本次排查原因:

redis集群模式 三主三从

过程:初始集群可以正常启动,想模拟故障转移情况,手动kill某主节点的端口进程,集群状态就为fail了,其从节点未自动接管。(且看到某些节点的appendonly.aof文件大小为0)

解决:因为redis.conf中配置了认证requirepass参数,但没设置masterauth参数。加上masterauth参数并与requirepass保持一致,再重启集群,模拟故障转移即生效。

1、是否只设置requirepass就可以?masterauth是否需要同步设置?
答:redis启用密码认证一定要requirepass和masterauth同时设置。
如果主节点设置了requirepass登录验证,在主从切换,slave在和master做数据同步的时候首先需要发送一个ping的消息给主节点判断主节点是否存活,再监听主节点的端口是否联通,发送数据同步等都会用到master的登录密码,否则无法登录,log会出现响应的报错。也就是说slave的masterauth和master的requirepass是对应的,所以建议redis启用密码时将各个节点的masterauth和requirepass设置为相同的密码,降低运维成本。当然设置为不同也是可以的,注意slave节点masterauth和master节点requirepass的对应关系就行。
 

2、requreipass和master的作用?
masterauth作用:主要是针对master对应的slave节点设置的,在slave节点数据同步的时候用到。
requirepass作用:对登录权限做限制,redis每个节点的requirepass可以是独立、不同的。

 

参考:

Docker 搭建 Redis Cluster 集群环境

redis集群的密码信息存在哪?是如何更新的?关于requirepass和masterauth的问题

你可能感兴趣的:(redis,数据库,缓存)