kudu master uuid异常修复

线上kudu集群有3个master,无意间发现有个主节点连不上且无法识别,查看主节点页面

每个master节点都会有一个唯一标识UUID,并且每个master都会保存master所有节点的uuid,而现在有个master的uuid变更了,而其他的master节点上保存的还是老的uuid;

具体什么原因产生的,没办法追溯了,怎么解决?其实就是如何更新现有的活跃的master节点的UUID列表?

第一步:停止目前是follower的master,并且查看他的uuid列表;“829c747fbc844b15953dcdcc6dec45c5”是老的uuid,现在需要更新成“102b7d8517434161ae49a89c275b896c”

sudo -u kudu kudu local_replica cmeta print_replica_uuids 00000000000000000000000000000000 \
> --fs_wal_dir=/data/kudu/master \
> --fs_data_dirs=/data/kudu/master

uuid: "7b3cd15cc8fc407fa430458f73692529"
format_stamp: "Formatted at 2020-01-16 11:23:27 on hadoop"
8866d41c90d34bb6b4248672d40ea44c 829c747fbc844b15953dcdcc6dec45c5 7b3cd15cc8fc407fa430458f73692529

第二步:更新uuid列表

sudo -u kudu kudu local_replica cmeta rewrite_raft_config \
> --fs_wal_dir=/data/kudu/master \
> --fs_data_dirs=/data/kudu/master \
> 00000000000000000000000000000000 \
> 8866d41c90d34bb6b4248672d40ea44c:hadoop1:7051 \
> 102b7d8517434161ae49a89c275b896c:hadoop2:7051 \
> 7b3cd15cc8fc407fa430458f73692529:hadoop3:7051

第三步:再次查看uuid列表

sudo -u kudu kudu local_replica cmeta print_replica_uuids 00000000000000000000000000000000 \
--fs_wal_dir=/data/kudu/master --fs_data_dirs=/data/kudu/master

format_stamp: "Formatted at 2020-01-16 11:23:27 on hadoop2"
8866d41c90d34bb6b4248672d40ea44c 102b7d8517434161ae49a89c275b896c 7b3cd15cc8fc407fa430458f73692529

现在已经改过来了,接下来重启这个master,接着在其他master节点重复之前的3个步骤

你可能感兴趣的:(kudu)