KuduTablet设置维护时间

KuduTablet设置维护时间

参考

follower_unavailable_considered_failed_sec默认为300s,tablet失去联系超过300s后,该节点的数据就会在其他节点重建,为了避免维护造成的不必要的数据移动和拷贝,可以临时设置此时间为更长的时间(重启维护加上tablet重启后初始化需要的时间)

1.健康检查

维护前需要健康检查,如果有任何副本不足的情况,需等待副本拷贝完成后再维护

## sudo -u kudu kudu cluster ksck master-01.example.com,master-02.example.com,master-03.example.com

sudo -u kudu kudu cluster ksck  cdh-test-10-9-251-32.lan

2.设置维护时间

目前有Kudu Tablet Server服务的节点如下:

  • cdh-test-10-9-251-30.lan

  • cdh-test-10-9-251-31.lan

  • cdh-test-10-9-251-32.an

  • cdh-test-10-9-251-33.lan

假设需要维护cdh-test-10-9-251-30.an这个节点为1h

在所有tablet节点上执行

sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 3600

在kudu 1.8以前的版本需要加上--force参数

sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 3600 --force

3.在kudu web管理页面查看设置是否成功

登录 http://cdh-test-10-9-251-31.lan:8050/varz 查看是否设置成功

4.维护完成后设置成默认值

sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 300 --force

4.生产环境维护步骤

sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 86400 --force
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 300 --force

你可能感兴趣的:(大数据)