Hbase region 某个regionserver挂掉后的处理




ALTER TABLESPACE TB_USER_4K EXTEND(FILE '/data/vd5/TB_USER_4K.tbs' 10240)


tail -f /var/cloud/logs/hbase/hbase-???-regionserver-d164.log
tail -f  /var/cloud/logs/hbase/hbase-????-regionserver-d198.log
/app/cloud/hbase/bin/hbase hbck -fix
/app/cloud/hbase/bin/graceful_stop.sh 192.168.5.203 -restart
/app/cloud/hbase/bin/hbase hbck -fixAssignments
/app/cloud/hbase/bin/hbase hbck -fixMeta -fixAssignments
/app/cloud/hbase/bin/hbase hbck -fixMeta -fixAssignments Doc
/app/cloud/hbase/bin/hbase hbck -repairHoles
/app/cloud/hbase/bin/hbase hbck -fixAssignments

查看:tail -f  /var/cloud/logs/hbase/hbase-??????-regionserver-d198.log

现象描述:某个regionserver服务挂掉后,此节点的Regions为0. 重启及数据恢复过程如下:()


切记在hadoop用户下:

第一步启动regionserver
/hbaseStallDir/bin/graceful_stop.sh 192.168.5.164 /hbaseStallDir/bin/hbase-daemon.sh start regionserver /app/cloud/hadoop/bin/hadoop-daemon.sh start datanode 第二部:启动balancer 2)开启/关闭region # 语法:balance_switch true|false hbase(main)> balance_switch true hbase(main)> balancer (这步将导致hbase负载很大,因为各个节点不断的在同步数据,大量的io操作) 第三步:如果某些region卡住了,可根据 http://???.???.???.???:60010/master-status Regions in Transition 的提示 用如下命令手工恢复region /hbaseStallDir/bin/hbase hbck -repair Doc

 

你可能感兴趣的:(server)