HBase服务节点RegionServer告警解决过程

Zabbix监控时不时发出告警

内容:处于Live状态的RegionServer节点数量发生了变化触发告警
级别:Warning
状态:PROBLEM
***数据来源Zabbix平台***

查了一下CDH后台,报警如下

该角色在之前的 5 分钟 中遇到 1 次意外退出。这包括由于 OutOfMemory 错误而导致
image.png

查了一下资料,可能是HBase的java内存给少了。
修改一下参数:

HBase >> 配置 >> HBase RegionServer 的 Java 配置选项

image.png

原来的参数值

-XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70 -XX:+CMSParallelRemarkEnabled -XX:ReservedCodeCacheSize=256m

修改后的参数值:

-Xmx256m -Xms256m -XX:MaxNewSize=128m -XX:NewSize=128m -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70 -XX:+CMSParallelRemarkEnabled -XX:ReservedCodeCacheSize=256m

在添加后HBase依旧不稳定的情况下,将 -Xmx256m -Xms256m 改为 -Xmx512m -Xms512m 后HBase运行状态无任何隐患告警,正常运行。

修改完后重启HBase。重启的时候如果有安装Phoenix,也需要重启。

image.png
image.png

参数文章:https://blog.csdn.net/weixin_43214644/article/details/120545322

你可能感兴趣的:(HBase服务节点RegionServer告警解决过程)