hbase GC时间过程导致进程挂掉问题

2017-08-24 00:17:54,537 WARN org.apache.hadoop.hbase.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 106398ms
2017-08-24 00:17:54,587 FATAL org.apache.hadoop.hbase.regionserver.HRegionServer: ABORTING region server hbase01.xxx.com,60020,1503354668740: 

org.apache.hadoop.hbase.YouAreDeadException: Server REPORT rejected; currently processing hbase01.xxx.com,60020,1503354668740 as dead server


分析:
其他机器分配内存都一样,为什么这台会有问题。
1.数据量差不多
2.请求量差不多
3.这台机器上region的Locality大部分都小于0.1,问题就在这里了。
之前做了balance,一些数据移到别的机器上了,导致region所管理的store file在别的机器上,拉数据导致使用大量内存不能释放,GC时间过长。


重启节点不能起作用,只有等Locality慢慢趋近与1的时候该问题会消失

你可能感兴趣的:(hbase)