hadoop - habse 创建表时提示:error: org.apache.hadoop.hbase.PleaseHoldException: master is initialzing

ps : 本次总结是因为自己踩了不少坑。特此总结一下。大部分结论在网络上也可能存在。。。

开发环境: 

       1. hadoop 3.2.0

       2. hbase-2.1.3

       3. zookeeper-3.4.13

 

环境搭建好了之后查看进程:

[centos@s110 hbase-2.1.3]$ jps
1810 NameNode
2516 NodeManager
2389 ResourceManager
9846 HRegionServer
10167 Main
1929 DataNode
18265 Jps
2155 SecondaryNameNode
10365 Main
8974 QuorumPeerMain
9679 HMaster

发现hadoop hbase 相关的进程都在。但是在过了几分钟之后,再次查看的时候HMaster 进程会自己挂掉。

有时候启动的时候,发现会有两个 HRegionServer。观察日志的时候发现HRegionServer 注册不上。

[centos@s110 soft]$ jps
3200 HRegionServer
1810 NameNode
3267 Jps
2516 NodeManager
3236 HRegionServer
2389 ResourceManager
1929 DataNode
2155 SecondaryNameNode
1566 QuorumPeerMain
2990 HMaster

查查hbase 相关日志发现:

WARN  [master/s110:16000:becomeActiveMaster] master.HMaster: hbase:meta,,1.1588230740 is NOT online; state={1588230740 state=OPEN, ts=1551952388155, server=s101,16020,1551860949953}; ServerCrashProcedures=true. Master startup cannot progress, in holding-pattern until region onlined.

该日志会有大批记录记录在hbase-centos-master-***.log 中。

在网上百度了好多方式。

最后处理的方式是:

重新修改 hdfs-site.xml 配置文件。

重点在指定的了: hbase.tmp.dir  ,hbase.zookeeper.property.dataDir,目录,确保用户有权限操作该目录。(ps 要是改目录下游数据,最好也清理了,原有数据可能会影响!)

如下是我本次的配置:


        
        
            hbase.rootdir
            hdfs://192.168.101.110:8020/hbase
        

        
            hbase.master
            hdfs://192.168.101.110:60000
        

        
            hbase.tmp.dir
            /home/centos/hbase/tmp
        

        
            hbase.zookeeper.property.dataDir
            /home/centos/hbase/zookeeper
        

        
        
            hbase.cluster.distributed
            true
        
        
        
            hbase.zookeeper.quorum
            192.168.101.110:2181
        

        
           hbase.zookeeper.property.clientPort
           2181
        

        
            hbase.unsafe.stream.capability.enforce
            false
       

2. 清理zookeeper相关hbase相应的信息。

1、进入zookeeper的bin目录;

2、执行客户端脚本:$sh zkCli.sh

3、查看Zookeeper节点信息: ls /

4、递归删除hbase节点:rmr /hbase

5、退出:quit

6、重启Zookeeper

#1、直接启动客户端脚本
$ zkCli.sh

#2、查看Zookeeper节点信息
[zk: localhost:2181(CONNECTED) 0] ls /

#3、递归删除hbase节点
[zk: localhost:2181(CONNECTED) 1] rmr /hbase

#4、退出客户端
[zk: localhost:2181(CONNECTED) 2] quit

#5、重启Zookeeper服务
$ zkServer.sh stop
$ zkServer.sh start

做完上述之后重启hbase  问题解决 ~!!!

问题分析:(ps : 后期收集查看原因总结归纳出来的。。。stackoverflow上也有同学这么归纳)

1. 在搭建环境过程中,反复启动hbase,zookeeper .

在hbase相应的目录中可能生成错乱的数据,在下次启动的时候,去读数据,倒是注册的时候老是连接不上注册中心。

hbase 对应注册不上的服务,采取重试的机制,所以导致HRegionServer 多次注册,在启动时进程可以查看出来。等重试到达一定次数时,还是失败进程会被推出。

2. zookeeper 搭建过过程中,改变hbase,或者多次未成功的注册。导致生产的目录不正常。当再次注册是,由于名字等信息高度类型被判定位同一个,实际上不是同一个。所以一直注册不成功。

 

end  ! 

如若写的不对请麻烦告我,不胜感激~~

你可能感兴趣的:(hadoop,hbase)