记一次CDH6 oozie zookeeper Connection refused处理过程

1.查看Workflows日志提示 org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /hbase/meta-region-server

2.查看jobs日志发现zookeeper拒绝连接,且zookeeper的连接地址为 localhost:2181

明明配置zookeeper集群(集群地址为cdh02-01:2181,cdh02-02:2181,cdh02-05:2181),为毛会连接 localhost:2181,百撕不得姐。

2.1查看workflow的配置 oozie.zookeeper.connection.string=localhost:2181

然鹅并不知道这个配置怎么来的。
通过 find /opt/cloudera/ -type f | xargs grep localhost:2181 查找发现有很多文件都有 localhost:2181,
凭感觉将下面4个文件的 localhost:2181 改为 cdh02-05:2181 (之所以没改成 cdh02-01:2181,cdh02-02:2181,cdh02-05:2181, 是因为不想每台主机都改一下配置文件),再次执行,依然没效果。
/opt/cloudera/parcels/CDH-6.0.0-1.cdh6.0.0.p0.537114/etc/oozie/conf.dist/oozie-default.xml

/opt/cloudera/parcels/CDH-6.0.0-1.cdh6.0.0.p0.537114/lib/hue/apps/zookeeper/src/zookeeper/conf.py

/opt/cloudera/parcels/CDH-6.0.0-1.cdh6.0.0.p0.537114/share/doc/oozie-5.0.0-beta1+cdh6.0.0/oozie-default.xml

/opt/cloudera/parcels/CDH-6.0.0-1.cdh6.0.0.p0.537114/lib/oozie/embedded-oozie-server/webapp/docs/oozie-default.xml

2.2 网上有个类似的问题,说是要添加hbase-site.xml https://community.cloudera.com/t5/Web-UI-Hue-Beeswax/oozie-job-in-Hue-can-t-find-right-ZK-nodes/m-p/56113, 抱着试试的心态添加到hive-site.xml(hive-site.xml是oozie自动加上的)的同级目录下,再次运行,o了。

注:虽然没有提示zookeeper连接拒绝了但还是有个问题:
hive-site.xml跟hbase-site.xml中对zookeeper的配置完全一样,为什么还要另外加hbase-site.xml,而且上面那位网友的问题是出在CDH5.9,我在CDH6-beta版本中没有碰到这个问题,却在CDH6正式版再次出现这个问题。

虽然问题处理了,但觉得这种方式不是很好,期待大神们更科学的处理方式。

 

 

你可能感兴趣的:(记一次CDH6 oozie zookeeper Connection refused处理过程)