解决一个Sqoop抽数慢的问题,yarn的ATSv2嵌入式HBASE崩溃引起

 新搭建的一个Hadoop环境,用Sqoop批量抽数的时候发现特别慢,我们正常情况下是一个表一分钟左右,批量抽十几个表,也就是10分钟的样子,结果发现用了2个小时:

解决一个Sqoop抽数慢的问题,yarn的ATSv2嵌入式HBASE崩溃引起_第1张图片

查看yarn日志

解决一个Sqoop抽数慢的问题,yarn的ATSv2嵌入式HBASE崩溃引起_第2张图片

 发现有如下情况:

解决一个Sqoop抽数慢的问题,yarn的ATSv2嵌入式HBASE崩溃引起_第3张图片

主要有两个情况: 

1.有大量的等待日志:Waiting for AsyncDispatcher to drain.Thread state is :WAITING

2.异常中断:Interrupted while publishing entity

经网上查询得知,这个是因为ATSv2的嵌入式HBASE崩溃,需要重置HBASE数据库

步骤如下

1. 停止yarn

在ambari页面上停止yarn

2. 删除zk上的ATSv2 Znode
rmr /atsv2-hbase-unsecure或rmr /atsv2-hbase-secure
3. 删除HDFS上的Hbase嵌入式数据库
hdfs dfs -mv /atsv2/hbase/tmp/
4. 启动yarn

在ambari页面上重新启动yarn

再次重跑任务,时间已经明显的降低了。

你可能感兴趣的:(Sqoop,大数据,sqoop,hadoop,hive)