使用HDFS和HBASE导出导入功能进行数据迁移

HDFS跨集群复制数据

 hadoop distcp hdfs://ubuntu:9000/user/root hdfs://hadoop-master:9000/user/root

注意:机器名后面的9000端口不可省略,因为distcp命令默认使用8020端口,如果省略会报告ConnectionRefused异常。


HBASE数据导出

直接使用HBASE提供的exort和import工具,这些工具包含在HBASE的jar包中。他们使用MAPREDUCE进行导入导出操作,可以将部分或全部表写入到HDFS文件中。

hadoop jar hbase-0.94.10.jar export  -Dhbase.client.scanner.caching=100  weather_data /weather_data

export命令后面,用户必须从左到右指定参数,不能省略这中间任何一个参数。

使用distcp命令将导出的文件复制到目标集群以后再使用导入命令进行导入。


HBASE数据导入

hadoop jar hbase-0.94.10.jar import  weather_data /weather_data


成功!

你可能感兴趣的:(记录学习hadoop的点点滴滴)