hbase bulk-load

先把$HBASE_HOME/lib下的hbase-0.92.1.jar,zookeeper-3.4.3.jar,guava-r09.jar复制到$HADOOP_HOME/lib下
把zookeeper的配置写入core-site.xml中,把hbase-site.xml复制到hadoop/conf下。

首先,把数据打包成hfile
hadoop jar ~/hbase-0.92.1/hbase-0.92.1.jar  importtsv \
-Dimporttsv.separator=";"  #指定输入文件的分隔符为;\
-Dimporttsv.bulk.output=/output   # 输出hfile到/output,注意,/output必须不存在\
-Dimporttsv.columns=HBASE_ROW_KEY,cf1:USER_NAME #源文件的第一列为rowkey,第二列为cf1:USER_NAME\
users /bulkload   #导入hbase的users表中,输入文件存放在/bulkload\

然后,把生产的hfile刷到hbase的表中。
hadoop jar ~/hbase-0.92.1/hbase-0.92.1.jar  completebulkload /output users

你可能感兴趣的:(hbase,bulkload)