hive数据导入到hbase的方式总结

前言:因为hbase不支持二级索引,如果是后面hive导入hbase需要组合查询的话,那么就的引入phoenix。

hive2hbase三种方式

1.hive和hbase建映射表 直接操作hive表就是操作hbase表 --关系数据导入hbase,进行数据初始化, 但是这种会hive的分区和hbase的预分区不友好,如果只是一般hive表可以使用。

2.使用sparksql操作完hive处理好之后入hbase 这里批量入hbase用的是hbase的api ,这里可以选择scala/ java语言写入hbase,当然python也是ok的。

运用spark读取hive表的数据大批量导入Hbase

3.使用sparksql中的jdbc的方式写入phoenix 见:

spark+phoenix 通过jdbc读取表中的数据

你可能感兴趣的:(hbase)