ORM-HBASE 一个轻量级映射框架

背景

HBase在处理billion级别的能力是毫无质疑的,目前优于其他的nosql数据库,如mongodb、cassandra、redis等, 配合它强大的rowkey查询,fileter,协处理器等,在海量数据库中发挥了强大的功能。但是HBase因为满足的是CAP原则中C和P,所以在查询过程中语句支持较弱,使用过程较为复杂。存在下面的一些痛点。

痛点

  1. 首先HBase只能存储byte数组的数据,数据存入到hbase中时都需要做相应的转换,读取的数据的时候也要相应的转换回来,使用麻烦。
  2. 第二,HBase在使用过程中,涉及到filter、协处理的使用,如果对API不熟悉,无法下手。
  3. 第三,hbase本身不提供分页的功能,每次分页需要在代码中记录当前读取的rowkey,在使用PageFilter读取一定数量的rowkey,然后继续读取,编程复杂度高。
  4. 最后,不熟悉hbase的开发人员,无法理解nosql、hbase的no schema,期望还是用关系数据库的方式操作hbase。

HBase ORM框架

基于以上的原因,所以我有了想写一个类似于hibernate那种对象关系映射框架(ORM)的想法,像操作对象一样方便的操作HBase数据库,但是它要是轻量级的,无侵入的,只提供CURD、分页、映射功能的一个简单功能。

一些特性:

  • 使用注解的方式,将PO(Persistent Object)映射成HBase对应的表
  • 提供CRUD的方法:create\research\update\delete
  • 提供分页查询的功能
  • 提供类似于hibernate中Criteria 风格的操作方式

Demo:

1、在po对象上添加相应的注解:@Table\@RowKey\@Column

 @Table(name = "user")</br>
 public class User {

  @RowKey
  private int id;

  @Column(family = "info")
  private int userId;

  @Column(family = "info", name = "user_name1")
  private String userName;

  @Column(family = "info")
  private long age;

2、使用HBaseColumnarClient实例操作PO对象

  HBaseColumnarClient client = new    HBaseColumnarClient(scanCaching, scanBatch);
  DataSourceConfig config = new DataSourceConfig("hbase.properties");
  HBaseSource source = new HBaseSource(config.getProperties());
  client.setHBaseSource(source);

  //create
  client.putObject(user);

  //delete
  client.deleteObject(user);

  //query
  User user = client.findObject(Bytes.toBytes(1), User.class);

3、提供类似于Hibernate Criteria的风格操作hbase

  // count the data
  Filter[] filters = null;
  long count =
               Criteria.aggregate(User.class).fromRow(startRow).toRow(endRow)
                               .filters(filters).build().count(client);

  // sum the column value
  long sum =
               Criteria.aggregate(User.class).fromRow(startRow).toRow(endRow)
                               .filters(filters).propertyName("age").build().sum(client);

   // query by rowKey
             User queryUser =
                         Criteria.find(User.class).byRowKey(Bytes.toBytes(id)).build().query(client);

   // query from startRow to endRow
  List<User> queryList =
               Criteria.find(User.class).fromRow(startRow).toRow(endRow).build()
                               .queryList(client);

  // query by page
  PageBean<User> pageBean = new PageBean<User>() {};
  pageBean.setPageSize(10);
  pageBean.setStartRow(startRow);
  pageBean.setStopRow(endRow);
  PageBean<User> queryPage =
               Criteria.find(User.class).pageBean(pageBean).build().queryPage(client);

  // delete data
  byte[] rowKey = Bytes.toBytes(id);
  Criteria.delete(User.class).byRowKey(rowKey).build().excute(client); 

希望大家喜欢这个框架,多提意见
项目地址:https://github.com/zacharyzhanghao/orm-hbase

你可能感兴趣的:(hbase)