rowkey

Row Key

HBase中row key用来检索表中的记录,支持以下三种方式:


• 通过单个row key访问:即按照某个row key键值进行get操作;
• 通过row key的range进行scan:即通过设置startRowKey和endRowKey,在这个范围内进行扫描;
• 全表扫描:即直接扫描整张表中所有行记录。

在HBase中,row key可以是任意字符串,最大长度64KB,实际应用中一般为10~100bytes,存为byte[]字节数组,一般设计成定长的。

row key是按照字典序存储

  设计row key时,要充分利用这个排序特点,将经常一起读取的数据存储到一块,将最近可能会被访问的数据放在一块。

  举个例子:如果最近写入HBase表中的数据是最可能被访问的,可以考虑将时间戳作为row key的一部分,由于是字典序排序,所以可以使用Long.MAX_VALUE - timestamp作为row key,这样能保证新写入的数据在读取时可以被快速命中。

Rowkey:

  1、 大小越小越好

  2、 值根据功能需求决定

  3、 Row最好有散列原则。

    a) 取反

    b) Hash

你可能感兴趣的:(#,hbase)