hbase获取所有版本(时间戳)的数据

参考此网页:http://www.php3.cn/a/130.html

首先,每一个cell里,可能包含多个时间戳的数据,

系统默认显示在时间范围内最新的那个。

在hbase里建立一个测试库,

根据网上的资料,实验如下,

首先我们要修改库的version,默认是1,当默认的情况下,是不会保留以前时间戳的数据的。

hbase shell

put 'lyx_test','wanglei','info:age','100'

put 'lyx_test','wanglei','info:age','101'

put 'lyx_test','wanglei','info:age','102'

当没设置version时,下行代码只显示了一行

get 'lyx_test','wanglei',{COLUMN=>'info:age',TIMERANGE=>[0,1487745602769],VERSIONS=>2}

设置version:

alter 'lyx_test',{NAME=>'info',VERSIONS=>2}

再执行上述put以及get后,发现能够显示两行

那么我要如何在java的MR代码中获取到包含所有版本时间戳的完整cell数据呢

在main里(或run里),在TableMapReduceUtil.initTableMapperJob之前声明的

Scan myscan=new Scan();后面增加此行代码

myscan.setMaxVersions();即可


原来的数据是这样的:

--KEY--2f1109b71037ae8ea86980--VALUE--keyvalues={2f1109b71037ae8ea86980/H:contact/86403/Put/vlen=3/seqid=0}

增加以后,kv输出的数据格式变成这样

--KEY--2f1109b71037ae8ea86980--VALUE--keyvalues={2f1109b71037ae8ea86980/H:contact/86403/Put/vlen=3/seqid=0, 2f1109b71037ae8ea86980/H:contact/86402/Put/vlen=2/seqid=0}




你可能感兴趣的:(hbase)