HBase初体验

      尝试了下HBase,对Hadoop这一整套的工具也算是都有了个感性的认识。我对Bigtable的描述感到很迷茫和无助,看了半天也不知道这个 东西到底是个什么东西,又应该如何使用这个东西。百闻不如一试,于是便配置了下HBase,HBase的配置和Hive一样,都非常简单,当然我指的是在伪分布式集群上,在真实的多节点集群上运行应该比较复杂,涉及到ZooKeepper的配置。我在试验机上以伪分布式的方式运行着Hadoop,把HBase下载下来之后,只需要修改两个地方就ok。
1、将hbase-env.sh中的JAVA_HOME路径设置为JDK的安装目录。
2、先"cp hbase-default.xml  hbase-site.xml",然后将hbase-site.xml中的hbase.rootdir修改成HDFS上的某个目录便可。比如:hdfs://localhost:9000/hbase
        配置完成之后先运行HBase服务器:
[henshao@test208011 bin]$ ./start-hbase.sh
master running as process 11054. Stop it first.
henshao@localhost's password:
localhost: starting regionserver, logging to /home/henshao/hbase-0.19.3/bin/../logs/hbase-henshao-regionserver-test208011.sqa.out
      服务器运行起来之后,就可以使用HBase Shell了。
[henshao@test208011 bin]$ ./hbase shell
HBase Shell; enter 'help<RETURN>' for list of supported commands.
Version: 0.19.3, r776824, Wed May 20 16:53:37 PDT 2009
hbase(main):001:0>
       在中国移动实验室的网站上找到一篇文章-http://labs.chinamobile.com/mblog/4110_22332?wralxianxrnx,照着上面操作了一番。前两天在网上看到2009年中国云计算大会,里面有中国移动的代表发表讲话,中国移动应该也在大规模使用Hadoop,凭中国移动的规模和财力,应该对开源社区有所的贡献的。
       HBase是用于存储松散耦合的数据,比起数据库对数据的约束非常少。列可以有很多属性,每一行可以有自己的属性。这种方式存储数据是很方便的,因为现实中很多数据确实是非结构化的,Google自己可能没有做类似于Hive这样的东西。移动实验室给出的那个例子非常形象。scores用于保存学生的成绩,比如保存高中同学的成绩。由于高中分为文理科,不同的同学考的科目不一样,如果使用关系数据库就需要涉及两张表。使用HBase就可以只使用一张表。
        下面录入了Tom和Jack两位同学的成绩,Tom录入的是数学成绩,Jack录入的则是艺术成绩。操作如下:
[henshao@test208011 bin]$ ./hbase shell
HBase Shell; enter 'help<RETURN>' for list of supported commands.
Version: 0.19.3, r776824, Wed May 20 16:53:37 PDT 2009
hbase(main):002:0> list
0 row(s) in 0.0026 seconds
hbase(main):003:0> create 'scores', 'grade', 'course'
0 row(s) in 6.0579 seconds
hbase(main):004:0> list
scores                                                                                                       
1 row(s) in 0.0040 seconds
hbase(main):005:0> put 'scores', 'Tom', 'course:math', '87'
0 row(s) in 0.0066 seconds
hbase(main):006:0> put 'scores', 'Jack', 'course:art', '83'
0 row(s) in 0.0032 seconds
hbase(main):007:0> get 'scores', 'Jack'
COLUMN                       CELL                                                                            
 course:art                  timestamp=1264737028325, value=83                                               
1 row(s) in 0.0104 seconds
hbase(main):008:0> describe 'scores'
{NAME => 'scores', FAMILIES => [{NAME => 'grade', COMPRESSION => 'NONE', VERSIONS => '3', LENGTH => '214748364
7', TTL => '-1', IN_MEMORY => 'false', BLOCKCACHE => 'false'}, {NAME => 'course', COMPRESSION => 'NONE', VERSI
ON
S => '3', LENGTH => '2147483647', TTL => '-1', IN_MEMORY => 'false', BLOCKCACHE => 'false'}]}              
1 row(s) in 0.0080 seconds
hbase(main):010:0> scan 'scores'
ROW                          COLUMN+CELL                                                                     
 Jack                        column=course:art, timestamp=1264737028325, value=83                            
 Tom                         column=course:math, timestamp=1264737012111, value=87                           
2 row(s) in 0.0294 seconds
         更详细的使用方法可以使用"help"来查看帮助。
http://fuzhijie.me

你可能感兴趣的:(HBase安装与基本操作)