HBase完全分布式配置

1.     HBase简介:

HBase –Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。HBase 是 Google BigTable 的开源实现,类似 Google Bigtable 利用 GFS 作为其文件存储系统,HBase 利用 Hadoop HDFS 作为其文件存储系统;Google 运行 MapReduce 来处理 BigTable 中的海量数据,HBase 同样利用 Hadoop MapReduce 来处理 HBase 中的海量数据;Google BigTable 利用 Chubby 作为协同服务,HBase 利用 ZooKeeper 作为对应。

2.     配置hbase-env.sh文件

进入解压后的hbase文件, 进入conf目录,配置JAVA_HOME路径和zookeeper:

# The java implementation to use. Java 1.6 required.
export JAVA_HOME=/java/jdk1.6.0_35 (jdk安装目录,具体参照自己的安装目录)

# Tell HBase whether it should manage it’s own instance ofZookeeper or not.
export HBASE_MANAGES_ZK=true (使用HBase默认自带的zookeeper) 

3.     配置hbase-site.xml文件

    进入解压后的hbase文件,进入conf目录,编辑hbase-site.xml文件, 配置如下图所示:

 HBase完全分布式配置_第1张图片

4.     配置regionservers文件

在文件中,添加slave1,slave节点

slave1

slave2                                                                                             

5.     HBase集群同步

将修改的hbase-env.sh, hbase-site.xml, regionservers用scp指令复制到各个子结点:


6.     启动HBase集群

启动集群, 运行结果如下:


7.     HBase基本用法

   进入${HBASE_HOME}/bin目录,执行. /hbase shell命令可以进入数据库。之后便能够进行各种基本操作。

常用命令如下所示:

 

名称

命令表达式

创建表

create '表名称', '列名称1','列名称2','列名称N'

添加记录

put '表名称', '行名称', '列名称:', '值'

查看记录

get '表名称', '行名称'

查看表中的记录总数

count  '表名称'

删除记录

delete  '表名' ,'行名称' , '列名称'

删除一张表

先要屏蔽该表,才能对该表进行删除,第一步 disable '表名称' 第二步  drop '表名称'

查看所有记录

scan "表名称"

查看某个表某个列中所有数据

scan "表名称" , ['列名称:']

更新记录

就是重写一遍进行覆盖

 

你可能感兴趣的:(Linux,Hadoop)