HBase是一个分布式的、面向列的开源数据库,源于 Google 的一篇论文 《BigTable:一个结构化数据的分布式存储系统》。
HBase以表的形式存储数据,表有行和列组成,列划分为若干个列族/列簇(column family)。
HBase 的官方网站:http://hbase.apache.org/
HBase 的运行有三种模式:单机模式、伪分布式模式、分布式模式。
(1)单机模式:在一台计算机上安装和使用 HBase,不涉及数据的分布式存储;
(2)伪分布式模式:在一台计算机上模拟一个小的集群;
(3)分布式模式:使用多台计算机实现物理意义上的分布式存储。
下载地址:http://archive.apache.org/dist/hbase/
(1)解压到/usr/local
sudo tar -zxvf hbase-2.2.4-bin.tar.gz -C /usr/local
(2)重命名为hbase
sudo mv ./hbase-2.2.4 ./hbase
sudo chown -R hadoop ./hbase #赋予权限
ls -l |grep hbase #查看
hbase version #查看hbase版本
HBase有三种运行模式,单机模式、伪分布式模式、分布式模式。以下先决条件很重要:
(1)配置JAVA_HOME环境变量,就会报错;
(2)jdk;
(3)Hadoop( 单机模式不需要,伪分布式模式和分布式模式需要);
(4)SSH;
(1)配置hbase-env.sh
配置JAVA环境变量,并添加配置HBASE_MANAGES_ZK为true,用vim命令打开并编辑hbase-env.sh,命令如下:
vim /usr/local/hbase/conf/hbase-env.sh
vim /usr/local/hbase/conf/ hbase-site.xm
添加下边几行配置进去。
hbase.rootdir
file:///usr/local/hbase/hbase-tmp
cd /usr/local/hbase #切换到hbase目录下
bin/start-hbase.sh #启动hbase
bin/hbase shell #打开shell命令行模式
exit #退出hbase
bin/stop-hbase.sh #停止hbase运行
将HBASE_CLASSPATH,设置为本机Hadoop安装目录下的conf目录(即/usr/local/hadoop/conf)。
命令如下:
vim /usr/local/hbase/conf/hbase-env.sh
vim /usr/local/hbase/conf/ hbase-site.xml
添加下边的配置进去
hbase.rootdir
hdfs://localhost:9000/hbase
hbase.cluster.distributed
true
hbase.unsafe.stream.capability.enforce
false
ssh localhost #登录ssh
cd /usr/local/hadoop #切换目录
./sbin/start-dfs.sh #启动hadoop
cd .. #回到上层目录
cd hbase #切换到hbase
bin/start-hbase.sh #运行hbase
jps #查看启动项
bin/hbase shell #进入shell界面
bin/stop-hbase.sh #停止hbase运行