详情可以参考我的一篇基于集群资源管理Mesos的hadoop安装教程
我的所有程序均在hadoop用户下进行(除非必须要用root才切换),所有的安装解压均在hadoop主目录。
有任何问题,都以官方文档为准:http://hbase.apache.org
官方文档给出的对照关系如下
我的hadoop是0.20.205的所以我选择了hbase-0.92.x的版本
wget http://mirror.bjtu.edu.cn/apache/hbase/hbase-0.92.2/hbase-0.92.2.tar.gz tar -zxvf hbase-0.92.2.tar.gz
在root下执行 vi /etc/profile export HBASE_HOME=/home/hadoop/hbase-0.92.2 export path=$PATH:/home/hadoop/hbase-0.92.2/bin 保存后 source /etc/profile
我仅修改了JAVA_HOME其他根据需要可自己设定。意思里面都有 export JAVA_HOME=/usr/java/jdk1.6.0_43
export HBASE_MANAGES_ZK=true (这句要自己加,表示使用hbase自带的zookeeper)
拷贝hbase的模板到conf下 cp -f $HBASE_HOME/src/packages/conf-pseudo/hbase-site.xml $HBASE_HOME/conf
添加如下内容
<property> <name>hbase.rootdir</name> <value>hdfs://mastersrv:54310/hbase</value> </property> <property> <name>hbase.cluster.distributed</name> <value>true</value> </property> <property> <name>hbase.zookeeper.property.clientPort</name> <value>2181</value> </property> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>hbase.zookeeper.quorum</name> <value>slavesrv1,slavesrv2,slavesrv3</value> </property> <property> <name>hbase.zookeeper.property.dataDir</name> <value>/home/hadoop/hbase-zoo-dataDir</value> </property> <property> <name>hbase.master.port</name> <value>60000</value> </property>
所有属性的含义可见中文官方文档 2.3.1.1 hbase默认配置
http://abloz.com/hbase/book.html
注意:hbase.rootdir 的值要和hdfs-site.xml里面相同。(后面的hbase无妨,它自己会建的)
引用:http://www.cnblogs.com/hanyuanbo/archive/2012/07/28/2612886.html
vi $HADOOP_HOME/conf/hdfs-site.xml <property> <name>dfs.datanode.max.xcievers</name> <value>4096</value> </property> 该参数限制了datanode所允许同时执行的发送和接受任务的数量,缺省为256,hadoop-defaults.xml中通常不设置这个参数。这个限制看来实际有些偏小,高负载下,DFSClient 在put数据的时候会报 could not read from stream 的 Exception。
官方说法:
An Hadoop HDFS datanode has an upper bound on the number of files that it will serve at any one time. The upper bound parameter is called xcievers
(yes, this is misspelled).
Not having this configuration in place makes for strange looking failures. Eventually you'll see a complain in the datanode logs complaining about the xcievers exceeded, but on the run up to this one manifestation is complaint about missing blocks. For example: 10/12/08 20:10:31 INFO hdfs.DFSClient: Could not obtain block blk_XXXXXXXXXXXXXXXXXXXXXX_YYYYYYYY from any node: java.io.IOException: No live nodes contain current block. Will get new block locations from namenode and retry...
vi regionservers
slavesrv1
slavesrv2
slavesrv3
这步可能不是必须的,因为怕发生版本之间承接的问题,所以我就直接先做了这个处理。 cp $HADOOP_HOME/hadoop-core-0.20.205.0.jar $HBASE_HOME/lib 将原来的jar移到其他地方去 mv $HBASE_HOME/lib/hadoop-core-1.0.3.jar ~/myfile
scp -r ~/hbase-0.92.2 hadoop@slavesrv1:~/
scp -r ~/hbase-0.92.2 hadoop@slavesrv2:~/
scp -r ~/hbase-0.92.2 hadoop@slavesrv3:~/
在所有机器上执行以下操作
安装NTP服务 yum install ntp 在root下启动服务 service ntpd start 在各台机器上用date快速查看下。应该是一样的了。(同步可能花些时间,最长不超过5分钟)
jps命令查看主节点有 NameNode SecondaryNameNode 从节点上有 DataNode
start-hbase.sh
成功启动后会有如下进程
mastersrv:
slavesrvX:
zookeeper的情况
http://192.168.4.100:60010/zk.jsp
master的情况
http://192.168.4.100:60010/master-status
下图看看regionServer是否都正常开启
查看regionServer的情况
http://192.168.4.101:60030/rs-status
http://192.168.4.102:60030/rs-status
http://192.168.4.103:60030/rs-status
总结:基本顺利,碰到2次问题,比较快的解决了,按照这样的方式装下来肯定没问题。