ZooKeeper介绍请见官网。
1.环境说明
在两台装有centos6.4(32位)的服务器上安装ZooKeeper,官网建议至少3个节点,资源有限,本次实验就2台了。
需要提前安装jdk,选择的版本是jdk-6u27-linux-i586.bin,下载地址:http://pan.baidu.com/s/1mgICcFA
2.配置主机名和ip映射的关系。
ZooKeeper集群所有的结点作为一个整体对分布式应用提供服务,因此需要各个节点实现互连,就要知道其他节点的主机和ip的映射关系。在每个节点上配置/etc/hosts文件,添加如下:
192.168.1.67 MasterServer
192.168.1.241 SlaveServer
3.安装ZooKeeper
1)下载ZooKeeper,建议选择稳定版,即stable的。
wget http://apache.dataguru.cn/zookeeper/stable/zookeeper-3.4.6.tar.gz
2)解压
tar -zxvf zookeeper-3.4.6.tar.gz
3)修改/etc/profile,添加
ZooKeeper路径
export ZOOKEEPER_HOME=/home/hadooper/hadoop/zookeeper-3.4.6
export PATH=$ZOOKEEPER_HOME/bin:$ZOOKEEPER_HOME/conf:$PATH
4)新建
zoo.cfg并修改
cp conf/zoo_sample.cfg conf/zoo.cfg
# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
dataDir=/home/hadooper/hadoop/zookeeper-3.4.6/data
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1
server.1=MasterServer:2888:3888
server.2=SlaveServer:2888:3888
参数说明:
①tickTime:心跳时间,毫秒为单位。
②initLimit:这个配置项是用来配置 Zookeeper 接受客户端(这里所说的客户端不是用户连接 Zookeeper服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10 个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 10*2000=20 秒。
③syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是 5*2000=10 秒。
④dataDir:存储内存中数据库快照的位置。
⑤clientPort:监听客户端连接的端口
⑥server.A=B:C:D:其中 A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址;C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于 B 都是一样,所以不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。
5)dataDir目录下创建myid文件,将内容设置为上⑥中的A值,用来标识不同的服务器。
4.远程复制安装文件
注:记得修改各节点的myid。
scp -r zookeeper-3.3.4/ hadooper@SlaveServer:/home/hadooper/hadoop/
转载请注明:http://blog.csdn.net/hwwn2009/article/details/40000881
1)各节点上启动
[hadooper@MasterServer zookeeper-3.4.6]$ bin/zkServer.sh start
2)jps查看进程
30056 QuorumPeerMain
QuorumPeerMain是zookeeper进程,说明启动正常。
[hadooper@MasterServer zookeeper-3.4.6]$ bin/zkServer.sh status
JMX enabled by default
Using config: /home/hadooper/hadoop/zookeeper-3.4.6/bin/../conf/zoo.cfg
Mode: follower
[hadooper@SlaveServer zookeeper-3.4.6]$ bin/zkServer.sh status
JMX enabled by default
Using config: /home/hadooper/hadoop/zookeeper-3.4.6/bin/../conf/zoo.cfg
Mode: leader
注:SlaveServer 为集群的leader。
4)停止ZooKeeper
[hadooper@MasterServer zookeeper-3.4.6]$ bin/zkServer.sh stop
转载请注明:http://blog.csdn.net/hwwn2009/article/details/40000881