官网地址:Apache ZooKeeper
该版本下载地址:Index of /dist/zookeeper/zookeeper-3.7.0
(1)安装JDK
可以参考:Hadoop 3.3.1 分布式部署_我思,顾我在-CSDN博客
(2)上传apache-zookeeper-3.7.0-bin.tar.gz 到服务器上/opt/software并解压到/opt/module下
[hadoop@ggl201 software]# tar -zxvf apache-zookeeper-3.7.0-bin.tar.gz -C /opt/module/
(3) 修改名称
[hadoop@ggl201 module]# mv apache-zookeeper-3.7.0-bin/ zookeeper-3.7.0
(1)将/opt/module/zookeeper-3.7.0/conf 这个路径下的 zoo_sample.cfg 修改为 zoo.cfg;
[hadoop@ggl201 conf]$ mv zoo_sample.cfg zoo.cfg
(2)打开 zoo.cfg 文件,修改 dataDir 路径:
[hadoop@ggl201 zookeeper-3.7.0]$ vim zoo.cfg
#修改如下内容:
dataDir=/opt/module/zookeeper-3.7.0/zkData
(3)在/opt/module/zookeeper-3.7.0/这个目录上创建 zkData 文件夹
[hadoop@ggl201 zookeeper-3.7.0]$ mkdir zkData
#(1)启动 Zookeeper
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh start
#(2)查看进程是否启动
[hadoop@ggl201 zookeeper-3.7.0]$ jps
#(3)查看状态
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh status
#(4)启动客户端
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkCli.sh
#(5)退出客户端:
[zk: localhost:2181(CONNECTED) 0] quit
#(6)停止 Zookeeper
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh stop
(2)initLimit = 10:LF初始通信时限
Leader和Follower初始连接时能容忍的最多心跳数(tickTime的数量)
(3)syncLimit = 5:LF同步通信时限
Leader和Follower之间通信时间如果超过syncLimit * tickTime,Leader认为Follwer死 掉,从服务器列表中删除Follwer。
(4)dataDir:保存Zookeeper中的数据
注意:默认的tmp目录,容易被Linux系统定期删除,所以一般不用默认的tmp目录。
(5)clientPort = 2181:客户端连接端口,通常不做修改。
(1)集群规划
在 ggl201、ggl202 和 ggl203 三个节点上都部署 Zookeeper(安装奇数台)
[hadoop@ggl201 module]$ sudo xsync zookeeper-3.7.0/
(3)配置服务器编号
[hadoop@ggl201 zkData]$ vim myid
[hadoop@ggl202 zkData]$ vim myid
[hadoop@ggl203 zkData]$ vim myid
#在文件中添加与 server 对应的编号(注意:上下不要有空行,左右不要有空格)
#分别添加
1 2 3
(4)配置zoo.cfg文件
#重命名/opt/module/zookeeper-3.5.7/conf 这个目录下的 zoo_sample.cfg 为 zoo.cfg
[hadoop@ggl201 conf]$ mv zoo_sample.cfg zoo.cfg
#打开 zoo.cfg 文件
[hadoop@ggl201 conf]$ vim zoo.cfg
#修改数据存储路径配置
dataDir=/opt/module/zookeeper-3.7.0/zkData
#允许followers连接并同步到leader的时间量,以滴答为单位。如果ZooKeeper管理的数据量很大,则根据需要增加此值
initLimit=50
#允许追随者与 ZooKeeper 同步的时间量,以滴答为单位。如果追随者落后于领导者太远,他们将被丢弃。
syncLimit=5
#限制由IP地址标识的单个客户端可以对ZooKeeper集合的单个成员进行的并发连接数(在套接字级别)。这用于防止某些类别的 DoS 攻击,包括文件描述符耗尽。默认值为 60。将此设置为 0 完全消除了对并发连接的限制。
maxClientCnxns=2000
#3.4.0 中的新增功能:启用后,ZooKeeper 自动清除功能会分别在dataDir和dataLogDir中保留autopurge.snapRetainCount最近的快照和相应的事务日志,并删除其余部分。默认为3。
autopurge.snapRetainCount=5
#3.4.0 中的新功能:必须触发清除任务的时间间隔(以小时为单位)。设置为正整数(1及以上)以启用自动清除。默认为 0。
autopurge.purgeInterval=3
#增加如下配置
#######################cluster##########################
server.1=ggl201:2888:3888
server.2=ggl202:2888:3888
server.3=ggl203:2888:3888
#配置参数解读
server.A=B:C:D。
A 是一个数字,表示这个是第几号服务器;
集群模式下配置一个文件 myid,这个文件在 dataDir 目录下,这个文件里面有一个数据就是 A 的值,Zookeeper 启动时读取此文件,拿到里面的数据与 zoo.cfg 里面的配置信息比较从而判断到底是哪个 server。
B 是这个服务器的地址;
C 是这个服务器 Follower 与集群中的 Leader 服务器交换信息的端口;
D 是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的
Leader,而这个端口就是用来执行选举时服务器相互通信的端口。
#同步 zoo.cfg 配置文件
[hadoop@ggl201 conf]$ xsync zoo.cfg
(5)配置log4j.properties
zookeeper.log.dir=/data/zookeeper/logs
(6)集群操作
#分别启动 Zookeeper
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh start
[hadoop@ggl202 zookeeper-3.7.0]$ bin/zkServer.sh start
[hadoop@ggl203 zookeeper-3.7.0]$ bin/zkServer.sh start
#查看状态
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.7.0/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: follower
[hadoop@ggl202 zookeeper-3.7.0]$ bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.7.0/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: follower
[hadoop@ggl203 zookeeper-3.7.0]$ bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.7.0/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: leader
(1)第一次启动
(2)非第一次启动
(1)在 ggl201 的/home/hadoop/bin 目录下创建脚本
[hadoop@ggl201 zookeeper-3.7.0]$ cd /home/hadoop/bin/
[hadoop@ggl201 bin]$ vim zk.sh
添加如下内容:
#!/bin/bash
case $1 in
"start"){
for i in ggl201 ggl202 ggl203
do
echo ---------- zookeeper $i 启动 ------------
ssh $i "/opt/module/zookeeper-3.7.0/bin/zkServer.sh
start"
done
};;
"stop"){
for i in ggl201 ggl202 ggl203
do
echo ---------- zookeeper $i 停止 ------------
ssh $i "/opt/module/zookeeper-3.7.0/bin/zkServer.sh
stop"
done
};;
"status"){
for i in ggl201 ggl202 ggl203
do
echo ---------- zookeeper $i 状态 ------------
ssh $i "/opt/module/zookeeper-3.7.0/bin/zkServer.sh
status"
done
};;
esac
(2)增加执行权限
[hadoop@ggl201 bin]$ chmod +x zk.sh
(3)测试脚本
[hadoop@ggl201 zookeeper-3.7.0]$ zk.sh status
[hadoop@ggl201 zookeeper-3.7.0]$ zk.sh stop
[hadoop@ggl201 zookeeper-3.7.0]$ zk.sh start
(4)分发脚本
[hadoop@ggl201 bin]$ xsync zk.sh
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkCli.sh -server ggl201:2181
(1)查看当前节点所包含的信息
(2) 查看当前节点详细信息
1> czxid:创建节点的事务 zxid每次修改 ZooKeeper 状态都会产生一个 ZooKeeper 事务 ID。事务 ID 是 ZooKeeper 中所有修改总的次序。每次修改都有唯一的 zxid,如果 zxid1 小于 zxid2,那么 zxid1 在 zxid2 之前发生。
2> ctime:znode 被创建的毫秒数(从 1970 年开始)
3> mzxid:znode 最后更新的事务 zxid
4> mtime:znode 最后修改的毫秒数(从 1970 年开始)
5> pZxid:znode 最后更新的子节点 zxid
6> cversion:znode 子节点变化号,znode 子节点修改次数
7> dataversion:znode 数据变化号
8> aclVersion:znode 访问控制列表的变化号
9> ephemeralOwner:如果是临时节点,这个是 znode 拥有者的 session id。如果不是临时节点则是 0。
10> dataLength:znode 的数据长度
11> numChildren:znode 子节点数量
客户端注册监听它关心的目录节点,当目录节点发生变化(数据改变、节点删除、子目录节点增加删除)时,ZooKeeper 会通知客户端。监听机制保证 ZooKeeper 保存的任何的数据的任何改变都能快速的响应到监听了该节点的应用程序。