Zookeeper 3.7.0 安装部署

一、简介

1.1概述

Zookeeper 是一个开源的分布式的,为分布式框架提供协调服务的 Apache 项目。
Zookeeper 3.7.0 安装部署_第1张图片

 工作机制:

Zookeeper 3.7.0 安装部署_第2张图片

1.2 特点

Zookeeper 3.7.0 安装部署_第3张图片

1.3 数据结构

        ZooKeeper 数据模型的结构与 Unix 文件系统很类似 ,整体上可以看作是一棵树,每个 节点称做一个 ZNode 。每一个 ZNode 默认能够存储 1MB 的数据,每个 ZNode 都可以 通过 其路径唯一标识。

Zookeeper 3.7.0 安装部署_第4张图片

 1.4 应用场景

        提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下 线、软负载均衡等。

 1.5 下载地址

官网地址:Apache ZooKeeper

该版本下载地址:Index of /dist/zookeeper/zookeeper-3.7.0

二、本地安装

2.1 安装准备

(1)安装JDK

可以参考:Hadoop 3.3.1 分布式部署_我思,顾我在-CSDN博客 

(2)上传apache-zookeeper-3.7.0-bin.tar.gz 到服务器上/opt/software并解压到/opt/module下

[hadoop@ggl201 software]# tar -zxvf apache-zookeeper-3.7.0-bin.tar.gz -C /opt/module/

(3) 修改名称

[hadoop@ggl201 module]# mv apache-zookeeper-3.7.0-bin/ zookeeper-3.7.0

2.2 配置修改

(1)将/opt/module/zookeeper-3.7.0/conf 这个路径下的 zoo_sample.cfg 修改为 zoo.cfg;

[hadoop@ggl201 conf]$ mv zoo_sample.cfg zoo.cfg

(2)打开 zoo.cfg 文件,修改 dataDir 路径:

[hadoop@ggl201 zookeeper-3.7.0]$ vim zoo.cfg


#修改如下内容:
dataDir=/opt/module/zookeeper-3.7.0/zkData

(3)在/opt/module/zookeeper-3.7.0/这个目录上创建 zkData 文件夹

[hadoop@ggl201 zookeeper-3.7.0]$ mkdir zkData

2.3 操作

#(1)启动 Zookeeper

[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh start

#(2)查看进程是否启动

[hadoop@ggl201 zookeeper-3.7.0]$ jps

#(3)查看状态

[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh status

Zookeeper 3.7.0 安装部署_第5张图片

#(4)启动客户端

[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkCli.sh

#(5)退出客户端:

[zk: localhost:2181(CONNECTED) 0] quit

#(6)停止 Zookeeper

[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh stop

2.4 配置参数解读

Zookeeper 中的配置文件 zoo.cfg 中参数含义解读如下:
(1)tickTime = 2000:通信心跳时间,Zookeeper服务器与客户端心跳时间,单位毫秒
Zookeeper 3.7.0 安装部署_第6张图片

(2)initLimit = 10:LF初始通信时限

Zookeeper 3.7.0 安装部署_第7张图片

LeaderFollower初始连接时能容忍的最多心跳数(tickTime的数量)
(3)syncLimit = 5:LF同步通信时限

 LeaderFollower之间通信时间如果超过syncLimit * tickTimeLeader认为Follwer死 掉,从服务器列表中删除Follwer
(4)dataDir:保存Zookeeper中的数据

注意:默认的tmp目录,容易被Linux系统定期删除,所以一般不用默认的tmp目录。
(5)clientPort = 2181:客户端连接端口,通常不做修改。

 三、集群部署

 3.1 集群安装

(1)集群规划

        在 ggl201、ggl202 和 ggl203 三个节点上都部署 Zookeeper(安装奇数台)

(2)分发Zookeeper
[hadoop@ggl201 module]$ sudo xsync zookeeper-3.7.0/

(3)配置服务器编号

[hadoop@ggl201 zkData]$ vim myid
[hadoop@ggl202 zkData]$ vim myid
[hadoop@ggl203 zkData]$ vim myid


#在文件中添加与 server 对应的编号(注意:上下不要有空行,左右不要有空格)
#分别添加 
1 2 3

(4)配置zoo.cfg文件

#重命名/opt/module/zookeeper-3.5.7/conf 这个目录下的 zoo_sample.cfg 为 zoo.cfg
[hadoop@ggl201 conf]$ mv zoo_sample.cfg zoo.cfg

#打开 zoo.cfg 文件
[hadoop@ggl201 conf]$ vim zoo.cfg

#修改数据存储路径配置
dataDir=/opt/module/zookeeper-3.7.0/zkData

#允许followers连接并同步到leader的时间量,以滴答为单位。如果ZooKeeper管理的数据量很大,则根据需要增加此值
initLimit=50

#允许追随者与 ZooKeeper 同步的时间量,以滴答为单位。如果追随者落后于领导者太远,他们将被丢弃。
syncLimit=5

#限制由IP地址标识的单个客户端可以对ZooKeeper集合的单个成员进行的并发连接数(在套接字级别)。这用于防止某些类别的 DoS 攻击,包括文件描述符耗尽。默认值为 60。将此设置为 0 完全消除了对并发连接的限制。
maxClientCnxns=2000

#3.4.0 中的新增功能:启用后,ZooKeeper 自动清除功能会分别在dataDir和dataLogDir中保留autopurge.snapRetainCount最近的快照和相应的事务日志,并删除其余部分。默认为3。
autopurge.snapRetainCount=5

#3.4.0 中的新功能:必须触发清除任务的时间间隔(以小时为单位)。设置为正整数(1及以上)以启用自动清除。默认为 0。
autopurge.purgeInterval=3

#增加如下配置
#######################cluster##########################
server.1=ggl201:2888:3888
server.2=ggl202:2888:3888
server.3=ggl203:2888:3888

#配置参数解读
server.A=B:C:D。 
A 是一个数字,表示这个是第几号服务器;
集群模式下配置一个文件 myid,这个文件在 dataDir 目录下,这个文件里面有一个数据就是 A 的值,Zookeeper 启动时读取此文件,拿到里面的数据与 zoo.cfg 里面的配置信息比较从而判断到底是哪个 server。
B 是这个服务器的地址;
C 是这个服务器 Follower 与集群中的 Leader 服务器交换信息的端口;
D 是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的
Leader,而这个端口就是用来执行选举时服务器相互通信的端口。

#同步 zoo.cfg 配置文件
[hadoop@ggl201 conf]$ xsync zoo.cfg

(5)配置log4j.properties

zookeeper.log.dir=/data/zookeeper/logs

(6)集群操作

#分别启动 Zookeeper
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh start
[hadoop@ggl202 zookeeper-3.7.0]$ bin/zkServer.sh start
[hadoop@ggl203 zookeeper-3.7.0]$ bin/zkServer.sh start

#查看状态
[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.7.0/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: follower

[hadoop@ggl202 zookeeper-3.7.0]$ bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.7.0/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: follower

[hadoop@ggl203 zookeeper-3.7.0]$ bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.7.0/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: leader

3.2 选举机制

(1)第一次启动

Zookeeper 3.7.0 安装部署_第8张图片

 (2)非第一次启动

Zookeeper 3.7.0 安装部署_第9张图片

3.3 集群启动脚本

(1)在 ggl201 的/home/hadoop/bin 目录下创建脚本

[hadoop@ggl201 zookeeper-3.7.0]$ cd /home/hadoop/bin/
[hadoop@ggl201 bin]$ vim zk.sh

 添加如下内容:

#!/bin/bash
case $1 in
"start"){
for i in ggl201 ggl202 ggl203
do
 echo ---------- zookeeper $i 启动 ------------
ssh $i "/opt/module/zookeeper-3.7.0/bin/zkServer.sh 
start"
done
};;
"stop"){
for i in ggl201 ggl202 ggl203
do
 echo ---------- zookeeper $i 停止 ------------ 
ssh $i "/opt/module/zookeeper-3.7.0/bin/zkServer.sh 
stop"
done
};;
"status"){
for i in ggl201 ggl202 ggl203
do
 echo ---------- zookeeper $i 状态 ------------ 
ssh $i "/opt/module/zookeeper-3.7.0/bin/zkServer.sh 
status"
done
};;
esac

(2)增加执行权限

[hadoop@ggl201 bin]$ chmod +x zk.sh

(3)测试脚本

[hadoop@ggl201 zookeeper-3.7.0]$ zk.sh status
[hadoop@ggl201 zookeeper-3.7.0]$ zk.sh stop
[hadoop@ggl201 zookeeper-3.7.0]$ zk.sh start

(4)分发脚本

[hadoop@ggl201 bin]$ xsync zk.sh

四、客户端命令行操作

4.1命令行语法

Zookeeper 3.7.0 安装部署_第10张图片 (1)启动客户端

[hadoop@ggl201 zookeeper-3.7.0]$ bin/zkCli.sh -server ggl201:2181

 4.2 znode 节点数据信息

(1)查看当前节点所包含的信息

        

(2) 查看当前节点详细信息

         Zookeeper 3.7.0 安装部署_第11张图片

        1> czxid:创建节点的事务 zxid每次修改 ZooKeeper 状态都会产生一个 ZooKeeper 事务 ID。事务 ID 是 ZooKeeper 中所有修改总的次序。每次修改都有唯一的 zxid,如果 zxid1 小于 zxid2,那么 zxid1 在 zxid2 之前发生。
        2> ctime:znode 被创建的毫秒数(从 1970 年开始)
        3> mzxid:znode 最后更新的事务 zxid
        4> mtime:znode 最后修改的毫秒数(从 1970 年开始)
        5> pZxid:znode 最后更新的子节点 zxid
        6> cversion:znode 子节点变化号,znode 子节点修改次数
        7> dataversion:znode 数据变化号
        8> aclVersion:znode 访问控制列表的变化号
        9> ephemeralOwner:如果是临时节点,这个是 znode 拥有者的 session id。如果不是临时节点则是 0。

        10> dataLength:znode 的数据长度

        11> numChildren:znode 子节点数量

4.3 节点类型(持久/短暂/有序号/无序号)

Zookeeper 3.7.0 安装部署_第12张图片

4.4 监听器原理

客户端注册监听它关心的目录节点,当目录节点发生变化(数据改变、节点删除、子目录节点增加删除)时,ZooKeeper 会通知客户端。监听机制保证 ZooKeeper 保存的任何的数据的任何改变都能快速的响应到监听了该节点的应用程序。

Zookeeper 3.7.0 安装部署_第13张图片

你可能感兴趣的:(apache,zookeeper,分布式)