zookeeper的安装基本上可以按照http://hadoop.apache.org/zookeeper/docs/current/ zookeeperStarted.html 这个页面上的步骤完成安装,安装包可以从http://ftp.cuhk.edu.hk/pub/packages/apache.org/zookeeper/这里获取。zookeeper安装分为单机版和集群版安装,主要是配置上有一些不同,我们接下来逐个阐述。
1、 tar -xvf zookeeper-3.3.6.tar.gz
2、 cd zookeeper-3.3.6
3、 cd conf/
4、 mv zoo_sample.cfg zoo.cfg
5、 cd ../bin
6、 ./zkServer.sh start
基本就是解压后进入到配置文件将默认的配置文件例子修改为zoo.cfg及可。
一个单机版的基本默认的配置如下:
tickTime=2000
dataDir=/data/zookeeper
clientPort=2187
具体的配置参数详解如下:
tickTime:这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。
dataDir:顾名思义就是 Zookeeper 保存数据的目录,默认情况下,Zookeeper 将写数据的日志文件也保存在这个目录里。
clientPort:这个端口就是客户端连接Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。
当这些配置项配置好后,你现在就可以启动 Zookeeper 了,启动后要检查 Zookeeper 是否已经在服务,可以通过 netstat – ano 命令查看是否有你配置的 clientPort 端口号在监听服务,或者ps –ef|grep zookeeper 看是否有进程启动。
接下来我们重点讲解下集群版的配置。
tickTime=2000
dataDir=/data/zookeeper
clientPort=2187
initLimit=10
syncLimit=5
server.1=178.13.26.34:2988:3988
server.2=178.13.26.35:2989:3989
具体的配置参数详解如下:
initLimit:这个配置项是用来配置 Zookeeper接受客户端(这里所说的客户端不是用户连接 Zookeeper 服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10 个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒
syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是 2*2000=4 秒
server.A=B:C:D:其中 A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址;C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于 B 都是一样,所以不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。
除了修改 zoo.cfg 配置文件,集群模式下还要配置一个文件 myid,这个文件在 dataDir 目录下,这个文件里面就有一个数据就是 A 的值,Zookeeper 启动时会读取这个文件,拿到里面的数据与 zoo.cfg 里面的配置信息比较从而判断到底是那个 server。多机器部署集群的时候需要将myid来标示本机的id,一定要确保myid是标示改IP(B)的机器。
启动起来之后可以使用./zkServer.sh status来检查本机的状态。如下:
在安装过程中最容易出现的就是ConnectionLossException异常,通常原因是由于以下几种:
1、 服务器防火墙开启了;
2、 Client监听的端口被占用了;
3、 集群服务器之间不通
针对这三个可能的原因,解决办法如下:
1、 防火墙关闭
1.1、重启后生效
开启: chkconfigiptables on
关闭: chkconfigiptables off
1.2、即时生效,重启后失效
开启: service iptablesstart
关闭: service iptables stop
2、 更换clientPort端口号
3、 更换server.1和server.2的服务器,保障他们之间的网络可达的。