zookeeper安装

前提是已经安装好HADOOP(020.2):

tar -zxvf zookeeper-3.3.2.tar.gz
cd zookeeper-3.3.2.tar.gz
mv * /hadoop/zookeeper
cd /hadoop/zookeeper

zookeeper要部署到各台机器的相同目录下,且具有相同的配置文件。

Zookeeper 的配置文件主要有以下两个:

1、/hadoop/zookeeper/conf/zoo.cfg:

# The number of milliseconds of each tick

tickTime=2000

# The number of ticks that the initial

# synchronization phase can take

initLimit=10

# The number of ticks that can pass between

# sending a request and getting an acknowledgement

syncLimit=5

# the directory where the snapshot is stored.

dataDir=/hadoop/zookeeper/zookeeper-data
dataLogDir=/hadoop/zookeeper/logs
# the port at which the clients will connect

clientPort=3355

# 2888,3888 are election port

server.1=hadoop2-namenode:2555:3555

server.2=hadoop2-datanode1:2555:3555

server.3=hadoop2-datanode2:2555:3555

注明:2555端口号是zookeeper服务之间通信的端口,而3555是zookeeper与其他应用程序通信的端口。
initLimit:这个配置项是用来配置 Zookeeper 接受客户端(这里所说的客户端不是用户连接 Zookeeper 服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10 个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒

syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是 2*2000=4 秒

server.A=B:C:D:其中 A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址;C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于 B 都是一样,所以不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。

2、myid(在zoo.cfg 配置的dataDir目录下,此处为/hadoop/zookeeper/zookeeper-data)

注意: Myid中的值与server的编号相同:

hadoop2-namenode上的myid:

1

hadoop2-datanode1上的myid:

2

hadoop2-datanode2上的myid:

 

3

1.1.3 启动zookeeper
到每台zookeeper server的目录下,执行:

启动 /hadoop/zookeeper/bin/zkServer.sh start

关闭 /hadoop/zookeeper/bin/zkServer.sh stop

查看状态:
/hadoop/zookeeper/bin/zkServer.sh status

你可能感兴趣的:(C++,c,hadoop,应用服务器,C#)