zookeeper 安装和简单使用

zookeeper 安装和简单使用


zookeeper 的安装和简单,

下载zookeeper-3.4.6,解压缩到一个目录。修改conf目录下的配置文件为zoo.cfg,使用默认的参数。如下,

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/tmp/zookeeper
clientPort=2181

这个版本的zookeeper提供windows的启动脚本,所以直接启动脚本就可以了。

zookeeper 默认的端口号为2181。启动后如下,

C:\Users\Lenovo>netstat -anob|findstr "2181"

C:\Users\Lenovo>netstat -anob|findstr "2181"
  TCP    0.0.0.0:2181           0.0.0.0:0              LISTENING       5148
  TCP    [::]:2181              [::]:0                 LISTENING       5148

可以看到2181端口启动成功。

现在使用windows的客户端脚本启动zookeeper的客户端。

如下,运行help查看命令行的帮助。

[zk: localhost:2181(CONNECTED) 6] help
ZooKeeper -server host:port cmd args
        stat path [watch]
        set path data [version]
        ls path [watch]
        delquota [-n|-b] path
        ls2 path [watch]
        setAcl path acl
        setquota -n|-b val path
        history
        redo cmdno
        printwatches on|off
        delete path [version]
        sync path
        listquota path
        rmr path
        get path [watch]
        create [-s] [-e] path data acl
        addauth scheme auth
        quit
        getAcl path
        close
        connect host:port
[zk: localhost:2181(CONNECTED) 7]

可以运行简单的命令,如下,ls命令和stat命令

[zk: localhost:2181(CONNECTED) 7] ls /
[zookeeper]
[zk: localhost:2181(CONNECTED) 8] stat /
cZxid = 0x0
ctime = Thu Jan 01 08:00:00 CST 1970
mZxid = 0x0
mtime = Thu Jan 01 08:00:00 CST 1970
pZxid = 0xe
cversion = 1
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 0
numChildren = 1

现在使用create命令在根目录下建立一个目录如下,

[zk: localhost:2181(CONNECTED) 9] create /zk_test mydata
Created /zk_test
[zk: localhost:2181(CONNECTED) 10] ls /
[zookeeper, zk_test]

现在使用get命令查看zk_test目录的信息,如下,

[zk: localhost:2181(CONNECTED) 11] get /zk_test
mydata
cZxid = 0x14
ctime = Sun Mar 15 16:47:09 CST 2015
mZxid = 0x14
mtime = Sun Mar 15 16:47:09 CST 2015
pZxid = 0x14
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 6
numChildren = 0

现在可以使用set命令设置目录 zk_test的数据,如下,

[zk: localhost:2181(CONNECTED) 12] set /zk_test junk
cZxid = 0x14
ctime = Sun Mar 15 16:47:09 CST 2015
mZxid = 0x15
mtime = Sun Mar 15 16:50:36 CST 2015
pZxid = 0x14
cversion = 0
dataVersion = 1
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 4
numChildren = 0
[zk: localhost:2181(CONNECTED) 13] get /zk_test
junk
cZxid = 0x14
ctime = Sun Mar 15 16:47:09 CST 2015
mZxid = 0x15
mtime = Sun Mar 15 16:50:36 CST 2015
pZxid = 0x14
cversion = 0
dataVersion = 1
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 4
numChildren = 0

最后使用delete命令删除目录,如下,

[zk: localhost:2181(CONNECTED) 14] delete /zk_test
[zk: localhost:2181(CONNECTED) 15] get /zk_test
Node does not exist: /zk_test
[zk: localhost:2181(CONNECTED) 16] ls /
[zookeeper]


以上就是zookeeper的安装和客户端的使用。


zookeeper的原理和运行机制

ZooKeeper 的客户端-服务器架构

zookeeper 安装和简单使用_第1张图片

ZooKeeper 有一个类似于文件系统的数据模型,由 znodes 组成。可以将 znodes(ZooKeeper 数据节点)视为类似 UNIX 的传统系统中的文件,但它们可以有子节点。另一种方式是将它们视为目录,它们可以有与其相关的数据。每个这些目录都被称为一个 znode。图 2 显示的图显示zookeeper的目录结构,

zookeeper 安装和简单使用_第2张图片


    znode 层次结构被存储在每个 ZooKeeper 服务器的内存中。这实现了对来自客户端的读取操作的可扩展的快速响应。每个 ZooKeeper 服务器还在磁盘上维护了一个事务日志,记录所有的写入请求。因为 ZooKeeper 服务器在返回一个成功的响应之前必须将事务同步到磁盘,所以事务日志也是 ZooKeeper 中对性能最重要的组成部分。可以存储在 znode 中的数据的默认最大大小为 1 MB。因此,即使 ZooKeeper 的层次结构看起来与文件系统相似,也不应该将它用作一个通用的文件系统。相反,应该只将它用作少量数据的存储机制,以便为分布式应用程序提供可靠性、可用性和协调


    当客户端请求读取特定 znode 的内容时,读取操作是在客户端所连接的服务器上进行的。因此,由于只涉及集合体中的一个服务器,所以读取是快速和可扩展的。然而,为了成功完成写入操作,要求 ZooKeeper 集合体的严格意义上的多数节点都是可用的。在启动 ZooKeeper 服务时,集合体中的某个节点被选举为领导者。当客户端发出一个写入请求时,所连接的服务器会将请求传递给领导者。此领导者对集合体的所有节点发出相同的写入请求。如果严格意义上的多数节点(也被称为法定数量(quorum))成功响应该写入请求,那么写入请求被视为已成功完成。然后,一个成功的返回代码会返回给发起写入请求的客户端。如果集合体中的可用节点数量未达到法定数量,那么 ZooKeeper 服务将不起作用。


    法定数量是通过严格意义上的多数节点来表示的。在集合体中,可以包含一个节点,但它不是一个高可用和可靠的系统。如果在集合体中有两个节点,那么这两个节点都必须已经启动并让服务正常运行,因为两个节点中的一个并不是严格意义上的多数。如果在集合体中有三个节点,即使其中一个停机了,您仍然可以获得正常运行的服务(三个中的两个是严格意义上的多数)。出于这个原因,ZooKeeper 的集合体中通常包含奇数数量的节点,因为就容错而言,与三个节点相比,四个节点并不占优势,因为只要有两个节点停机,ZooKeeper 服务就会停止。在有五个节点的集群上,需要三个节点停机才会导致 ZooKeeper 服务停止运作。

    现在,我们已经清楚地了解到,节点数量应该是奇数,让我们再来思考一下 ZooKeeper 集合体中需要有多少个节点。读取操作始终从连接到客户端的 ZooKeeper 服务器读取数据,所以它们的性能不会随着集合体中的服务器数量额变化而变化。但是,仅在写入法定数量的节点时,写入操作才是成功的。这意味着,随着在集合体中的节点数量的增加,写入性能会下降,因为必须将写入内容写入到更多的服务器中,并在更多服务器之间进行协调。

    ZooKeeper 的美妙之处在于,想运行多少服务器完全由您自己决定。如果想运行一台服务器,从 ZooKeeper 的角度来看是没问题的;只是您的系统不再是高度可靠或高度可用的。三个节点的 ZooKeeper 集合体支持在一个节点故障的情况下不丢失服务,这对于大多数用户而言,这可能是没问题的,也可以说是最常见的部署拓扑。不过,为了安全起见,可以在您的集合体中使用五个节点。五个节点的集合体让您可以拿出一台服务器进行维护或滚动升级,并能够在不中断服务的情况下承受第二台服务器的意外故障。

    因此,在 ZooKeeper 集合体中,三、五或七是最典型的节点数量。请记住,ZooKeeper 集合体的大小与分布式系统中的节点大小没有什么关系。分布式系统中的节点将是 ZooKeeper 集合体的客户端,每个 ZooKeeper 服务器都能够以可扩展的方式处理大量客户端。例如,HBase(Hadoop 上的分布式数据库)依赖于 ZooKeeper 实现区域服务器的领导者选举和租赁管理。您可以利用一个相对较少(比如说,五个)节点的 ZooKeeper 集合体运行有 50 个节点的大型 HBase 集群。


参考:

http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/

http://www.ibm.com/developerworks/cn/data/library/bd-zookeeper/

http://ifeve.com/zookeeper-leader/

http://greemranqq.iteye.com/blog/2171449

====================================END====================================


你可能感兴趣的:(zookeeper 安装和简单使用)