深夜书屋

08-Hadoop之Zookeeper详解

Zookeeper入门

一、 zookeeper 概述

1.1 概述

zookeeper 是一个开源的分布式协调系统，为分布式应用提供协调服务的Apache项目。

工作机制：
	从设计角度：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接收观察者的注册，一旦这些数据的状态发生变化，zookeeper就将负责通知已经在zookeeper上个注册的那些观察者做出相应的反应。
	
设计目标：
	将那些复杂且容易出错的分布式服务封装起来，构成一个高效可靠的分布式服务框架，并给用户提供一系列简单易用的接口提供给用户。
官方文档的设计目标：
	1.ZooKeeper is simple。（简单）
	2.ZooKeeper is replicated （被复制的）
	3.ZooKeeper is ordered （有序的）
	4.ZooKeeper is fast （速度快）

观察者模式，又叫发布-订阅模式，定义对象间一种一对多的依赖关系，使得每当一个对象改变状态时，所有依赖于它的对象都会得到通知并自动更新。

设计模式总共有 23种设计模式 ，并分成三大类： 创建型模式、结构型模式、行为型模式，每一种设计模式都解决一种特定的场景。

创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。

结构型模式，共七种：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。

行为型模式，共十一种：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、访问者模式、中介者模式、解释器模式、状态模式。

1.2 特点

（1） zookeeper是一个领导者（Leader），多个跟随者（Follower）组成的集群。

（2） 集群中只要半数以上节点存活， zookeeper集群就能正常服务。

（3）全局一致性：每个 Server 保存一份相同的数据副本， Client 无论连接到哪个 Server ，数据都是一致的。

（4）更新请求顺序进行，来自同一个 Client 的更新请求按其发送顺序依次执行的。

（5）数据更新原子性： 一次数据更新要么成功，要么失败。

（6）实时性：在一定时间范围内， Client 能读到最新数据。

1.3 数据结构

zookeeper 数据模型的结构与 Unix ( 或Linux )文件系统很类似，整体上可以看作是一棵树，每个节点称做一个ZNode。每一个ZNode 默认能够存储 1MB 的数据，每个ZNode 都可以通过其路径唯一标识。

1.4 应用场景

zookeeper提供的服务包括：统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。

统一命名服务

统一配置管理

统一集群管理

服务器节点动态上下线

软负载均衡

1.5 下载地址

**官方地址： https://zookeeper.apache.org/ **

下载步骤：

二、 zookeeper 安装

2.1 本地模式安装部署

2.1.1 安装前准备

（1）安装 JDK — Hadoop集群已配置

（2）拷贝zookeeper安装包到Linux系统下

将压缩包放到 /opt/software

（3）解压到指定目录

进入到 /opt/software/

将压缩文件解压到 /opt/module/ ，命令为：

tar -zxvf zookeeper-3.5.7.tar.gz -C /opt/module/

（4）更改zookeeper目录名

mv apache-zookeeper-3.5.7-bin zookeeper-3.5.7

2.1.2 配置更改

（1）将 /opt/module/zookeeper-3.5.7/conf 下的 zoo_sample.cfg 修改为 zoo.cfg。

cd /opt/module/zookeeper-3.5.7/conf
mv zoo_sample.cfg zoo.cfg

（2）打开 zoo.cfg 文件，修改 dataDir 路径。

修改内容如下

dataDir=/opt/module/zookeeper-3.5.7/zkData

原来的配置文件给出的data是放在tmp下的，只是一个例子，使用的时候需要更改

（3）创建（2）时 dataDir 文件

mkdir zkData

注意：一定要和配置文件设置的路径一样，一般将它放在zookeeper的根目录下

（4）配置环境变量

配置环境变量主要是要看：后期运行时需不要使用到，如 Hadoop就需要 JAVA_HOME 环境变量。

1. 打开环境配置文件
sudo vim /etc/profile.d/my_env.sh 

2. 添加以下内容
export ZOOKEEPER_HOME=/opt/module/zookeeper-3.5.7
export PATH=$PATH:$ZOOKEEPER_HOME/bin

3. 保存退出 并且 source 配置文件
source /etc/profile.d/my_env

（5）测试 zookeeper

bin/zkServer.sh start   --->  启动 zookeeper 服务
zkServer.sh status   --->   查看 zookeeper 服务状态

zkCli.sh   --->  启动 zookeeper 客户端

quit   --->   退出客户端

zkServer.sh restart   --->  重新启动 zookeeper 服务
zkServer.sh stop   --->  关闭 zookeeper 服务

2.2 配置参数解读

对 zookeeper 中的配置文件 zoo.cfg 中参数含义解读：
1）tickTime =2000：通信心跳数，Zookeeper服务器与客户端心跳时间，单位毫秒
Zookeeper使用的基本时间，服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个tickTime时间就会发送一个心跳，时间单位为毫秒。
它用于心跳机制，并且设置最小的session超时时间为两倍心跳时间。(session的最小超时时间是2*tickTime)

2）initLimit =10：LF初始通信时限
集群中的Follower跟随者服务器与Leader领导者服务器之间初始连接时能容忍的最多心跳数（tickTime的数量），用它来限定集群中的Zookeeper服务器连接到Leader的时限。

3）syncLimit =5：LF同步通信时限
集群中Leader与Follower之间的最大响应时间单位，假如响应超过syncLimit * tickTime，Leader认为Follwer死掉，从服务器列表中删除Follwer。

4）dataDir：数据文件目录+数据持久化路径
主要用于保存Zookeeper中的数据。

5）clientPort =2181：客户端连接端口
监听客户端连接的端口。

三、 zookeeper 实战（开发重点）

3.1 分布式安装部署

3.1.1 集群规划

集群模式是在本地模式的配置上进行修改，所以需要先配置本地模式

在 hadoop102 、 hadoop103 、 hadoop104 三个节点上部署 zookeeper

3.1.2 将 zookeeper 服务停掉

zkServer.sh stop

3.1.3 配置服务器编号

（1）在 /opt/module/zookeeper-3.5.7/zkData 下创建一个 myid 的文件

touch myid

（2）在myid 文件中添加一个数值

该数值表示该节点在集群中的唯一id

hadoop102中的myid文件中写2
hadoop103中的myid文件中写3
hadoop104中的myid文件中写4

注意： myid文件的数字不能有空格、不能有多余行

3.1.4 配置 zoo.cfg 文件

在zoo.cfg中添加以下内容：
	server.2=hadoop102:2888:3888
	server.3=hadoop103:2888:3888
	server.4=hadoop104:2888:3888
	
解释   server.A=B:C:D
        A：myid 中的值
        B: myid 中的值对应的服务器的地址
        C: leader 和 follower 通信的端口号
        D: 选举 leader 时相互通信的端口号
zookeeper 在启动时会读取 zkData（dataDir）下的myid文件，拿到里面的数据与 zoo.cfg 里面的配置信息比较， 从而判断到底是哪一个server

3.1.5 集群操作

（1）手动启动集群

需要每台节点单独启动
zkServer.sh start

注意： zookeeper 的特点中已经解释过：集群中要有半数以上节点存活， zookeeper集群才能正常服务 ，所以当启动的节点数不超过zoo.cfg配置的数量的一半时，zookeeper集群启动失败

（2）脚本群起

在zookeeper的bin目录下创建

#!/bin/bash
if [ $# -ne 1 ]
	then
		echo "args number error!!!"
		exit
fi

var=""

case $1 in
"start")
	var="start"
	;;
"stop")
	var="stop"
	;;
"status")
	var="status"
	;;
*)
	echo "args info error!!!"
	exit
	;;
esac

for host in hadoop102 hadoop103 hadoop104
do
	echo "==========================$host======================"
	ssh $host /opt/module/zookeeper-3.5.7/bin/zkServer.sh $var
done

3.2 客户端命令行操作

命令基本语法	功能描述
help	显示所有操作命令
ls path	使用 ls 命令来查看当前znode的子节点 -w 监听子节点变化 -s 附加次级信息
create	普通创建 -s 含有序列 -e 临时（重启或者超时消失）
get path	获得节点的值 -w 监听节点内容变化 -s 附加次级信息
set	设置节点的具体值
stat	查看节点状态
delete	删除节点
deleteall	递归删除节点

常用客户端命令

（1）  启动客户端
		bin/zkCli.sh
（2）  显示所有操作命令
		help
（3）  查看当前 znode 中所包含的内容
		ls /
（4）  查看当前节点详细数据
		ls -s /
		或者 
		ls2 /    备注：ls2 / 已经被弃用了，会提示使用 ls -s path代替，但是还可以得到结果
（5）  分别创建2个普通节点
        create /sanguo "jinlian"
        create /sanguo/shuguo "liubei"
（6）  获取节点的值
		get /sanguo
（7）  创建短暂节点
		create -e /sanguo/wuguo "zhouyu"
（8）  创建带序号的节点
		create -s /sanguo/weiguo/xiaoqiao "jinlian"
（9）  修改节点数据值
		set /sanguo/weiguo "simayi"
（10） 节点的值变化监听
		监听三国节点
		get /sanguo watch   --- hadoop102
		其他机器对"三国"节点发生修改则会返回信息
		set /sanguo "xisi"  --- hadoop103
		返回信息如下：
		WATCHER::
	WatchedEvent state:SyncConnected type:NodeDataChanged path:/sanguo
（11） 节点的子节点变化监听（路径监听）
		监听节点
		ls /sanguo watch  --- hadoop102
		创建“三国”子节点
		create /sanguo/jin "simayi"  --- hadoop103
		返回信息如下：
		WATCHER::
	WatchedEvent state:SyncConnected type:NodeChildrenChanged path:/sanguo
（12） 删除节点
		delete /sanguo/jin
（13） 递归删除节点
		deleteall /sanguo/shuguo
		或者
		rmr /sanguo/shuguo  备注：已经被弃用
（14） 查看节点状态
		stat /sanguo

3.3 API 应用

3.3.1 idea 环境搭建

（1）创建 Maven 工程

（2）添加 pom 文件

添加依赖内容如下


		
			junit
			junit
			RELEASE
		
		
			org.apache.logging.log4j
			log4j-core
			2.8.2
		
		
		
			org.apache.zookeeper
			zookeeper
			3.5.7

（3）创建 `log4j.properties`

需要在项目的src/main/resources目录下，新建一个File，命名为log4j.properties，在文件中填入。

log4j.rootLogger=INFO, stdout  
log4j.appender.stdout=org.apache.log4j.ConsoleAppender  
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout  
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender  
log4j.appender.logfile.File=target/spring.log  
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout  
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

3.3.2 zookeeper客户端操作

（1） API使用

package zk;

import org.apache.zookeeper.*;
import org.apache.zookeeper.data.Stat;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;
import java.io.IOException;
import java.util.List;
/*
    通过代码操作Zookeeper:
    1.创建客户端对象
    2.具体操作
    3.关闭资源
 */
public class ZKDemo {
    private ZooKeeper zk;
    /*
        1.创建客户端对象
     */
    @Before
    public void before() throws IOException {
        /*
        ZooKeeper(String connectString, int sessionTimeout, Watcher watcher)
        connectString : zk服务器地址
        sessionTimeout : session超时时间（一般为两倍的心跳时间）
        watcher : 一个监听器对象，当ZK服务器需要有事件通知客户端事就会调用该对象中的process方法
                总监听事件对象一般不用。
         */
        String connectString = "hadoop102:2181,hadoop103:2181,hadoop104:2181";
        zk = new ZooKeeper(connectString, 4000, new Watcher() {
            /*
                在该方法中实现当监听事件发生后需要处理的业务逻辑代码。
             */
            public void process(WatchedEvent event) {

            }
        });
    }
    /*
        3.关闭资源
     */
    @After
    public void after(){
        if (zk != null){
            try {
                zk.close();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }
    /*
        创建子节点
     */
    @Test
    public void test() throws KeeperException, InterruptedException {
        /*
         create(final String path, byte data[], List acl,CreateMode createMode)
         path : 节点的路径
         data : 节点中的数据
         acl ： 访问控制权限(节点权限)
         createMode ：节点的类型
         */
        String s = zk.create("/xiyouji/longge", "longgeliaobude".getBytes(),
                ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);

        System.out.println(s);
    }

    /*
        判断子节点是否存在
     */
    @Test
    public void test2() throws KeeperException, InterruptedException {
        /*
            exists(String path, boolean watch)
            path : 节点路径
            watch : 是否使用总监听器对象
            注意：如果返回的对象为null则说明节点不存在，不为null则存在
         */
        Stat exists = zk.exists("/xiyouji/longge123", false);
        System.out.println(exists==null?"不存在" : "存在");
    }
    /*
        获取子节点并监听子节点变化
     */
    @Test
    public void test3() throws KeeperException, InterruptedException {
        /*
            getChildren(final String path, Watcher watcher)
            path : 节点的路径
            watcher :  一个监听器对象，当ZK服务器需要有事件(子节点变化事件)通知客户端时就会调用该对象中的process方法
                    process方法：在该方法中实现当监听事件（子节点变化事件)发生后需要处理的业务逻辑代码。
         */
        List<String> children = zk.getChildren("/xiyouji", new Watcher() {
            public void process(WatchedEvent event) {
                System.out.println("节点发生改变了");
            }
        });
        //遍历子节点
        for (String child : children) {
            System.out.println(child);
        }
        //不能让程序结束否则无法接受事件的消息
        Thread.sleep(Long.MAX_VALUE);
    }


    @Test
    public void test4() throws KeeperException, InterruptedException {
        listener();
        //不能让程序结束否则无法接受事件的消息
        Thread.sleep(Long.MAX_VALUE);
    }
    public void listener() throws KeeperException, InterruptedException {
        List<String> children = zk.getChildren("/xiyouji", new Watcher() {
            public void process(WatchedEvent event) {
                //当监听发生时：1.业务逻辑处理   2.再次注册监听
                System.out.println("节点发生改变了");
                try {
                    listener();
                } catch (KeeperException e) {
                    e.printStackTrace();
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            }
        });
        //遍历子节点
        for (String child : children) {
            System.out.println(child);
        }
    }
}

（2）监听服务器节点动态上下线案例

a. 服务器节点端（zkServer.java）

package zk2;

import org.apache.zookeeper.*;
import org.apache.zookeeper.data.Stat;
import java.io.IOException;
/*
    1.创建客户端对象
    2.判断父节点是否存在，如果不存在则创建
    3.创建临时节点
 */
public class ZKServer {
    public static void main(String[] args) throws IOException, KeeperException, InterruptedException {
        //1.创建客户端对象
        String connectString = "hadoop102:2181,hadoop103:2181,hadoop104:2181";
        ZooKeeper zk = new ZooKeeper(connectString, 4000, new Watcher() {
            public void process(WatchedEvent event) {

            }
        });
        //2.判断父节点是否存在，如果不存在则创建
        Stat exists = zk.exists("/server", false);
        if (exists==null){//父节点不存则创建
            zk.create("/server","".getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
        }
        //3.创建临时节点
        zk.create("/server/" + args[0],args[1].getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE,CreateMode.EPHEMERAL);
        //4.不能让程序结束
        Thread.sleep(Long.MAX_VALUE);
    }
}

b. 客户端 (zkClient.java)

package zk2;

import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.ZooKeeper;
import java.io.IOException;
import java.util.List;
/*
    1.创建客户端对象
    2.判断父节点是否存在（有没有必要取决于先启动谁）
    3.获取子节点并监听子节点变化
    4.不能让程序停止
 */
public class ZKClient {
    private static ZooKeeper zk;
    public static void main(String[] args) throws IOException, KeeperException, InterruptedException {
        //1.创建客户端对象
        String connectString = "hadoop102:2181,hadoop103:2181,hadoop104:2181";
        zk = new ZooKeeper(connectString, 4000, new Watcher() {
            public void process(WatchedEvent event) {

            }
        });
        // 3.获取子节点并监听子节点变化
        listener();

        //4.不能让程序停止
        Thread.sleep(Long.MAX_VALUE);
    }

    public static void listener() throws KeeperException, InterruptedException {
        List<String> children = zk.getChildren("/server", new Watcher() {
            public void process(WatchedEvent event) {
                //1.业务逻辑处理（遍历所有子节点-有几台服务器就有几个子节点） 2.再次监听
                try {
                    listener();
                } catch (KeeperException e) {
                    e.printStackTrace();
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            }
        });
        //遍历子节点
        for (String child : children) {
            System.out.println(child);
        }
        System.out.println("===================================================");
    }
}

四、 zookeeper 内部原理

4.1 节点类型

4.2 stat 结构体

（1）czxid-创建节点的事务zxid  --- 必须了解
    每次修改ZooKeeper状态都会收到一个zxid形式的时间戳，也就是ZooKeeper事务ID。
    事务ID是ZooKeeper中所有修改总的次序。每个修改都有唯一的zxid，如果zxid1小于zxid2，那么zxid1在zxid2之前发生。

（2）ctime - znode被创建的毫秒数(从1970年开始)

（3）mzxid - znode最后更新的事务zxid

（4）mtime - znode最后修改的毫秒数(从1970年开始)

（5）pZxid-znode最后更新的子节点zxid

（6）cversion - znode子节点变化号，znode子节点修改次数

（7）dataversion - znode数据变化号

（8）aclVersion - znode访问控制列表的变化号

（9）ephemeralOwner- 如果是临时节点，这个是znode拥有者的session id。如果不是临时节点则是0。

（10）dataLength- znode的数据长度

（11）numChildren - znode子节点数量

4.3 监听器原理（面试重点）

4.4 paxos 算法（了解）

Paxos算法一种基于消息传递且具有高度容错特性的一致性算法。

Paxos 算法解决的问题是在一个可能发生上述异常的分布式系统中如何就某个值达成一致，保证不论发生以上任何异常，都不会破坏决议的一致性。

算法流程

（1）Prepare: Proposer生成全局唯一且递增的Proposal ID (可使用时间戳加Server ID)，向所有Acceptors发送Prepare请求，这里无需携带提案内容，只携带Proposal ID即可。

（2）Promise: Acceptors收到Prepare请求后，做出“两个承诺，一个应答”。
两个承诺：
    不再接受Proposal ID小于等于（注意：这里是<= ）当前请求的Prepare请求。
    不再接受Proposal ID小于（注意：这里是< ）当前请求的Propose请求。
一个应答：
	不违背以前做出的承诺下，回复已经Accept过的提案中Proposal ID最大的那个提案的Value和Proposal ID，没有则返回空值。
	
（3）Propose: Proposer 收到多数Acceptors的Promise应答后，从应答中选择Proposal ID最大的提案的Value，作为本次要发起的提案。如果所有应答的提案Value均为空值，则可以自己随意决定提案Value。然后携带当前Proposal ID，向所有Acceptors发送Propose请求。

（4）Accept: Acceptor收到Propose请求后，在不违背自己之前做出的承诺下，接受并持久化当前Proposal ID和提案Value。

（5）Learn: Proposer收到多数Acceptors的Accept后，决议形成，将形成的决议发送给所有Learners。

Paxos算法缺陷：在网络复杂的情况下，一个应用Paxos算法的分布式系统，可能很久无法收敛，甚至陷入活锁的情况。

造成原因：系统中有一个以上的Proposer，多个Proposers相互争夺Acceptors，造成迟迟无法达成一致的情况。针对这种情况，一种改进的Paxos算法被提出：从系统中选出一个节点作为Leader，只有Leader能够发起提案。这样，一次Paxos流程中只有一个Proposer，不会出现活锁的情况，此时只会出现例子中第一种情况。

4.5 选举机制（面试重点）

4.5.1 前言

（1） SID：服务器ID。用来唯一标识一台ZooKeeper集群中的机器，每台机器不能重复，和myid一致。

（2） ZXID：事务ID。ZXID是一个事务ID，用来标识一次服务器状态的变更。在某一时刻，集群中的每台机器的ZXID值不一定完全一致，这和ZooKeeper服务器对于客户端“更新请求”的处理逻辑有关。

（3） Epoch：每个Leader任期的代号。没有Leader时同一轮投票过程中的逻辑时钟值是相同的。每投完一次票这个数据就会增加

（4） 半数机制： 集群中半数以上机器存活，集群可以用。所以zookeeper适合安装奇数台服务器。

（5） 在zookeeper配置文件中，虽然没有指定 Master 和 Slave，但是在zookeeper

4.5.2 选举过程

以 5台服务器组成的zookeeper集群为例：（其他也一样）

参考：

公众号：大数据那些事链接：https://mp.weixin.qq.com/s/jhYEuZSOnGJDxznEEhxREg

a. 第一次启动zookeeper

选举流程：

zookeeper集群有5台服务器，那么根据半数机制，zookeeper集群正常启动至少需要 3 台，当票数相同时会比较服务器的myid的值，myid的值是唯一的。

（1）当 server1 启动时，发起第一次选举。此时，server1 会投给自己一票，此时 server1 的票数为1 < 3，不满足半数机制，leader选举未完成，集群无法正常启动，server1 保持为 looking 状态；

（2）当 server2 启动时，发起第二次选举。 server1 和 server2 会先投自己一票并相互交换选票信息，交互过程：server1 和 server2 的投票票数相同，会比较 myid， server1 发现 server2 的myid 比自己投票推举的（server1）大，改投 server2。此时， server1 的票数为0， server2 的票数为2，不满足半数机制，选举无法完成，集群无法正常启动，server1 和 server2 保持为 looking 状态；

（3）server3 启动时，发起第三次选举。先给自己投一票后交换选票信息，然后比较myid， server3 的myid最大，server1 和 server2 都会更改选票信息，改投server3 。此时， server1 的票数为0 ， server2 的票数为0， server3 的票数为 3 。当前已经满足半数机制， server3 当选leader。server1 和 server2 更改状态为 following， server3 的状态为 leading；

（4）server4 启动时，发起第四次选举。由于server1、server2、server3已经不是looking状态，不会更改选票信息。此时，server1 的票数为0 ， server2 的票数为0， server3 的票数为 3， server4 的票数为0 。 server4服从多数，更改选票信息为 server3 并更改状态为 following， server3 的票数为4 。（也可以理解为：集群中老大已经诞生了，其他都会甘愿做小弟，把票投给老大）

（5）server5 启动，跟server4 的情况一样，最终状态为 following。

b. 非第一次启动zookeeper

选举流程为：

zookeeper集群有5台服务器，zookeeper集群正常启动至少需要 3 台。由于不是第一次启动，会有zxid（事务id）产生，所以相对于第一次启动时选举机制发生改变

（1）当zookeeper集群启动时，出现以下情况的某一种时，就会进入leader选举：

a. 服务器初始化启动。

b. 服务器运行期间无法和leader保持正常连接。

（2）而当一台服务器进入leader选举流程时，当前集群也可能处于以下两种状态：

a. 集群中本来就已经存在一个leader。

对于第一种已经存在Leader的情况，机器试图去选举Leader时，会被告知当前服务器的Leader信息，对于该机器来说，仅仅需要和Leader机器建立连接，并进行状态同步即可。

b. 集群中确实不存在leader。（leader所在服务器发生故障）

假设ZooKeeper由5台服务器组成，SID分别为1、2、3、4、5，ZXID分别为8、8、8、7、7，并且此时SID为3的服务器是Leader。某一时刻，3和5服务器出现故障，因此开始进行Leader选举。

则 SID 为 1 、 2 、 4 的机器投票情况

（EPOCH，ZXID，SID）（EPOCH，ZXID，SID）（EPOCH，ZXID，SID）

（1,8,1）（1,8,2）（1,7,4）

此时选举leader的规则：

① EPOCH 大的直接胜出

② EPOCH 相同，事务id （zxid）大的胜出

③ 事务id相同，服务器id （myid）大的胜出

（EPOCH，ZXID，SID）	（EPOCH，ZXID，SID）	（EPOCH，ZXID，SID）
（1,8,1）	（1,8,2）	（1,7,4）

4.6 写数据流程

五、 zookeeper的数据存储

本章节参考以下文章：

作者：yannhuang 链接：https://www.jianshu.com/p/8fba732af0cd

5.1 内存数据

zookeeper的数据结构是树，在内存数据库中，存储了树的所有内容，内容包括所有的节点路径、节点数据、ACL信息，并且zookeeper会定时将这个数据存储到磁盘上。 — 类似 HDFS

变量名	解释
parent	父节点信息
data[]	数据信息
ACL	访问控制信息
stat	持久化到磁盘上的统计信息
children	子节点信息

（1）DataTree

DataTree 是整个 zookeeper 内存数据库的核心，代表内存中一份完整的数据。DataTree不包含任何与网络、客户端连接及请求处理相关的业务逻辑，是一个独立的组件。

这棵树维护了2个并行的数据结构，一个是哈希表（全路径到数据节点的映射），一个是一棵由数据节点构成的树。所有的访问都是通过哈希表来映射到数据节点的。

（2）DataNode

DataNode是数据存储的最小单元，其内部除了保存了节点的数据内容、ACL列表、节点状态之外，还记录了父节点的引用和子节点列表两个属性，其也提供了对子节点列表进行操作的接口。

（3）ZKDatabase

zookeeper的内存数据库，管理zookeeper的所有会话、DataTree存储和事务日志。

ZKDatabase会定时向磁盘dump快照数据，同时在zookeeper启动时，会通过磁盘的事务日志和快照文件恢复成一个完整的内存数据库。 — 和NameNode工作机制类似。

5.2 事务日志

（1）文件存储

在配置Zookeeper集群时需要配置dataDir目录，用来存储事务日志文件。当前集群配置的文件名为zookeeper根目录下的 zkData，那么Zookeeper在运行过程中会在该目录下建立一个名字为version-2的子目录，该目录确定了当前Zookeeper使用的事务日志格式版本号，当下次某个Zookeeper版本对事务日志格式进行变更时，此目录也会变更，即在version-2子目录下会生成一系列文件大小一致(64MB)的文件。

对 zkData文件夹内容进行解读：

文件名	文件类型	作用
myid	文件	存放server的值，值唯一
version-2	文件夹	保存事务日志文件
zookeeper_server.pid	文件	zookeeper进程的端口号

（2）日志格式

启动zookeeper后，在zookeeper创建节点会在 /zkData/version-2/ 目录下生成一个日志文件 log 文件，该文件主要存储数据，是一个序列化文件，直接查看会乱码。

（3）日志写入

FileTxnLog负责维护事务日志对外的接口，包括事务日志的写入和读取等。Zookeeper的事务日志写入过程大体可以分为如下6个步骤。

确定是否有事务日志可写：当Zookeeper服务器启动完成需要进行第一次事务日志的写入，或是上一次事务日志写满时，都会处于与事务日志文件断开的状态，即Zookeeper服务器没有和任意一个日志文件相关联。因此在进行事务日志写入前，Zookeeper首先会判断FileTxnLog组件是否已经关联上一个可写的事务日志文件。若没有，则会使用该事务操作关联的ZXID作为后缀创建一个事务日志文件，同时构建事务日志的文件头信息，并立即写入这个事务日志文件中去，同时将该文件的文件流放入streamToFlush集合，该集合用来记录当前需要强制进行数据落盘的文件流。
确定事务日志文件是否需要扩容(预分配)：Zookeeper会采用磁盘空间预分配策略。当检测到当前事务日志文件剩余空间不足4096字节时，就会开始进行文件空间扩容，即在现有文件大小上，将文件增加65536KB(64MB)，然后使用"0"填充被扩容的文件空间。
事务序列化：对事务头和事务体的序列化，其中事务体又可分为会话创建事务、节点创建事务、节点删除事务、节点数据更新事务等。
生成Checksum：为保证日志文件的完整性和数据的准确性，Zookeeper在将事务日志写入文件前，会计算生成Checksum。
写入事务日志文件流：将序列化后的事务头、事务体和Checksum写入文件流中，此时并为写入到磁盘上。
事务日志刷入磁盘：由于步骤5中的缓存原因，无法实时地写入磁盘文件中，因此需要将缓存数据强制刷入磁盘。

（4）日志截断

在Zookeeper运行过程中，可能出现非Leader记录的事务ID比Leader上大，这是非法运行状态。此时，需要保证所有机器必须与该Leader的数据保持同步，即Leader会发送TRUNC命令给该机器，要求进行日志截断，Learner收到该命令后，就会删除所有包含或大于该事务ID的事务日志文件。

5.3 snapshot 数据快照

数据快照是Zookeeper数据存储中非常核心的运行机制，数据快照用来记录Zookeeper服务器上某一时刻的全量内存数据内容，并将其写入指定的磁盘文件中。

（1）文件存储

与事务文件类似，Zookeeper快照文件也可以指定特定磁盘目录，通过dataDir属性来配置。若指定dataDir为/home/admin/zkData/zk_data，则在运行过程中会在该目录下创建version-2的目录，该目录确定了当前Zookeeper使用的快照数据格式版本号。在Zookeeper运行时，会生成一系列文件。

（2）数据快照

FileSnap负责维护快照数据对外的接口，包括快照数据的写入和读取等，将内存数据库写入快照数据文件其实是一个序列化过程。针对客户端的每一次事务操作，Zookeeper都会将他们记录到事务日志中，同时也会将数据变更应用到内存数据库中，Zookeeper在进行若干次事务日志记录后，将内存数据库的全量数据Dump到本地文件中，这就是数据快照。其步骤如下

确定是否需要进行数据快照：每进行一次事务日志记录之后，Zookeeper都会检测当前是否需要进行数据快照，考虑到数据快照对于Zookeeper机器的影响，需要尽量避免Zookeeper集群中的所有机器在同一时刻进行数据快照。采用过半随机策略进行数据快照操作。
切换事务日志文件：表示当前的事务日志已经写满，需要重新创建一个新的事务日志。
创建数据快照异步线程：创建单独的异步线程来进行数据快照以避免影响Zookeeper主流程。
获取全量数据和会话信息：从ZKDatabase中获取到DataTree和会话信息。
生成快照数据文件名：Zookeeper根据当前已经提交的最大ZXID来生成数据快照文件名。
数据序列化：首先序列化文件头信息，然后再对会话信息和DataTree分别进行序列化，同时生成一个Checksum，一并写入快照数据文件中去。

六、 zookeeper 选举机制 — 进阶

具体请到：

公众号：大数据那些事链接：https://mp.weixin.qq.com/s/jhYEuZSOnGJDxznEEhxREg

选举执行源码概览：

zookeeper是分布式开发的基础，可以根据源码图详细看

你可能感兴趣的:(zookeeper,大数据,big,data,zookeeper)

WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Vue中table合并单元格用法 weixin_30613343 javascript ViewUI
地名结果人名性别{{item.name}}已完成未完成{{item.groups[0].name}}{{item.groups[0].sex}}{{item.groups[son].name}}{{item.groups[son].sex}}exportdefault{data(){return{list:[{name:'地名1',result:'1',groups:[{name:'张三',sex
uniapp map组件自定义markers标记点以对_ uni-app学习记录 uni-app javascript 前端
需求是根据后端返回数据在地图上显示标记点，并且根据数据状态控制标记点颜色，标记点背景通过两张图片实现控制{{item.options.labelName}}exportdefault{data(){return{storeIndex:0,locaInfo:{longitude:120.445172,latitude:36.111387},markers:[//标点列表{id:1,//标记点idin
放松的一天 4da9b7687fa0
20190325总结起床07:20图片发自App睡觉:23:00天气:晴今日任务清单学习·信息·阅读•水滴阅读Day40Alice’sAdventuresinWonderlandChapter6.2图片发自App•BBC跟读训练营Day24图片发自App图片发自App图片发自App•潘多拉口语训练营Day6Wow.Whatabigboy!•文化知识学习今日无•阅读时间地狱健康·饮食·锻炼•饮食目标
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
vue + Element UI table动态合并单元格我家媳妇儿萌哒哒 element UI vue.js 前端 javascript
一、功能需求1、根据名称相同的合并工作阶段和主要任务合并这两列，但主要任务内容一样，但要考虑主要任务一样，但工作阶段不一样的情况。（枞向合并）2、落实情况里的定量内容和定性内容值一样则合并。（横向合并）二、功能实现exportdefault{data(){return{tableData:[{name:'a',address:'1',age:'1',six:'2'},{name:'a',addre
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
使用datepicker和uploadify的冲突解决（IE双击才能打开附件上传对话框） zhanglb12
在开发的过程当中，IE的兼容无疑是我们的一块绊脚石，在我们使用的如期的datepicker插件和使用上传附件的uploadify插件的时候，两者就产生冲突，只要点击过时间的插件，uploadify上传框要双才能打开ie浏览器提示错误Missinginstancedataforthisdatepicker解决方案//if(.browser.msie&&'9.0'===.browser.version
golang获取用户输入的几种方式余生逆风飞翔 golang 开发语言后端
一、定义结构体typeUserInfostruct{Namestring`json:"name"`Ageint`json:"age"`Addstring`json:"add"`}typeReturnDatastruct{Messagestring`json:"message"`Statusstring`json:"status"`DataUserInfo`json:"data"`}二、get请求的
【Java】已解决：org.springframework.jdbc.datasource.lookup.DataSourceLookupFailureException 屿小夏 java 开发语言
文章目录一、分析问题背景问题背景描述出现问题的场景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：org.springframework.jdbc.datasource.lookup.DataSourceLookupFailureException在使用Spring框架进行开发时，数据源的配置和使用是非常关键的一环。然而，有时候我们可能会遇到org.springframewo
el-table实现全选整表，单元一页复选框功能周bro vue.js elementui javascript 前端
全选整表单选一页0":popper-append-to-body="false":total="tableData.length":page-size="pageObj.pagesize":page-sizes="[10,50,100]"layout="total,sizes,prev,pager,next"@size-change="handleSizeChange"@current-chang
Vue + Express实现一个表单提交九旬大爷的梦
最近在折腾一个cms系统，用的vue+express，但是就一个表单提交就弄了好久，记录一下。环境：Node10+前端：Vue服务端：Express依赖包：vueexpressaxiosexpress-formidableelement-ui（可选）前言：axiosget请求参数是：paramsaxiospost请求参数是：dataexpressget接受参数是req.queryexpresspo
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
Kubernetes部署MySQL数据持久化沫殇-MS Kubernetes MySQL数据库 kubernetes mysql 容器
一、安装配置NFS服务端1、安装nfs-kernel-server：sudoapt-yinstallnfs-kernel-server2、服务端创建共享目录#列出所有可用块设备的信息lsblk#格式化磁盘sudomkfs-text4/dev/sdb#创建一个目录：sudomkdir-p/data/nfs/mysql#更改目录权限：sudochown-Rnobody:nogroup/data/nfs
【Death Note】网吧战神之7天爆肝渗透测试死亡笔记_sqlmap在默认情况下除了使用 char() 函数防止出现单引号 2401_84561374 程序员笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！特殊服务端口2181zookeeper服务未授权访问
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
使用input[type=file]遇上的一些问题刘圣凯
项目遇到一个需要，如下image.png功能大致就是添加图片，展示出来，然后在用户点击提交的时候把图片传给后台，在和后台交涉之后，决定在用户选择图片之后转成formdata传给后台，后台返回一个url，提交的时候将url返回给后台/**转formdata*/varformdata=newFormData();formdata.append("file1",$("#pic")[0].files[0]
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

08-Hadoop之Zookeeper详解

Zookeeper入门

一、 zookeeper 概述

1.1 概述

1.2 特点

1.3 数据结构

1.4 应用场景

1.5 下载地址

二、 zookeeper 安装

2.1 本地模式安装部署

2.1.1 安装前准备

（1） 安装 JDK — Hadoop集群已配置

（2） 拷贝zookeeper安装包到Linux系统下

（3） 解压到指定目录

（4） 更改zookeeper目录名

2.1.2 配置更改

2.2 配置参数解读

三、 zookeeper 实战（开发重点）

3.1 分布式安装部署

3.1.1 集群规划

3.1.2 将 zookeeper 服务停掉

3.1.3 配置服务器编号

3.1.4 配置 zoo.cfg 文件

3.1.5 集群操作

（1） 手动启动集群

（2） 脚本群起

3.2 客户端命令行操作

3.3 API 应用

3.3.1 idea 环境搭建

（1） 创建 Maven 工程

（2） 添加 pom 文件

（3） 创建 log4j.properties

3.3.2 zookeeper客户端操作

（1） API使用

（2） 监听服务器节点动态上下线案例

四、 zookeeper 内部原理

4.1 节点类型

4.2 stat 结构体

4.3 监听器原理 （面试重点）

4.4 paxos 算法 （了解）

4.5 选举机制 （面试重点）

4.5.1 前言

4.5.2 选举过程

a. 第一次启动zookeeper

b. 非第一次启动zookeeper

4.6 写数据流程

五、 zookeeper的数据存储

5.1 内存数据

（1）DataTree

（2）DataNode

（3）ZKDatabase

5.2 事务日志

（1） 文件存储

（2） 日志格式

（3） 日志写入

（4） 日志截断

5.3 snapshot 数据快照

（1）文件存储

（2）数据快照

六、 zookeeper 选举机制 — 进阶

你可能感兴趣的:(zookeeper,大数据,big,data,zookeeper)

（1）安装 JDK — Hadoop集群已配置

（2）拷贝zookeeper安装包到Linux系统下

（3）解压到指定目录

（4）更改zookeeper目录名

（1）手动启动集群

（2）脚本群起

（1）创建 Maven 工程

（2）添加 pom 文件

（3）创建 `log4j.properties`

（2）监听服务器节点动态上下线案例

4.3 监听器原理（面试重点）

4.4 paxos 算法（了解）

4.5 选举机制（面试重点）

（1）文件存储

（2）日志格式

（3）日志写入

（4）日志截断