程序员胖五

【大数据之路3】分布式协调系统 Zookeeper

3. 分布式协调系统 Zookeeper

- 1. Zookeeper 概述
- - 1. Zookeeper 介绍
  - 2. Zookeeper 结构/功能【重点】
  - - 1. 文件系统 ZNode
    - - 1. ZNode 特点
      - 2. ZNode 功能
      - 3. ZNode 介绍【非常重要】
    - 2. 监听机制
  - 3. 典型应用场景
  - - 1. 命名服务
    - 2. 配置管理
    - 3. 集群管理
    - 4. 分布式锁
    - 5. 队列管理
- 2. 架构与原理
- - 1. Zookeeper 架构
  - - 1. 架构概述
    - 2. 主从架构
    - 3. 集群角色描述
  - 2. 集群选主【非常重要】
  - - 1. 全新的集群选主
    - 2. 非全新集群选主
  - 3. 数据同步
  - 4. 功能/工作流程
  - - 1. Leader 功能
    - 2. Follower 功能
    - 3. ObServer 工作流程
    - 4. Zookeeper 工作流程
  - 5. 配置文件 zoo.cfg 详解
- 3. Zookeeper 相关操作
- - 1. 命令行操作
  - 2. API 操作

1. Zookeeper 概述

1. Zookeeper 介绍

Zookeeper 是一个开放源码的分布式应用程序协调服务，是 Google 的 Chubby（分布式锁）一个开源的实现。它提供了简单原始的功能（ZNode 和监听机制），分布式应用可以基于它实现更高级的服务，比如 分布式同步、配置管理、集群管理、命名管理、队列管理。它被设计为易于编程，使用 文件系统目录树作为数据模型。服务端运行在 Java 上，提供 Java 和 C 客户端 API。

Zookeeper 是集群的管理者，监视着集群中各节点的状态，根据节点的反馈进行下一步合理的操作，最终将简单易用的接口和功能稳定、性能高效的系统提供给用户。

Zookeeper 的数据模型是树结构，在内存数据库中，存储了整棵树的内容，包括所有的节点路径、节点数据、ACL 信息，zk 会定时将这些数据存储到磁盘上。

Zookeeper 作用：解决分布式集群中的业务协调问题

Zookeeper 设计目的： Zookeeper 作为一个集群提供数据一致的协调服务，最好的方式就是在整个集群中的各服务节点进行数据的复制和同步

数据复制的好处：

容错：一个节点出错，不至于让整个集群无法提供服务
扩展性：通过增加服务器节点能提高 Zookeeper 系统的负载能力，把负载分布到多个节点上
高性能：客户端可访问本地 Zookeeper 节点或访问就近的节点，以此提高用户的访问速度

Zookeeper 的特点：

最终一致性：Client 无论连接到哪个 Server，展示给它的都是同一个视图【Zookeeper 最重要的性能】
可靠性：具有简单、健壮、良好的性能。如果消息m 被一台服务器接受，那它将被所有的服务器接受
实时性：Zookeeper 保证客户端将在一个时间间隔内获得服务器更新或失效的信息。但由于网络延迟等原因，Zookeeper 不能保证两个客户端能同时得到刚更新的数据，如果需要最新数据，应该在读数据之前调用 sync() 接口进行同步
等待无关（wait-free）：慢的或失效的 Client 不得干预快速的 Client 的请求，使得每个 Client 都能有效的等待
原子性：更新只能成功或失败，没有中间状态
顺序性：包括全局有序和偏序两种。全局有序指如果在一台服务器上消息a 在消息b 之前发布，则在所有 Server 上消息a 都将在消息b 之前发布；偏序指如果消息b 在消息a 之后被同一个发布者发布，a 必将排在 b 后面

2. Zookeeper 结构/功能【重点】

1. 文件系统 ZNode

ZNode（Zookeeper Node）：Zookeeper 的文件系统。Zookeeper 的命令空间就是 Zookeeper 的文件系统

1. ZNode 特点

跟 Linux 类似，也是树状，每一个节点都有一个唯一的绝对路径，对于命名空间的操作必须都是绝对路径的操作
与 Linux 文件系统不同的是 Linux 文件系统有目录和文件的区别，而 Zookeeper 统一叫做 ZNode，一个 ZNode 节点可以包含子 ZNode，同时也可以包含数据

2. ZNode 功能

（1）存储数据。ZNode 既是文件夹又是文件，每个 ZNode 有唯一的路径表示。Zookeeper 的每个 ZNode 不能存储大批量的数据，只能存储小批量的关键性的数据（数据格式可看成 key-value 形式：key 是节点的绝对路径，value 是当前 ZNode 节点的值。数据不能超过 1M，最好小于 1KB）

（2）挂载子节点。既可以当文件夹包含文件，又可以当文件存储数据

3. ZNode 介绍【非常重要】

ZNode 分类：

（1）ZNode 分两类：（不管是什么节点，都要有一个特定的 session 会话连接创建）

持久节点 persistent（默认）：可以有子节点
临时节点 ephemeral：不能有子节点

（2）ZNode 分四类：

持久节点 persistent
- 带有顺序编号的持久节点
  - 举例：create -s /hadoop "hello" 表示在节点里创建名字叫做 /hadoop_01 带有顺序编号的节点并赋予其值为 hello，可重复创建，名字按顺序递增
- 不带顺序编号的持久节点
  - 举例：create /hadoop "hello" 表示在根目录下创建 hadoop 节点并赋予其值为 hello，创建相同的节点会失败
临时节点 ephemeral
- 带顺序编号的临时节点
- 不带顺序编号的临时节点

说明：

创建 ZNode 时设置顺序标识，ZNode 名称后会增加一个值，顺序号是一个单调递增的计数器，由父节点维护
在分布式系统中，顺序号可以被用于为所有的事件进行全局排序，这样客户端可以通过顺序号推断事件的顺序
客户端可以在 ZNode 上设置监听器

2. 监听机制

概念： 客户端注册监听它关心的目录节点，当目录节点发生变化（数据改变、节点删除、子目录节点增加删除）时，Zookeeper 会通知客户端。监听机制保证 Zookeeper 保存的任何数据的任何改变，都能快速的响应到监听了该节点的应用程序

监听器的工作机制/本质： 在客户端会专门建立一个监听机制，在本机的一个端口上等待 zk 集群发送事件过来

Zookeeper 的 Watcher（监听器）机制主要包括： 客户端线程、客户端 WatcherManager、Zookeeper 服务器

监听步骤： 客户端在向 Zookeeper 服务器注册的同时，会将 Watcher 对象（监听机制）存储在客户端的 WatcherManager（监听机制管理器）中。当 Zookeeper 服务器触发 Watcher 事件后，会向客户端发送通知，客户端线程从 WatcherManager 中取出对应的 Watcher 对象来执行回调逻辑。

步骤总结：

拿链接，注册监听
Zookeeper 系统等待该节点的事件
Client 接收到事件通知后，会自动调用 回调代码
- 回调代码：提前写好节点数据发生变化和节点被删除后对应的业务逻辑代码，当数据发生改变或节点被删除时会自动调用相应代码，从而根据事件类型调用相应的业务逻辑

监听机制流程图：

如果监听的节点发生变化，客户端会收到相应通知，监听的线程就不存在了。客户端的监听进程被触发一次后，再有事件触发客户端就接收不到了，此时可以在回调的方法里再次调用处理的方法，相当于做了循环监听。

3. 典型应用场景

1. 命名服务

命名空间 namespace。被命名的实体通常可以是集群中的机器、提供的服务地址或远程对象等，通过命名服务，客户端可以根据指定名字获取资源的实体、服务地址和提供者的信息。

2. 配置管理

程序配置部署在多台服务器上，这些配置放到 Zookeeper 上，保存在某个目录节点上，然后所有相关应用程序对这个目录节点进行监听，一旦配置信息发生变化，每个应用程序就会收到 Zookeeper 的通知，然后从 Zookeeper 获取新的配置信息应用到系统中即可。

3. 集群管理

管理主节点和从节点
是否有机器退出或加入
选举 Leader

4. 分布式锁

写锁（独占锁和排他锁）：对写加锁，保持独占，别人无法访问
读锁（共享锁）：对读加锁，可共享访问，释放锁后才能进行事务操作
时序锁：控制时序

5. 队列管理

同步队列：当一个队列的成员都聚集时该队列才能用，否则一直等待聚集
先进先出队列：队列按照 FIFO 方式进行入队和出队操作
- FIFO（first in, first out）：先进先出
- LIFO（last in, first out）：后进先出

2. 架构与原理

1. Zookeeper 架构

HDFS 是主从架构，Zookeeper 也是主从架构，但 HDFS 主节点固定，Zookeeper 主节点不固定，任何一个节点都可以成为 Leader。

1. 架构概述

（1）首先要有一个算法

（2）原来的主节点宕机后，集群要能够立刻选举出一个新的主节点

Zookeeper 集群中的任意两个节点的状态都一模一样
Zookeeper 能够对外提供服务的最低要求：宕机节点的个数不超过一半【重要】
Zookeeper 集群的生存能力取决于服务器节点的个数。数量一般在 20 个节点之内，官方配置文件在 256 个之内

2. 主从架构

所有 Zookeeper 节点中都保存了一份完整的 ZNode 系统的数据。这样才能做到无缝链接，才能保证所有的客户端无论连接到 Zookeeper 的哪台服务器，都能读到 ZNode 系统中的最新数据。

ZAB 原子广播协议： 处理 写数据 请求。确保每台机器能获取到最新数据进行写入，用户获取到的都是最新数据

主节点接收到会直接进行广播，让所有节点都写入最新数据
从节点接收到写数据请求，会转发这条请求给主节点，主节点进行写数据操作，然后广播给其他所有节点进行同步
若没有接收到新的数据，则该节点无法对外提供服务

主节点控制 Zookeeper 系统的全局事务（事务编号 zxid 全局递增）

说明：

每个从节点都有一条线连接着主节点，当从节点接收到写数据请求，会通过这条线转发给主节点
当从节点接收到读数据请求就不需要转发，直接将数据返回给客户端

3. 集群角色描述

Zookeeper 集群的节点个数，一般都是奇数。

2. 集群选主【非常重要】

1. 全新的集群选主

每个节点里有对应的 serverid，是一个 1~255 的数值（ 0 也可以，实际一共 256个），不能重复

选举规则：谁的 serverid 大谁胜出。 但在启动过程中节点超过半数，Leader 就被选出来了，后续的 serverid 再大也只能是 Follower。

Zookeeper 集群的 Leader 选举实例：

3 个节点 Hadoop0、Hadoop1、Hadoop2，myid 依次为0、1、2，启动顺序为 Hadoop0、Hadoop1、Hadoop2，则 Hadoop1 是 Leader
原因：集群有 3 个节点，启动 Hadoop0 和 Hadoop1 后节点数过半，集群可正常运行。Hadoop1 的 myid 大，为 Leader；当 Hadoop2 加入后，因为有了 Leader 了就不会因为 Hadoop2 的 myid 大 Hadoop1 就让位，Hadoop2 只能做从节点；等 Hadoop1 故障宕机后，Hadoop2 才能以自己的 myid 大而胜出上位 Leader

Zookeeper Server 的三种工作状态：

LOOKING： 当前 Server 不知道 Leader 是谁，正在搜寻，正在选举
LEADING： 当前 Server 即为选举出来的 Leader，负责协调事务
FOLLOWING： Leader 已经选举出来，当前 Server 与之同步，服从 Leader 命令

2. 非全新集群选主

当 Zookeeper 集群运行一段时间后有机器宕机，重新进行选举时，选举过程相对复杂

因素：

version（数据版本）：数据每次更新都会更新 version，数据新的 version 大
serverid（服务id）：myid 中的值，每个机器一个
逻辑时钟：该值从 0 开始递增，每次选举对应一个值，即在每次选举中该值是一致的。逻辑时钟值越大说明这次选举 Leader 的进程越新，也就是每次选举拥有一个 zxid，投票结果只取 zxid 最新的

选举标准：

逻辑时钟小的选举结果被忽略，重新投票
统一逻辑时钟后，数据 version 大的胜出
数据 version 相同时，serverid 大的胜出

3. 数据同步

选完 Leader 后，Zookeeper 就进入 状态同步 过程：

Leader 等待 Follower 连接
Follower 连接 Leader，将最大的 zxid（事务编号）发送给 Leader
Leader 根据 Follower 的 zxid 确认同步点
完成同步后通知 Follower 已经成为 uptodate 状态
Follower 收到 uptodate 消息后，又可以重新接收 Client 的请求进行服务了

流程图：

4. 功能/工作流程

1. Leader 功能

1、恢复数据

2、维持与 Learner 的心跳，接收 Learner 请求并判断 Learner 的请求消息类型

Leader 与 Follower 之间数据传输类型，数据 packet 中都会包含一个特定的类型用来告知对方如何处理数据，这些类型为常量值，在 Leader 类中。消息类型主要是：
- PING 消息：Learner 的心跳信息
- REQUEST 消息：Follower 发送的提议信息，包括读写请求
- ACK 消息：Follower 对提议的回复，超过半数 Follower 通过则 commit 该提议
- REVALIDATE 消息（重新验证）：用来延长 session 有效时间

3、根据不同的消息类型进行不同的处理

2. Follower 功能

1、向 Leader 发送请求（PING 消息、REQUEST 消息、ACK 消息、REVALIDATE 消息[重新验证消息]）

2、接收 Leader 消息并进行处理

3、接收 Client 的请求，如果是写请求则转发给 Leader

4、返回 Client 结果

Follower 的消息循环，处理如下几种来自 Leader 的消息：

PING 消息：心跳信息
PROPOSAL 消息：Leader 发起的提案，要求 Follower 投票
COMMIT 消息：服务器端最新一次提案的信息
UPTODATE：表明同步完成
REVALIDATE：根据 Leader 的 REVALIDATE 结果，关闭待 revalidate 的 session 允许其接收消息
SYNC 消息：返回 sync 结果到客户端，这个消息最初由客户端发起，用来强制得到最新的更新

3. ObServer 工作流程

ObServer 流程和 Follower 的唯一不同之处是 ObServer 不会参加 Leader 发起的投票，也不会被选举成为 Leader

4. Zookeeper 工作流程

场景一：Client 将写数据请求发到了 Follower

首先 Client 向 Follower 发出一个写数据的请求
Follower 会把该请求转发给 Leader
Leader 接收到以后开始发起投票并通知 Follower 进行投票
Follower 把投票结果发给 Leader
Leader 把结果汇总后，如果需要写入则开始写入，同时把写入操作通知给 Follower，然后 commit
当 Follower 中有半数以上写入完成，Leader 会通知 Follower 写入完成，Follower 会响应客户端数据写入完成

场景二：Client 将写数据请求直接发到了 Leader

Leader 会先将数据写入自身，同时通知其他 Follower 写入
当 Follower 中有半数以上响应写入完成，Leader 就会告诉客户端数据写入完成，提前响应了客户端

综合来说：Leader 主要是发起投票决议、更新系统状态；Follower 主要是转发请求、参与投票、返回投票结果。

5. 配置文件 zoo.cfg 详解

tickTime：基本事件单元，以毫秒为单位。这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每隔 tickTime 时间就会发送一个心跳
dataDir：存储内存中数据库快照的位置，顾名思义就是 Zookeeper 保存数据的目录，默认情况下，Zookeeper 将写数据的日志文件也保存在这个目录里
clientPort：这个端口就是客户端连接 Zookeeper 服务器的端口，Zookeeper 会监听这个端口，接受客户端的访问请求
initLimit：这个配置项是用来配置 Zookeeper 接受客户端初始化连接时最长能忍受多少个心跳时间间隔数，当已经超过 10 个心跳的时间（也就是 tickTime）长度后 Zookeeper 服务器还没有收到客户端的返回信息，那么表明这个客户端连接失败。总的时间长度就是 10 * 2000 = 20 秒
syncLimit：这个配置项标识 Leader 与 Follower 之间发送消息，请求和应答时间长度，最长不能超过多少个 tickTime 的时间长度，总的时间长度就是 5 * 2000 = 10 秒
server.A = B:C:D :
- A 表示这个是第几号服务器
- B 是这个服务器的 ip 地址
- C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口
- D 表示的是万一集群中的 Leader 服务器挂了，需要一个端口来重新进行选举，选出一个新的 Leader

3. Zookeeper 相关操作

1. 命令行操作

进入 zk 客户端

bin/zkCli.sh
# 进入别的机器的zk程序中
zkCli.sh -server hadoop1:2181

查看 ZNode 子节点内容

ls /
ls /Zookeeper

创建 ZNode 节点

create /zk "myData"

获取 ZNode 数据

get /Zookeeper
get /Zookeeper/node1

设置 ZNode 数据

set /zk "myData1"

监听 ZNode 事件

ls /Zookeeper watch		# 就对一个节点的子节点变化事件注册了监听
get /Zookeeper watch	# 就对一个节点的数据内容变化事件注册了监听

创建临时 ZNode 节点

create -e /zk "myData"

创建顺序 ZNode 节点

create -s /zk "myData"

删除 ZNode 节点

delete /zk	# 只能删除没有子ZNode的ZNode
rmr /zk			# 不管里边有多少ZNode，统统删除

2. API 操作

创建一个 ZNode，其路径为 path，data 是存储在该 ZNode 上的数据，级别常用的有：

PERSISTENT（持久）
PERSISTENT_SEQUENTAIL
EPHEMERAL（短暂）
EPHEMERAL_SEQUENTAIL

删除一个 ZNode，可通过 version 删除指定的版本，如果 version 是 -1，表示删除所有的版本：

delete(path, verison):

判断指定的 ZNode 是否存在，并设置是否 watch 这个 ZNode。如果要设置 watch，watcher 是在创建 Zookeeper 实例时指定的，如果要设置特定的 watch，可调用另一个重载版本的：

exists(path, watcher):

以下几个带 watch 参数的 API 也都类似：

# 读取指定ZNode上的数据，并设置是否watch这个ZNode
getData(path, watch):

# 更新指定ZNode的数据，并设置是否watch这个ZNode
setData(path, watch):

# 获取指定ZNode的所有子ZNode的名字，并设置是否watch这个ZNode
getChildren(path, watch):

把所有在 sync 之前的更新操作都进行同步，达到每个请求都在半数以上的 Zookeeoer Server 上生效：

sync(path):		# path参数目前没有用

设置指定 ZNode 的 Acl 信息：

setAcl(path, acl):

获取指定 ZNode 的 Acl 信息：

getAcl(path):

实现分布式锁
在黑马点评项目中，在实现分布式锁的时候提到了实现的几种方式，本文来简单了解一下。一、MySQL、Redis、ZooKeeper是不是都是“数据库”？严格来说，三者的定位和功能差异很大，但广义上都可以视为“数据存储系统”，不过它们的核心设计目标和适用场景完全不同。我们可以从“数据模型”和“核心用途”两个维度区分：类型MySQLRedisZooKeeper核心定位关系型数据库（OLTP，事务型存储）内
Zabbix 企业级分布式监控部署伤不起bb zabbix 分布式
目录一、监控系统基础认知1.为什么需要监控？2.监控的5个层次（从底层到上层）3.监控系统的基本原理二、Zabbix系统详解1.Zabbix是什么？2.Zabbix核心功能3.Zabbix核心组件三、Zabbix部署实战（分布式架构）1.环境准备（4台服务器）2.部署ZabbixServer（核心步骤）步骤1：添加Zabbix源并安装依赖步骤2：配置数据库步骤3：导入Zabbix初始数据步骤4：配
部署Zabbix企业级分布式监控 YUNYINGXIA Zabbix
目录一、监控系统概述1.1监控的重要性1.2监控类型1.3监控层次划分二、监控系统的实现原理2.1模块组成2.2采集协议2.3监控模式2.4代理架构三、监控系统的开源产品四、Zabbix系统概述4.1初识zabbix4.2Zabbix的功能特性4.3Zabbix角色及架构五、部署流程5.1资源清单5.2基础环境配置5.3部署zabbixserver5.4zabbix页面配置5.5部署proxy5.
深入解析Hadoop中的Region分裂与合并机制码字的字节 hadoop布道师 hadoop 大数据分布式 Region 分裂合并
Hadoop与Region的基本概念Hadoop的分布式架构基础作为大数据处理的核心框架，Hadoop通过分布式存储和计算解决了海量数据的处理难题。其架构核心由HDFS（HadoopDistributedFileSystem）和MapReduce组成，前者负责数据的分布式存储，后者实现分布式计算。在HDFS中，数据被分割成固定大小的块（默认128MB）分散存储在集群节点上，而MapReduce则通
深入解析Hadoop RPC：技术细节与推广应用码字的字节 hadoop布道师 Hadoop RPC
HadoopRPC框架概述在分布式系统的核心架构中，远程过程调用（RPC）机制如同神经网络般连接着各个计算节点。Hadoop作为大数据处理的基石，其自主研发的RPC框架不仅支撑着内部组件的协同运作，更以独特的工程哲学诠释了分布式通信的本质。透明性：隐形的通信桥梁HadoopRPC最显著的特征是其对通信细节的完美封装。当NameNode接收DataNode的心跳检测，或ResourceManager
深入解析Hadoop：大数据处理的基石学习的锅 hadoop 大数据分布式
随着信息技术的快速发展和互联网的普及，数据的产生速度极具增加。面对如此海量的数据，传统的数据处理工具显得力不从心。在这种背景下，诞生了一系列用于处理大数据的框架与工具，而ApacheHadoop便是其中最为知名和应用最广泛的一个。本文将深入解析Hadoop的基本原理、架构及其在大数据处理中的重要性。1.Hadoop的起源与发展Hadoop起源于Google公司的三篇奠基性论文：GoogleFile
鸿蒙分布式数据同步全解析：用一套代码搞定多设备实时共享前端世界 harmonyos harmonyos 分布式华为
摘要在万物互联的趋势下，多设备间的数据协同成了刚需。从手机到平板、手表、电视，再到智能车载系统，用户希望数据无缝同步、实时一致。鸿蒙系统通过分布式数据库与分布式消息总线，为开发者提供了一套跨设备的数据同步机制，简化了开发流程。本文将从实际开发角度出发，带你用最简单的方式了解如何实现跨设备的数据同步。引言过去，我们经常需要自己去写Socket通信、同步逻辑、数据一致性校验，整个过程又难又容易出错。而
大数据技术关键技术组件
大数据技术是一组用于处理、分析和管理大规模数据集的复杂方法和技术。这些数据集的特点是容量大、增长速度快，且结构多样化，包括结构化、半结构化和非结构化数据。传统数据库管理和分析工具在处理此类数据时效率低下或无法胜任，因此需要专门的大数据技术栈来支持高效的数据处理和智能决策。大数据技术的关键组件通常包括：分布式存储系统：HadoopDistributedFileSystem(HDFS)：一个高度可扩展
操作系统视角下鸿蒙应用多语言的多媒体处理实践操作系统内核探秘操作系统内核揭秘 OS harmonyos wpf 华为 ai
操作系统视角下鸿蒙应用多语言的多媒体处理实践关键词：鸿蒙操作系统、多语言支持、多媒体处理、分布式架构、应用开发实践摘要：本文从鸿蒙操作系统的底层设计出发，结合多语言适配与多媒体处理两大核心场景，通过“系统能力-应用开发-用户体验”的全链路分析，揭示鸿蒙如何通过分布式架构、统一资源管理和多端协同特性，简化开发者在多语言多媒体应用中的开发复杂度。文章包含原理讲解、代码示例和实战案例，帮助开发者快速掌握
大数据领域HDFS的集群资源管理优化大数据洞察大数据与AI人工智能大数据AI应用大数据 hdfs hadoop ai
大数据领域HDFS的集群资源管理优化关键词：HDFS；集群资源管理；存储优化；性能调优；副本策略；负载均衡；NameNode优化摘要：HDFS（Hadoop分布式文件系统）作为大数据领域的基石，承载着海量数据的存储与管理重任。随着数据规模爆炸式增长和业务复杂度提升，HDFS集群的资源管理面临着"存不下、跑不快、管不好"的三重挑战：存储资源浪费与不足并存、计算与存储资源匹配失衡、集群运维效率低下。本
深入探索Hadoop技术：全面学习指南
引言在大数据时代，高效地存储、处理和分析海量数据已成为企业决策与创新的关键驱动力。Hadoop，作为开源的大数据处理框架，以其强大的分布式存储和并行计算能力，以及丰富的生态系统，为企业提供了应对大规模数据挑战的有效解决方案。本文旨在为初学者和进阶者提供一份详尽的Hadoop技术学习指南，涵盖HDFS、MapReduce、YARN等核心组件，以及Hive、Pig、HBase等生态系统工具，助您踏上H
防不胜防!第六届研究所老姜（姜新宁）算力3.0亏损被骗曝光,巨额损失真相令人胆寒心惊！大盛律道
数字经济十选五投资诈骗套路频出，投资者股民的“钱袋子”多有损失，以投资理财获取大数据数字经济投资算法为由，将投资者的积蓄收入囊中，成为不法分子常用的诈骗手段之一。为守护好投资者的“钱袋子”，小编持续开展曝光数字经济诈骗行动，维护“投资者”合法权益。近年来，股市波动不断，投资者们无不渴望找到稳健的投资途径。而一些不法分子趁机利用第六届研究所荐股群的手段，设下重重陷阱，致使投资者损失惨重。骗子冒充姜新
Spring Cloud LoadBalancer 详解大手你不懂 spring Java Java项目实战 spring cloud spring 后端
在分布式系统快速发展的当下，服务间的调用日益频繁且复杂。如何合理分配请求流量，避免单个服务节点过载，保障系统的稳定性与高效性，成为关键问题。负载均衡技术便是解决这一问题的重要手段。SpringCloudLoadBalancer作为SpringCloud官方推出的负载均衡器，在微服务架构中发挥着至关重要的作用。本文将对其进行详细解析。一、SpringCloudLoadBalancer基本概念Spri
MySQL分布式架构深度实践：从分库分表到云原生集成软考和人工智能学堂 PHP和MySQL MySQL经验与技巧 wpf
1.分布式MySQL架构全景graphTDA[分布式MySQL体系]-->B[数据分片策略]A-->C[分布式事务处理]A-->D[读写分离扩展]A-->E[高可用架构]A-->F[云原生集成]B-->B1(水平分库分表)B-->B2(垂直分库分表)B-->B3(分片路由策略)B-->B4(全局ID方案)C-->C1(XA协议)C-->C2(TCC模式)C-->C3(SAGA模式)C-->C4(本
分布式之agent daisylym 人工智能 integer class string null import action
Agent的简单运用，实现卖旗子代理。这个代码实现的要求如下，这个做了很久了，突然想到，才整理出来贴出来。没法翻译，将就着看吧，看英文多了，其实觉得还不错啦。Thereisabuyerwhowantstobuyaspecificflagfromoneortwoselleragentswhoaretryingtoofferthebest(lowest)price.Youaretomodelthiss
python分布式事务_分布式事务系列（2.1）分布式事务的概念
#1系列目录#2X/OpenDTPDTP全称是DistributedTransactionProcess，即分布式事务模型。之前我们接触的事务都是针对单个数据库的操作，如果涉及多个数据库的操作，还想保证原子性，这就需要使用分布式事务了。而X/OpenDTP就是一种分布式事务处理模型。##2.1X/OpenDTP模型X/Open是一个组织，维基百科上这样说明：X/Open是1984年由多个公司联合创
如何构建高效的向量数据库以优化大模型检索能力学习ing1 数据库
1.构建向量数据库的基础架构1.1确定数据存储需求构建高效的向量数据库以优化大模型检索能力，首先要明确数据存储需求。大模型通常涉及海量的参数和数据，例如一个拥有10亿参数的模型，其存储需求可能达到数百GB。根据数据的规模和类型，需要确定存储的容量、速度和可靠性。对于大规模数据，分布式存储是常见的选择，它可以将数据分散存储在多个节点上，提高存储效率和数据访问速度。同时，数据的读写频率也是重要因素，高
三层架构 vs SOA vs 微服务：该选谁？ Echo_Wish 架构运维实战：高可用与高性能架构微服务云原生
三层架构vsSOAvs微服务：该选谁？一、从单体到分布式：架构演进的必然性最早的系统架构通常是单体架构（MonolithicArchitecture），所有功能都打包在一个应用里，部署方便，但扩展性和灵活性有限。后来，为了让系统更具可维护性，三层架构成为主流。但当业务变得复杂，单纯的三层架构不再够用，SOA应运而生，再到后来的微服务，都是在解决“架构如何更灵活、可扩展、好维护”这个核心问题。那么，
微软CEO Satya Nadella提出AI重构法则：从范式跃迁到社会盈余 TGITCIC AI-大模型的落地之道 AI大模型大模型AI AI Agent AI智能体 AI落地大模型落地
1.范式跃迁：AI作为第四次技术革命的核心驱动力1.1技术代际的复合效应从客户端到互联网、移动互联网再到云计算，技术平台的演进始终遵循“平台变革→产品跃迁→反哺平台”的螺旋上升逻辑。AI的特殊性在于其叠加了前三代技术的基础设施能力：云计算：提供百亿级参数模型的分布式训练能力互联网：构建全球数据流动与反馈闭环移动终端：扩展AI服务的触达边界技术范式核心特征代表产品对AI的支撑作用客户端本地化计算Wi
大数据领域 Kafka 入门指南：从安装到基础使用大数据洞察大数据与AI人工智能大数据 kafka linq ai
大数据领域Kafka入门指南：从安装到基础使用关键词：Kafka、消息队列、分布式系统、大数据处理、实时数据流、生产者消费者模型、ZooKeeper摘要：本文是一篇全面介绍ApacheKafka的入门指南，从基本概念到实际应用。我们将详细讲解Kafka的核心架构、工作原理，并提供从安装配置到基础使用的完整实践指导。文章包含Kafka的生产者-消费者模型实现、集群部署策略、性能优化技巧，以及在大数据
创建型模式大曰编程 java面试分布式设计模式
创建型模式是设计模式的核心分支，专注于对象创建机制的优化，通过封装对象实例化过程，提升系统的灵活性与可扩展性。在分布式系统中，由于多节点协作、网络通信延迟、状态一致性等特性，传统单体环境下的创建型模式需进行适应性演化。本文从分布式场景出发，系统解析单例、工厂方法、抽象工厂、建造者、原型五大创建型模式的核心原理、分布式变种及实战应用。一、单例模式：分布式环境下的唯一性保障1.1单体与分布式单例的本质
为什么阿里巴巴Java开发手册禁止使用存储过程？需要重新演唱 SQL java java 开发语言
阿里巴巴Java开发手册中禁止使用存储过程的原因主要基于以下几个方面的考虑：1.可维护性差复杂性：存储过程通常包含复杂的逻辑，随着业务逻辑的增加，存储过程的复杂性也会不断增加，导致维护成本高。调试困难：存储过程的调试通常比应用程序代码更困难，尤其是在分布式系统和微服务架构中。版本控制：存储过程的版本控制和变更管理相对复杂，难以与应用程序的版本控制流程集成。2.可移植性差数据库依赖：存储过程的语法和
python如何抓取网页里面的文字_如何利用python抓取网页文字、图片内容？ weixin_39917437
想必新老python学习者，对爬虫这一概念并不陌生，在如今大数据时代，很多场景都需要利用爬虫去爬取数据，而这刚好时python领域，如何实现？怎么做？一起来看下吧~获取图片：1、当我们浏览这个网站时，会发现，每一个页面的URL都是以网站的域名+page+页数组成，这样我们就可以逐一的访问该网站的网页了。2、当我们看图片列表时中，把鼠标放到图片，右击检查，我们发现，图片的内容由ul包裹的li组成，箭
Redis中什么是看门狗机制 sevevty-seven redis
在Redis中，“看门狗机制”（WatchdogMechanism）不是Redis的核心机制之一，但它在一些场景中起到了重要作用，尤其是在使用Redlock分布式锁实现或在RedisEnterprise等高级用法中。一、看门狗机制的通用含义看门狗机制，本质上是一个自动续约或自动重置超时时间的机制，用于防止某些资源（如锁）在没有显式释放的情况下过早失效。二、在Redis中的典型应用场景1.Redis
HDFS文件系统
HDFS文件系统是hadoop生态系统的核心，主要用于分布式文件存储，它具备高可用，流式读取，文件结构简单，跨平台的特点，它的集群采用的是主从结构，分为命名节点和数据节点，命名节点主要用于元数据管理（例如对目录，文件的创建，数据块与数据节点的关系维护管理）及数据节点管理（例如数据节点之间数据的复制，节点状态的维护，节点间数据的均衡），该文件系统最基本的存储单位是block即数据块，默认大小是64M
Redis面试精讲 Day 4：Redis事务与原子性保证在未来等你 Redis面试专栏 Redis 面试数据库缓存
【Redis面试精讲Day4】Redis事务与原子性保证开篇欢迎来到"Redis面试精讲"系列的第4天！今天我们将深入探讨Redis的事务机制与原子性保证，这是Redis面试中出现频率极高的核心知识点。掌握Redis事务不仅能帮助你在面试中脱颖而出，更能让你在实际开发中合理利用事务特性构建可靠的分布式系统。在面试中，面试官通常会通过以下方式考察候选人对Redis事务的理解：解释Redis事务的基本
Flink-Hadoop实战项目 Dylan_muc hadoop hdfs flink
项目说明文档1.项目概述1.1项目简介本项目是一个基于ApacheFlink的大数据流处理平台，专门用于处理铁路系统的票务和车次信息数据。系统包含两个核心流处理作业：文件处理作业和数据合并作业，采用定时调度机制，支持Kerberos安全认证，实现从文件读取到数据仓库存储的完整数据处理链路。1.2技术栈流处理引擎:ApacheFlink1.18.1存储系统:HDFS(Hadoop分布式文件系统)数据
飞算科技：以原创技术为翼，赋能产业数字化转型
在数字经济浪潮席卷全球的当下，一批专注于技术创新的中国企业正加速崛起，飞算数智科技（深圳）有限公司（简称“飞算科技”）便是其中的佼佼者。作为一家国家级高新技术企业，飞算科技以自主创新为核心驱动力，凭借互联网科技、大数据、人工智能等前沿技术，为各行业客户插上数字化转型的翅膀。飞算科技的定位清晰而坚定——自主创新型数字科技公司。这一定位不仅体现在其技术研发的方向上，更融入到为客户服务的每一个环节。无论
2018-03-19新零售是未来的商业模式吗？马云对新零售到底什么看法? 拼自己想要的梦想
马云对新零售到底什么不雅观不雅观点?其实，在此之前，新零售一词就已经在业界出现过，而马云此次的提出，使其作为一个正式的名词传布开来。马云认为互联网时代，传统零售行业受到了电商互联网的打击。将来，线下与线上零售将深度连系，再加当代物流，办事商把持大数据、云计较等立异手艺，构成将来新零售的概念。纯电商的时代很快将竣事，纯零售的情势也将被冲破，新零售将引领将来全新的商业形式。新零售是从哪里来的?新零售是
云原生周刊：K8s 中的后量子密码学 KubeSphere 云原生云原生 kubernetes 密码学
开源项目推荐KanisterKanister是一个由CNCF托管的开源框架，最初由VeeamKasten团队创建，旨在简化Kubernetes上的应用程序级别数据操作管理。它通过定义Blueprint、ActionSet和Profile等CRD（自定义资源）及其相关组件，为专家提供一种模板化的方式，将复杂的数据库或分布式系统备份／恢复逻辑封装在可重用、可共享的蓝图中。Kanister支持异步或同步
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end