芒地狠

【ELFK】之zookeeper

一、ZooKeeper

1、介绍 Zookeeper

2、Zookeeper服务集群的条件

3、Zookeeper工作机制

4、Zookeeper数据结构

5、Zookeper特点

6、Zookeeper选举机制

6.1 第一次启动选举机制

6.2 非第一次启动选举机制

6.3 总结

7、Zookeeper应用场景

二、Zookeeper集群部署

1、环境部署

1.1 环境架构

2、在节点1安装Zookeeper服务

2.1 安装环境，解压软件

2.2 修改Zookeeper配置配置文件

2.3 设置myid号以及启动脚本

一、ZooKeeper

1、介绍 Zookeeper

ZooKeeper是一种为分布式应用所设计的高可用、高性能且一致的开源协调服务，它提供了一项基本服务：分布式锁服务。分布式应用可以基于它实现更高级的服务，实现诸如同步服务、配置维护和集群管理或者命名的服务。

2、Zookeeper服务集群的条件

Zookeeper服务自身组成集群，2n+1个（奇数）主机。
在集群中，允许n个主机宕机，只要集群中有一半以上的机器可用，zookeeper集群就可用。

#比如：
1、假如zookeeper为3台机器组成的集群，那么就可以允许失效一台，如果失效了2台，就会导致zookeeper集群不可用。
2、所以在搭建zookeeper集群时，主机数需要为奇数。
3、奇数的目的：为了提高容错能允许多损失一台。

3、Zookeeper工作机制

Zookeeper从设计模式角度来理解

是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已在Zookeeper上注册的那些观察者做出相应的反应。
也就是说Zookeeper=文件系统+通知机制。

文件系统：就是将存储的数据通过zookeeper的文件系统进行存储到各个节点上。
通知机制：当某个节点出现故障，zookeeper会将信息通知到客户端上。
总结：每个节点服务器都会在zookeeper中进行注册登记，client也获取当前在线服务器的列表，也会在zookeeper上进行注册登记，client在zookeeper集群上存储的数据。都会通过文件系统分布式存储到各个集群节点中，当集群中某个节点出现故障，zookeeper也会通知到client客户端。

4、Zookeeper数据结构

Zookeeper数据模型的结构与linux文件系统很类似，整体上可以看作时一棵树，每个节点乘坐一个Znode。

每个znode默认能存储1mb的数据，每个znode都可以通过其路径唯一标识。

5、Zookeper特点

Zookeeper：一个领导者（Leader），多个跟随者（Follower）组成的集群
Zookeeper集群中只有半数以上节点存储，Zookeeper集群就能正常服务，所以Zookeeper适合安装奇数台服务器。
全局数据一致性：每个server保存一份相同的数据副本，client无论连接到哪个server，数据都是一致的。
更新请求顺序执行：来自同一个client的更新请求按其发送顺序依次执行，即先进先出。
数据更新原子性：一次数据更新，要么成功，要么失败。
实时性：在一定范围内，client能读到最新数据

总结：zookeeper集群中有一个lleader和多个follower，且zookeeper集群具有数据的一致性、原子性、实时性。且数据更新时按照发送顺序进行更新。

6、Zookeeper选举机制

6.1 第一次启动选举机制

1、服务器1启动，发起一次选举。服务器1投自己一票。

此时服务器1的票数为1票，不够半数以上（5台节点，半数2.5），选举无法完成，服务器1状态保持为LOOKING.
2、服务器2启动，再发起一次选举，服务器1和2分别投自己1票，并交换选票信息。

此时服务器1发现服务器2的myid比自己投票的服务器myid要大，所以将票投给服务器2.
此时服务器1有0票，服务器2有2票，不够半数，选举无法完成，服务器1和2都保持looking状态。
3、服务器3启动，发起一次选举。

服务器1和2发现服务器3的myid最大，就将选票信息投给服务器3.
此时服务器1和2都有0票。服务器3有3票，超过半数，服务器3称为leader，服务器1和2更换状态为following。
4、服务器4启动，发起一次选举，此时服务器1，2，3已不是looking状态，不会更改选票信息。

此时服务器3为3票，服务器4为1票，此时服务器服从多数，更改修选票信息为服务器3，并更改状态为following。
5、服务器5启动，情况和4一样，状态为following。

6.2 非第一次启动选举机制

1、当zookeerper集群中一台服务器出现一下两种请款之一时，就会开始进行leader选举。

服务器初始化启动（第一次启动选举机制）
服务器运行期间无法和leader保持连接（不知道leader是否已经产生了，或者leader宕机）

2、当一台机器进入leader选举流程时，当前集群也可能处于一下两种状态。

①集群中本来就已经存储一个leader

对于已存在leader的情况，机器试图去选举时，被会告知当前服务器的leader信息，对于该机器来说，仅仅需要和leader机器建立连接，并进行状态同步即可。
②集群中leader宕机了。

假设zookeeper由5台服务器组成，SID分别为1，2，3，4，5。ZXID分别为：8，8，8，7.并且此时SID为3的服务器时leader。
某一时刻，当3和5都出现故障时，因此又重新开始选举。

#选举leader的规则
1、EPOCH大的直接胜出。
2、EPOCH相同，事务ID(ZXID)大的胜出.
3、ZXID相同，服务器ID大的胜出

----------------名词解释-----------------------
#1、SID:
服务器ID，用来标识一台Zookeeper集群中的机器，每台机器不能重复，和myid一致。

#2、ZXID
事务ID，ZXID是一个事务ID，用来标识一次服务器状态的变更，在某一时刻，集群中的每台机器的ZXID值不一定完全一致，这和Zookeeper服务器对于客户端“更新请求”的处理逻辑速度有关。

#2、Epoch
每个leader任期的代号，没有leader时选举方式跟第一次启动方法相同，每投完一次一票，这个数据就会增加。

6.3 总结

第一次启动选举机制

主要需要看启动顺序，再看他的myid，只要选举票数超过半数，就会选举出一个leader。新加的机器都会指向这个leader。
非第一次启动选举机制

假如存在leader，新加入的机器会获取到leader的信息，然后进行连接。
假如没有leader，会先比较Epoch（任期数），再比较ZXID（事务ID），再比较SID（服务id）。

7、Zookeeper应用场景

提供的服务包括：统一命令服务，统一配置管理，统一集群管理，服务节点动态上下线，软负载均衡等，

①统一命令服务

在分布式环境下，经常需要对应用/服务进行统一命令，便于识别，例如：IP容易记住，而域名容易记住。
②统一配置管理

分布式环境下，配置文件同步非常常见，一般要求一个集群中，所有节点的配置信息是一致的，比如kafka集群，对配置文件修改后，希望能快速同步到各个节点上。
配置管理可交由Zookeeper实现，可将配置信息写入Zookeeper上的zonde，各个客户端服务器监听这个znode，一旦znode中的数据被修改，zookeeper将通知各个客户端服务器。
③统一集群管理

分布式环境中，时实掌握每个节点的状态是必要的，可根据节点时实状态制作出一些调整，
zookeeper可以实现时实监控节点状态变化，可将节点信息写入zookeeper上的Znode。监听这个Znode可以获取它的时实状态变化。
④服务动态上下线

客户端能时实洞察到服务器上下线的变化。（是否宕机）
⑤软负载均衡

在Zookeeper中记录每台服务器的访问数，让访问数最少的服务器去处理最新的客户端请求。

二、Zookeeper集群部署

1、环境部署

1.1 环境架构

主机名	ip地址	安装软件	系统版本
node1	192.168.100.20	apache-zookeeper-3.5.7-bin.tar.gz	centos7
node2	192.168.100.30	apache-zookeeper-3.5.7-bin.tar.gz	centos7
node3	192.168.100.40	apache-zookeeper-3.5.7-bin.tar.gz	centos7

systemctl stop firewalld

systemctl disable firewalld

setenforce 0

关闭防火墙

2、在节点1安装Zookeeper服务

因为三台主机都要安装，这边只演示一台的安装方法，以node1为例。

2.1 安装环境，解压软件

yum install -y java-1.8.0-openjdk java-1.8.0-openjdk-devel #安装JDK环境
#这里yum安装JDK环境。方便。

java -version 查看java版本

#获取软件包
cd /opt
wget https://archive.apache.org/dist/zookeeper/zookeeper-3.5.7/apache-zookeeper-3.5.7-bin.tar.gz

#或者直接将软件包上传到/opt目录下。

tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz
mv apache-zookeeper-3.5.7-bin /usr/local/zookeeper-3.5.7 #将解压的目录剪切到/usr/local/

2.2 修改Zookeeper配置配置文件

cd /usr/local/zookeeper-3.5.7/conf #进入zookeeper配置文件汇总

ls 后可以看到zoo_sample.cfg模板配置文件

cp zoo_sample.cfg zoo.cfg 复制模板配置文件为zoo.cfg

vim zoo.cfg
tickTime=2000
#通信心跳时间，Zookeeper服务器与客户端心跳时间，单位毫秒
initLimit=10
#Leader和Follower初始连接时能容忍的最多心跳数( tickTime的数量)，这里表示为10*2s
syncLimit=5
#Leader和Follower之间同步通信的超时时间，这里表示如果超过5*2s，Leader认为Follwer死掉，并从服务器列表中删除Follwer
dataDir=/usr/local/zookeeper-3.5.7/data
#●修改，指定保存Zookeeper中的数据的目录，目录需要单独创建
dataLogDir=/usr/local/zookeeper-3.5.7/1ogs
#●添加，指定存放日志的目录，目录需要单独创建
clientPort=2181 #客户端连接端口

#添加集群信息
server.1=192.168.100.20:3188:3288
server.2=192.168.100.30:3188:3288
server.3=192.168.100.40:3188:3288

创建数据目录和日志目录

mkdir /usr/local/zookeeper-3.5.7/data
mkdir /usr/local/zookeeper-3.5.7/logs

ls /usr/local/zookeeper-3.5.7/ 查看是否创建

2.3 设置myid号以及启动脚本

到这里就不要设置同步了，下面的操作，做好一台机器一台机器的配置。

echo 1 >/usr/local/zookeeper-3.5.7/data/myid
# node1上配置

echo 2 >/usr/local/zookeeper-3.5.7/data/myid
#node2上配置

echo 3 >/usr/local/zookeeper-3.5.7/data/myid
#node3上配置

3台节点需要执行的脚本

#//配置启动脚本，脚本在开启启动执行的目录中创建
vim /etc/init.d/zookeeper
#!/bin/bash
#chkconfig:2345 20 90
#description:Zookeeper Service Control Script
ZK_HOME='/usr/local/zookeeper-3.5.7'
case $1 in
start)
   echo "----------zookeeper启动----------"
   $ZK_HOME/bin/zkServer.sh start
;;
stop)
   echo "---------- zookeeper停止-----------"
   $ZK_HOME/bin/zkServer.sh stop
;;
restart)
   echo "---------- zookeeper 重启------------"
   $ZK_HOME/bin/zkServer.sh restart
;;
status)
   echo "---------- zookeeper 状态------------"
   $ZK_HOME/bin/zkServer.sh status
;;
*)
   echo "Usage: $0 {start|stop|restart|status}"
esac

在节点1服务操作

chmod +x /etc/init.d/zookeeper
chkconfig --add zookeeper #加入到系统管理

service zookeeper start 启动服务

service zookeeper status 查看状态后是 follower
在节点2服务操作

chmod +x /etc/init.d/zookeeper
chkconfig --add zookeeper #加入到系统管理

service zookeeper start 启动服务

service zookeeper status 查看状态后是 leader 第二台启动的，他是leader

在节点3服务操作

chmod +x /etc/init.d/zookeeper
chkconfig --add zookeeper #加入到系统管理

service zookeeper start 启动服务

service zookeeper status 查看状态后是 follower

云原生和“可移植性”到底意味着什么
虽然上云，拥抱云计算已经成为当今几乎所有企业的必走之路，但对于“在云原生环境中进行开发”和“依赖某些云供应商提供的，以平台为中心的工具”这两种做法，它们之间依然存在非常清晰的界限。所以你是否好奇，采用云原生方法到底能为业务带来哪些好处？该采用哪种云计算？在云中运行应用程序和工作负载，并不意味着就可以算得上一家云原生的公司。云原生应用程序应该可以在不同的云平台上运行，甚至可以通过混合模式在企业内部运
Flume 简介01 作用核心概念事务机制安装配置入门实战湖中屋 Flume flume
Flume1.业务系统为什么会产生用户行为日志，怎么产生的用户行文日志：每一次访问的行为（访问、搜索）产生的日志记录用户行为日志的目的：1.商家会精准的给你呈现符合你的个人界面2.商家会给你个人添加用户标签，更加精准的分析埋点等2.flume用来做什么的（采集传输数据的，分布式的，可靠的）ApacheFlume是一个从可以收集例如日志，事件等数据资源，并将这些数量庞大的数据从各项数据资源中集中起来
低延迟更灵活，开发者怎能不爱分布式云
为了努力部署和管理复杂的数据密集型应用程序，从而满足客户不断变化的需求，我们需要一种方法让这些应用程序和工作负载更接近位于全球任意一个角落的客户。过去多年来，云计算满足了这种需求。不过这就够了吗？适合过去的东西，就一定适合将来吗？未必！根据重点关注开发者想法的研究公司SlashData的一项新研究，全球开发者正越来越多地将分布式云计算视为保障最佳客户体验的方法。根据Akamai的委托，这项名为“开
游戏业者必看！从中心化到分布式，分布式架构对游戏业带来的优势与收益
游戏行业在全球范围内的蓬勃增长引发了从技术到架构的飞速革新与演变。推动技术发展的重要因素是玩家的体验，任何一个游戏行业的参与者都将玩家的体验是为业务的核心服务目标，而在优化玩家体验的道路上，游戏业者仍有很长的旅程。尤其是对于在线游戏商来说，全球复杂的网络环境让延迟变得更加难以控制。在线游戏可以说是所有行业中对延迟最敏感的行业，这使得它特别容易受到传统集中式云计算架构的缺点的影响，在这种架构中，数据
什么是三高架构? java1234_小锋 java 架构 java 微服务
大家好，我是锋哥。今天分享关于【什么是三高架构?】面试题。希望对大家有帮助；什么是三高架构?1000道互联网大厂Java工程师精选面试题-Java资源分享网“三高架构”通常是指高可用性（HighAvailability）、高性能（HighPerformance）和高扩展性（HighScalability）架构。这三个特性是现代计算系统、尤其是在分布式系统和云计算架构中，设计和部署的关键目标。以下是
云原生前端开发：打造现代化高性能的用户体验大梦百万秋知识学爆状态模式
引言：前端开发的新风向在过去的几年中，前端开发领域经历了快速的演变，从早期的静态网页到如今复杂的单页应用（SPA），再到微前端架构和渐进式Web应用（PWA），前端技术一直处于技术变革的中心。而随着云原生的理念在后端开发中逐渐成熟，前端开发也迎来了新的机遇和挑战。云原生前端开发意味着应用的架构设计和开发方式需要更加注重现代化的开发工具链、灵活性、性能优化和可扩展性。本文将从技术角度讨论如何运用云原
分布式系统理论基础二-CAP 王知无(import_bigdata)
GitHub：https://github.com/wangzhiwubigdata/God-Of-BigData关注公众号,内推,面试,资源下载,关注更多大数据技术~大数据成神之路~预计更新500+篇文章，已经更新50+篇~引言CAP是分布式系统、特别是分布式存储领域中被讨论最多的理论，“什么是CAP定理？”在Quora分布式系统分类下排名FAQ的No.1。CAP在程序员中也有较广的普及，它不仅
《小型开发者在鸿蒙Next上的成本与收益平衡之道》深度学习人工智能算法
学习成本鸿蒙Next系统与安卓、iOS在系统架构、API等方面存在一定差异，小型开发者需要花费时间和精力去熟悉和掌握。例如，开发者需要学习鸿蒙的分布式架构、原生智能等新技术概念和开发方法，这可能需要参加培训课程、阅读文档或在社区中与其他开发者交流学习。开发成本功能越复杂、UI/UX设计要求越高，开发成本就越高。小型开发者可能需要投入更多的人力和时间来进行应用的设计和开发。如果开发者经验不足，开发效
淘宝客APP的数据同步与一致性保障 wx_tangjinjinwx java 开发语言
淘宝客APP的数据同步与一致性保障大家好，我是微赚淘客返利系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天我们来讨论淘宝客APP中的数据同步与一致性保障问题。随着系统复杂度的提升，特别是在分布式架构的情况下，如何确保数据同步和一致性成为了一个重要的技术挑战。本文将深入探讨在淘宝客APP中实现数据同步与一致性保障的关键技术和方法，并提供Java代码示例。一、数据同步的挑战在淘宝客APP
Fluss安装体验 WYRM_GOLD fluss flink big data zookeeper kafka
1、zookeeper安装笔者下载的是fluss0.5版本，当前fluss0.5版本需要依赖zookeeper服务。1.1下载zk下载地址:https://mirrors.aliyun.com/apache/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz1.1.1zk集群规划node1192.168.40.1node2192.
两万字探讨时间轮算法 Damon_0411 算法 java spring
1.引言1.1背景介绍随着分布式系统、微服务架构的流行以及高并发场景的广泛应用，系统中处理延时任务的需求变得愈发重要。延时任务的常见场景包括：任务调度：某些任务需要按照预定时间执行，比如每天的定时数据备份。超时控制：网络连接的超时检测、数据库锁的释放延迟等。缓存管理：缓存数据的过期清理策略。事件驱动场景：如日志系统中，只有当所有日志接收完毕并经过一定延迟后才能触发归档。延时任务的本质是系统需要管理
Zookeeper（15）Zookeeper的ZooKeeper API包含哪些主要操作？辞暮尔尔-烟火年年微服务 zookeeper debian 分布式
Zookeeper的ZooKeeperAPI提供了一系列操作来管理Zookeeper的数据节点（znodes）。这些操作主要包括创建节点、删除节点、读取节点数据、设置节点数据、列出子节点、检查节点是否存在，以及注册Watcher等。以下是这些操作的详细介绍和代码示例。主要操作创建节点(create)删除节点(delete)读取节点数据(getData)设置节点数据(setData)列出子节点(ge
zookeeper分布式锁模拟12306买票有一个好名字 zookeeper 分布式 zookeeper 云原生
未加锁时容易出现重复买票情况代码publicclassTicket12306implementsRunnable{//票数privateintticketNums=10;@Overridepublicvoidrun(){while(true){if(ticketNums>0){System.out.println(Thread.currentThread()+"抢到了第"+ticketNums+"
Sealos 将计算节点加入 kubeadm 安装的 Kubernetes 集群 ivwdcwso 运维 kubernetes 容器云原生 k8s sealos
引言Kubernetes是云原生应用的核心平台，而kubeadm是官方推荐的Kubernetes集群部署工具。然而，随着集群规模的扩大，手动管理节点变得越来越复杂。Sealos作为一款以Kubernetes为内核的云操作系统，提供了简单高效的节点管理功能，能够轻松地将计算节点加入到现有的Kubernetes集群中。本文将详细介绍如何在使用kubeadm安装主节点的基础上，使用Sealos将计算节点
【RabbitMQ】超详细Windows系统下RabbitMQ的安装配置 m0_74823963 rabbitmq windows 分布式
RabbitMQ是一个开源的消息队列中间件，广泛用于分布式系统中的异步消息传递。它支持多种消息协议，易于扩展，功能强大。本文将详细介绍如何在Windows系统下安装和配置RabbitMQ，包括所需的依赖项、安装步骤、基本配置和常见问题解决方案。目录什么是RabbitMQ？安装前的准备2.1系统要求2.2安装ErlangRabbitMQ的安装步骤3.1下载RabbitMQ3.2安装RabbitMQ配
分布式-分布式必备理论基础：CAP和BASE 后端
一、CAP分布式系统不可能同时满足一致性（C：Consistency）、可用性（A：Availability）和分区容忍性（P：PartitionTolerance），最多只能同时满足其中两项。一致性一致性指的是多个数据副本是否能保持一致的特性，在一致性的条件下，系统在执行数据更新操作之后能够从一致性状态转移到另一个一致性状态。对系统的一个数据更新成功之后，如果所有用户都能够读取到最新的值，该系统
【软考速通笔记】系统架构设计师⑬——云原生架构设计理论与实践小康师兄系统架构设计师笔记系统架构云原生软考分布式容器微服务
文章目录一、前言二、云原生架构基础知识2.1定义2.2特点2.3原则三、云原生架构模式3.1服务化架构模式3.2Mesh化架构模式3.3Serverless模式3.4存储计算分离模式3.5分布式事务模式3.6可观测模式3.7事件驱动架构3.8反云原生模式四、云原生技术4.1容器技术4.2容器编排技术4.3微服务4.4无服务器技术4.5服务网格五、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统
【架构设计】现代软件交付中的灵活性与可靠性———云原生与不可变基础设施（微服务/容器化/持续交付，计算/存储/网络）小哈里 #后端开发网络云原生微服务系统架构云计算
【架构设计】现代软件交付中的灵活性与可靠性———云原生与不可变基础设施（微服务/容器化/持续交付，计算/存储/网络）文章目录1、云原生与基础设施的关系2、云原生的概念（灵活性）3、云原生=微服务+容器化+持续交付（容器化）4、基础设施的概念（可靠性）5使用Packer、Ansible和Terraform构建不可变的基础设施（镜像化）1、云原生与基础设施的关系定义：云原生：云原生是一种设计和运行应用
通俗易懂 serverless 架构、微服务架构和云原生架构，并简单代码 Ai君臣架构架构云原生 serverless
文章目录1serverless架构、微服务架构和云原生架构区别1.Serverless架构示例：AWSLambda+APIGateway2.微服务架构示例：Flask微服务3.云原生架构示例：Docker和Kubernetes2Kubernetes中管理多个副本和流量两个关键组件1.Deployment2.Service负载均衡流量管理1serverless架构、微服务架构和云原生架构区别别用代码
Apache SeaTunnel 荣登 2024 年度中间件开源项目 Top 50 榜单 SeaTunnel 大数据
近日，ApacheSeaTunnel项目成功入选2024年度中间件开源项目Top50榜单。该榜单由OpenGithub技术社区评选，旨在表彰在中间件领域具有突出表现的开源项目。榜单链接：https://zhuanlan.zhihu.com/p/16116358605关于ApacheSeaTunnelApacheSeaTunnel是一个云原生的高性能海量数据集成工具。北京时间2023年6月1日，全球
Micrometer+ZipKin实现分布式链路追踪郭弟弟分布式
1.引入依赖io.micrometermicrometer-tracing-bom${micrometer-tracing.version}pomimportio.micrometermicrometer-tracing${micrometer-tracing.version}io.micrometermicrometer-tracing-bridge-brave${micrometer-trac
最新版！快速掌握 JDK17 + springboot3 + springcloud Alibaba :7、链路追踪 Micrometer Tracing&Zipkin 云上凯歌 springcloud Alibaba spring cloud spring 后端
微服务架构是一个分布式架构，它按业务划分服务单元，一个分布式系统往往有很多个服务单元。由于服务单元数量众多，业务的复杂性，如果出现了错误和异常，很难去定位。主要体现在，一个请求可能需要调用很多个服务，而内部服务的调用复杂性，决定了问题难以定位。所以微服务架构中，必须实现分布式链路追踪，去跟进一个请求到底有哪些服务参与，参与的顺序又是怎样的，从而达到每个请求的步骤清晰可见，出了问题，很快定位。分布式
Springboot Redisson 分布式锁、缓存、消息队列、布隆过滤器空灵宫（Ethereal Palace） springboot Java java spring boot 分布式
redisson-spring-boot-starter是Redisson提供的SpringBoot集成包，旨在简化与Redis的交互，包括分布式锁、缓存、消息队列、布隆过滤器等功能的实现。Maven依赖在SpringBoot项目中添加redisson-spring-boot-starter依赖：org.redissonredisson-spring-boot-starter3.22.0核心功能分
后悔呀，自从用了SkyWalking分布式链路追踪，现在睡得越来越香了 Bad_Ape java 编程语言程序人生经验分享架构
本篇文章介绍链路追踪的另外一种解决方案Skywalking，文章目录如下：什么是Skywalking？上一篇文章介绍了分布式链路追踪的一种方式：SpringCloudSleuth+ZipKin，这种方案目前也是有很多企业在用，但是作为程序员要的追逐一些新奇的技术，Skywalking作为后起之秀也是值得大家去学习的。skywalking是一个优秀的国产开源框架，2015年由个人吴晟（华为开发者）开
Python 网络爬虫高级教程：分布式爬取与大规模数据处理 Milk夜雨 python python 爬虫网络
经过基础爬虫和进阶爬虫的学习，我们已经掌握了爬虫的基本原理、动态内容处理及反爬机制的应对。然而，当我们面对海量数据或需要高效爬取多个站点时，分布式爬虫和数据存储、处理能力就显得尤为重要。本篇博客将带你迈向网络爬虫的高级阶段，学习分布式爬取、大规模数据处理以及性能优化。一、分布式爬虫的概念1.什么是分布式爬虫？分布式爬虫是指通过多个节点协作完成大规模网页爬取任务的爬虫架构。它能有效解决以下问题：单台
深入探讨Kafka：架构、实现原理与开发实践 Ceramist kafka 架构分布式
深入探讨Kafka：架构、实现原理与开发实践ApacheKafka是一个高性能的分布式流处理平台，广泛应用于实时数据处理、日志收集、消息发布/订阅等领域。本文将详细解析Kafka的架构、实现原理，并提供一些开发中的注意事项，帮助读者更好地理解和使用Kafka。一、Kafka简介Kafka由LinkedIn开发，并于2011年开源，2012年成为Apache顶级项目。Kafka的设计目标是为处理实时
网络爬虫——分布式爬虫架构好看资源分享网络爬虫 Python 爬虫分布式架构
分布式爬虫在现代大数据采集中是不可或缺的一部分。随着互联网信息量的爆炸性增长，单机爬虫在性能、效率和稳定性上都面临巨大的挑战。分布式爬虫通过任务分发、多节点协作以及结果整合，成为解决大规模数据抓取任务的核心手段。本节将从Scrapy框架的基本使用、Scrapy-Redis的分布式实现、分布式爬虫的优化策略等多个方面展开，结合实际案例，帮助开发者掌握分布式爬虫的设计与实现。1.Scrapy框架的核心
9.kafka单实例安装小黑要上天 Kafka kafka 分布式
1.环境信息OSVersionZookeeperVersionUserRHEL7.73.8.0rootkafka官网下载地址：ApacheKafka备注：与在同一台服务器。也需要jdk支持2.kafka单实例安装1.上传kafka_2.13-3.3.2.tgzE.g：上传至/opt目录2.解压命令：tar-zxvfkafka_2.13-3.3.2.tgz3.配置server.properties命
分布式链路追踪-03-Jaeger、Zipkin、skywalking 中的 span 是如何设计的？后端java
开源项目auto-log自动日志输出Jaeger、Zipkin中的spanId是如何生成的？在Jaeger和Zipkin这两个分布式跟踪系统中，SpanID是通过不同的方法生成的。下面分别介绍它们的生成方式：Jaeger中的SpanID生成：在Jaeger中，SpanID是通过Snowflake算法生成的。Snowflake算法是Twitter开源的一种全局唯一ID生成算法，用于生成64位的唯一标
【Node.js】Session原理详解 Peter-Lu #NodeJS node.js express 前端 npm javascript
文章目录一、Session机制概述1.什么是Session2.Session与Cookie的关系二、Session的工作流程1.基本流程2.示例代码三、Session的存储方式1.内存存储2.文件存储3.数据库存储Redis存储示例四、Session的生命周期1.Session过期时间2.手动销毁Session五、Session在分布式系统中的应用1.StickySession2.Session共
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

【ELFK】之zookeeper

一、ZooKeeper

1、介绍 Zookeeper

2、Zookeeper服务集群的条件

3、Zookeeper工作机制

4、Zookeeper数据结构

5、Zookeper特点

6、Zookeeper选举机制

6.1 第一次启动选举机制

6.2 非第一次启动选举机制

6.3 总结

7、Zookeeper应用场景

二、Zookeeper集群部署

1、环境部署

1.1 环境架构

2、在节点1安装Zookeeper服务

2.1 安装环境，解压软件

2.2 修改Zookeeper配置配置文件

2.3 设置myid号以及启动脚本

你可能感兴趣的:(zookeeper,分布式,云原生)