beginning1126

分布式系统---分布式一致性协议

分布式一致性协议

两阶段提交协议

略

三阶段提交协议

略

Paxos算法

关于paxos的形象理解

转载文章：http://www.lxway.com/4618606.htm

上面这篇文章写的非常好，有助于paxos的理解，摘录如下。驴友相当于proposer，队长相当于acceptor。

假如有一群驴友要决定中秋节去旅游，这群驴友分布在全国各地，假定一共25个人，分别在不同的省，要决定到底去拉萨、昆明、三亚等等哪个地点（会合时间中秋节已经定了，此时需要决定旅游地）。最直接的方式当然就是建一个QQ群，大家都在里面投票，按照少数服从多数的原则。这种方式类似于“共享内存”实现的一致性，实现起来简单，但Paxos算法不是这种场景，因为Paxos算法认为这种方式有一个很大的问题，就是QQ服务器挂掉怎么办？Paxos的原则是容错性一定要很强。所以，Paxos的场景类似于这25个人相互之间只能发短信，需要解决的核心问题是，哪怕任意的一部分人（Paxos的目的其实是少于半数的人）“失联”了，其它人也能够在会合地点上达成一致。好了，怎么设计呢？

这25个人找了另外的5个人（当然这5个人可以从25个人中选，这里为了描述方便，就单拿出另外5个人），比如北京、上海、广州、深圳、成都的5个人，25个人都给他们发短信，告诉自己倾向的旅游地。这5个人相互之间可以并不通信，只接受25个人发过来的短信。这25个人我们称为驴友，那5个人称为队长。

驴友逻辑：

先来看驴友的逻辑。驴友可以给任意5个队长都发短信，发短信的过程分为两个步骤：

第一步（申请阶段）：

询问5个队长，试图与队长沟通旅游地。因为每个队长一直会收到不同驴友的短信，不能跟多个驴友一起沟通，在任何时刻只能跟一个驴友沟通，按照什么原则才能做到公平公正公开呢？这些短信都带有发送时间，队长采用的原则是同意与短信发送时间最新的驴友沟通，如果出现了更新的短信，则与短信更新的驴友沟通。总之，作为一个有话语权的人，只有时刻保持倾听最新的呼声，才能做出最明智的选择。在驴友发出短信后，等着队长。某些队长可能会说，你这条短信太老了，我不与你沟通；有些队长则可能返回说，你的短信是我收到的最新的，我同意跟你沟通。对于已经产生决定的这些队长，还得返回自己决定的旅游地。关于队长是怎么决定旅游地的，后面再说。

对于驴友来说，第一步必须至少有半数以上队长都同意沟通了，才能进入下一步。否则，你连沟通的资格都没有，一直在那儿狂发吧。你发的短信更新，你获得沟通权的可能性才更大。。。。。。

因为至少有半数以上队长（也就是3个队长以上）同意，你才能与队长们进行实质性的沟通，也就是进入第二步；而队长在任何时候只能跟1个驴友沟通，所以，在任何时候，不可能出现两个驴友都达到了这个状态。。。当然，你可以通过狂发短信把沟通权抢了。。。。

对于获得沟通权的那个驴友（称为A），那些队长会给他发送他们自己决定的旅游地（也可能都还没有决定）。可以看出，各个队长是自己决定旅游地的，队长之间无需沟通。

第二步（沟通阶段）：

这个幸运的驴友收到了队长们给他发的旅游地，可能有几种情况：

第一种情况：跟A沟通的队长们（不一定是全部5个队长，但是半数以上）全部都还没有决定到底去那儿旅游，此时驴友A心花怒放，给这些队长发第二条短信，告诉他们自己希望的旅游地（比如马尔代夫）；

可能会收到两种结果：一是半数以上队长都同意了，于是表明A建议的马尔代夫被半数以上队长都同意了，整个决定过程完毕了，其它驴友迟早会知道这个消息的，A先去收拾东西准备去马尔代夫；除此之外，表明失败。可能队长出故障了，比如某个队长在跟女朋友打电话等等，也可能被其它驴友抢占沟通权了（因为队长喜新厌旧嘛，只有要更新的驴友给自己发短信，自己就与新人沟通，A的建议队长不同意）等等。不管怎么说，苦逼的A还得重新从第一步开始，重新给队长们发短信申请。

第二种情况：至少有一个队长已经决定旅游地了，A可能会收到来自不同队长决定的多个旅游地，这些旅游地是不同队长跟不同驴友在不同时间上做出的决定，那么，A会先看一下，是不是有的旅游地已经被半数以上队长同意了（比如3个队长都同意去三亚，1个同意去昆明，另外一个没搭理A），如果出现了这种情况，那就别扯了，说明整个决定过程已经达成一致了，收拾收拾准备去三亚吧，结束了；如果都没有达到半数以上（比如1个同意去昆明，1个同意去三亚，2个同意去拉萨，1个没搭理我），A作为一个高素质驴友，也不按照自己的意愿乱来了（Paxos的关键所在，后者认同前者，否则整个决定过程永无止境），虽然自己原来可能想去马尔代夫等等。就给队长们发第二条短信的时候，告诉他们自己希望的旅游地，就是自己收到的那堆旅游地中最新决定的那个。（比如，去昆明那个是北京那个队长前1分钟决定的，去三亚的决定是上海那个队长1个小时之前做出来的，于是顶昆明）。驴友A的想法是，既然有队长已经做决定了，那我就干脆顶最新那个决定。

从上面的逻辑可以看出，一旦某个时刻有半数以上队长同意了某个地点比如昆明，紧跟着后面的驴友B继续发短信时，如果获得沟通权，因为半数以上队长都同意与B沟通了，说明B收到了来自半数以上队长发过来的消息，B必然会收到至少一个队长给他发的昆明这个结果（否则说明半数以上队长都没有同意昆明这个结果，这显然与前面的假设矛盾），B于是会顶这个最新地点，不会更改，因为后面的驴友都会顶昆明，因此同意昆明的队长越来越多，最终必然达成一致。

队长逻辑

看完了驴友的逻辑，那么队长的逻辑是什么呢？

队长的逻辑比较简单。

第一步（申请阶段）

在申请阶段，队长只会选择与最新发申请短信的驴友沟通，队长知道自己接收到最新短信的时间，对于更老的短信，队长不会搭理；队长同意沟通了的话，会把自己决定的旅游地（或者还没决定这一信息）发给驴友。

第二步（沟通阶段）

在沟通阶段，驴友C会把自己希望的旅游地发过来（同时会附加上自己申请短信的时间，比如3分钟前），所以队长要检查一下，如果这个时间（3分钟前）确实是当前自己最新接收到申请短信的时间（说明这段时间没有驴友要跟自己沟通），那么，队长就同意驴友C的这个旅游地了（比如昆明，哪怕自己1个小时前已经做过去三亚的决定，谁让C更新呢，于是更新为昆明）；如果不是最新的，说明这3分钟内又有其它驴友D跟自己申请了，因为自己是个喜新厌旧的家伙，同意与D沟通了，所以驴友C的决定自己不会同意，等着D一会儿要发过来的决定吧。

总结：

acceptor，喜新厌旧，永远仅和编号大的进入第二阶段，并且在第二阶段编号大的proposor可以改变acceptor之前已经确定的值
proposor，后者认同前者。当有超过半数的acceptor确定了相同的值，proposor直接采用这个值。如果没有超过半数，则取最新更新的值，重新提交
超过半数，少数服从多数，这个其实非常关键，proposor向acceptor发送prepare和accept消息，其实不用等待所有acceptor的回应，只要超过半数回应则可，这样即便有1/2个acceptor出现故障（只要还剩下超过半数以上），则流程可以继续下去，不会发生堵塞情况。

一致性问题的理解

关于Paxos说的一致性，个人理解是指冗余副本（或状态等，但都是因为存在冗余）的一致性。这与关系型数据库中ACID的一致性说的不是一个东西。在关系数据库里，可以连副本都没有，何谈副本的一致性？按照经典定义，ACID中的C指的是在一个事务中，事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。那么，什么又是一致性状态呢，这跟业务约束有关系，比如经典的转账事务，事务处理完毕后，不能出现一个账户钱被扣了，另一个账户的钱没有增加的情况，如果两者加起来的钱还是等于转账前的钱，那么就是一致性状态。
CAP原则里面所说的一致性，个人认为是指副本一致性，与Paxos里面的一致性接近。都是处理“因为冗余数据的存在而需要保证多个副本保持一致”的问题，NoSQL放弃的强一致性也是指副本一致性，最终一致性也是指副本达到完全相同存在一定延时。

zookeeper一致性协议：zab

ZooKeeper为高可用的一致性协调框架，使用的是ZAB协议作为数据一致性的算法，ZAB（ZooKeeper Atomic Broadcast ）全称为：原子消息广播协议。zab协议中，可以看到paxos和两阶段提交协议的影子，下面详细论述zab协议。

3个角色

leader、follower、learner，follower参与leader的选举，learner不参与leader的选举，仅从leader同步数据。

读操作可以从任何一个节点获取，当然不一定获取到最新的，写操作，client如果连接到follower上，会被重定向到leader，写操作都是通过leader节点完成的。

3个阶段

选举leader，成为leader的node条件

选epoch最大的
epoch相等，选 zxid 最大的
epoch和zxid都相等，选择serverid最大的（serverid是我们配置zoo.cfg中的myid）

节点在选举开始都默认投票给自己，当接收其他节点的选票时，会根据上面的条件更改自己的选票并重新发送选票给其他节点，当有一个节点的得票超过半数，该节点会设置自己的状态为 leading，其他节点会设置自己的状态为 following。

同步数据，当leader选举出来之后，follower则从leader同步数据。注意两个点。

由于leader是具有最大zxid的节点，所以其应该是在上一个leader崩溃之后，具有最新数据的节点。
一个事务有两个阶段，proposor和commit，follower需要根据leader的最新数据，commit leader已经commit，而自己未commit的数据，同时删除那些leader未commit的数据。

消息广播，可以理解为少数服从多数的两阶段提交协议，这个阶段其实可以看成是只有一个proposor的paxos协议。

3个状态

ZAB协议中存在着三种状态，每个节点都属于以下三种中的一种：

　　Looking：系统刚启动时或者Leader崩溃后正处于选举状态
　　Following：Follower节点所处的状态，Follower与Leader处于数据同步阶段；
　　Leading：Leader所处状态，当前集群中有一个Leader为主进程；

　　ZooKeeper启动时所有节点初始状态为Looking，这时集群会尝试选举出一个Leader节点，选举出的Leader节点切换为Leading状态；当节点发现集群中已经选举出Leader则该节点会切换到Following状态，然后和Leader节点保持同步；当Follower节点与Leader失去联系时Follower节点则会切换到Looking状态，开始新一轮选举；当leader节点未收到过半follower心跳检测或tcp断开，leader节点转换为looking状态。在ZooKeeper的整个生命周期中每个节点都会在Looking、Following、Leading状态间不断转换；

quorum

集群中超过半数的节点集合，在paxos和zab协议中，经常会用到超过半数的方法，超过半数同意，则可以选举出leader，超过半数同意，则可以完成事务提交。

一个主要的目的就是防止少于半数的节点出现故障，block业务流程，反向说，只要有一半以上的节点工作正常，整个集群的工作就是正常的。

再考虑另一个场景，整个zookeeper集群部署在2个机房，共5个节点，3个在机房1,2个在机房2，一旦两个机房之间网络出现故障，就会造成脑裂、数据不一致的问题，但是超过半数则可以解决这个问题，位于机房2的2个节点，由于无法与机房1通信，则无法产生leader，而机房1由于可以达到超过半数（3个）节点的同意，可以选举出leader，所以机房1可以正常对外提供服务，当机房间网络恢复正常，机房2由于发现已经存在leader，则将角色变更为follower，主动从leader同步遗失数据，则可以继续正常对外提供数据。

zxid

在 ZAB 协议的事务编号 Zxid 设计中，Zxid 是一个 64 位的数字，其中低 32 位是一个简单的单调递增的计数器，针对客户端每一个事务请求，计数器加 1；而高 32 位则代表 Leader 周期 epoch 的编号，每次当选的新的 Leader 服务器，就会从这个 Leader 服务器上取出其本地日志中最大事务的ZXID，并从中读取 epoch 值，然后加 1，以此作为新的 epoch，并将低 32 位从 0 开始计数。epoch：可以理解为当前集群所处的年代或者周期，每个 leader 就像皇帝，都有自己的年号，所以每次改朝换代，leader 变更之后，都会在前一个年代的基础上加 1。这样就算旧的 leader 崩溃恢复之后，也没有人听他的了，因为 follower 只听从当前年代的 leader 的命令。

zab paxos 2pc的对比

zab和paxos对比，paxos由于有多个proposor，所以存在活锁的问题，但是zab仅有一个leader充当proposor的角色，解决了活锁的问题，同时引入leader选举，解决了单点的问题

zab和2pc的对比，两阶段提交协议，有其无法解决的缺点，如block、单点、数据不一致，

block解决，zab可以看成是一个少数服从多数的两阶段提交协议。通过超过一半节点通过，就可以完成事务的提交，有少量节点down掉，不影响整体流程，不会像2pc一直block某个节点的ack。zab如果一段时间后，超过半数的节点没有ack，才会有问题，这个时候则需要重新选举leader
单点故障的解决，通过引入leader选举，当leader挂掉，会重新选举新的leader
数据不一致的解决，2pc由于脑裂的问题，会导致数据不一致，而zab其实就是单个proposor的paxos协议，paxos本身就是为了解决一致性问题设计的，所以也不存在一致性的问题。

参考文章

http://blog.xiaohansong.com/2016/08/25/zab/?utm_source=tuicool&utm_medium=referral

《从PAXOS到ZOOKEEPER分布式一致性原理与实践》

http://www.lxway.com/4618606.htm

分布式系统全链路监控之二：Spring Actuator
文章目录引用前言开启功能端点控制端点访问权限开放端点端点缓存敏感信息脱敏Actuator发现页跨域自定义端点健康信息应用程序信息软件物料信息通过HTTP进行监控和管理自定义端点路径自定义端口号配置专用SSL自定义监听地址可观察性OpenTelemetry支持日志配置日志记录器OpenTelemetry指标支持的指标和仪表注册自定义指标定制个人指标链路日志关联ID创建自定义SpanBaggage审计
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
架构师：在 Spring Cloud 中实现全局异常处理的技术指南拾荒的小海螺架构师 spring cloud spring 后端
1、简述在分布式系统中，微服务架构是最流行的设计模式之一。SpringCloud提供了各种工具和库来简化微服务的开发和管理。然而，随着服务的增多，处理每个服务中的异常变得尤为复杂。因此，实现统一的全局异常处理成为了关键。本篇博客将介绍如何在SpringCloud微服务架构中实现全局异常处理。2、全局异常处理在SpringCloud中，我们可以通过以下几种方式来实现全局异常处理：使用@Control
深入解析Spring Boot与Kafka集成：构建高效消息驱动应用
深入解析SpringBoot与Kafka集成：构建高效消息驱动应用引言在现代分布式系统中，消息队列技术扮演着至关重要的角色。ApacheKafka作为一款高性能、分布式的消息队列系统，被广泛应用于实时数据处理、日志收集、事件驱动架构等场景。本文将深入探讨如何在SpringBoot应用中集成Kafka，构建高效的消息驱动应用。1.Kafka简介ApacheKafka是一个分布式流处理平台，具有高吞吐
深入解析Spring Boot与Kafka集成：构建高性能消息驱动应用 Uranus^ Java Spring Boot Kafka 消息队列分布式系统
深入解析SpringBoot与Kafka集成：构建高性能消息驱动应用引言在现代分布式系统中，消息队列是实现异步通信和解耦的关键组件之一。ApacheKafka作为一种高性能、分布式的消息队列系统，被广泛应用于大数据处理、实时流处理以及事件驱动的架构中。本文将深入探讨如何在SpringBoot应用中集成Kafka，构建高性能的消息驱动应用。Kafka简介ApacheKafka是一个分布式流处理平台，
【Note】《Kafka: The Definitive Guide》第6章：Kafka 的可靠数据投递机制，理解消息系统中的交付语义 CodeWithMe 中间件读书笔记 kafka 分布式
《Kafka:TheDefinitiveGuide》第6章：Kafka的可靠数据投递机制，理解消息系统中的交付语义在构建分布式系统时，数据是否成功送达？是否会丢失？是否会重复？这些都是架构师必须面对的核心问题。Kafka被广泛应用于金融、监控、日志、交易、IoT等对可靠性要求极高的场景，那么它是如何保障消息交付可靠性的？本章将深入解析Kafka的消息投递语义、失败处理机制、幂等性与事务支持，从而理
【Note】《Kafka: The Definitive Guide》第三章： Kafka 生产者深入解析：如何高效写入 Kafka 消息队列 CodeWithMe 读书笔记中间件 kafka 分布式
《Kafka:TheDefinitiveGuide》第三章：Kafka生产者深入解析：如何高效写入Kafka消息队列Kafka已经成为现代分布式系统中不可或缺的核心组件，尤其是在微服务、事件驱动架构与实时流处理领域。作为Kafka使用的第一步，生产者（Producer）负责将消息写入Kafka，这个过程背后有哪些关键机制？如何实现高可靠、高性能的写入？什么是KafkaProducer？KafkaP
202505架构师论文《论静态负载均衡策略设计和应用》文琪小站系统架构师软考论文负载均衡运维软考论文
软件架构师论文范文系列摘要在当今高度依赖信息技术的时代，构建高性能、高可用的分布式系统已成为必然趋势。负载均衡作为分布式系统中的关键技术，旨在将请求或数据有效地分发到多个处理单元，以优化资源利用率、提升系统吞吐量并确保服务的稳定运行。本文深入探讨了静态负载均衡策略的设计原理、技术特点及其在实际项目中的应用。首先，概述了负载均衡的整体概念及静态策略的分类，重点介绍了基于哈希、轮询和权重等静态算法的实
解析大数据领域结构化数据的管理模式大数据洞察大数据 ai
解码结构化数据：大数据时代的高效管理模式与实践指南关键词结构化数据、大数据管理、数据建模、分布式数据库、数据仓库、数据治理、性能优化摘要在大数据的洪流中，结构化数据犹如隐藏在波涛之下的磐石，虽然不如非结构化数据那般引人注目，却是企业决策的基石。本文深入剖析了大数据环境下结构化数据的管理模式，从传统关系型数据库到现代分布式系统，从数据建模到存储架构，全面解读了结构化数据管理的核心技术与实践方法。通过
Kafka消费者分区分配机制与生产环境配置指南
引言在分布式系统中，Kafka作为高性能消息队列被广泛应用。本文将深入探讨Kafka消费者的分区分配机制，分析不同分配策略的优劣，并提供生产环境中的最佳配置实践。我们还将详细解析消费者常见问题的排查方法，特别是消费者未分配到分区的情况。一、Kafka消费者分区分配机制1.1基础分配原则Kafka通过消费者组（ConsumerGroup）机制实现消息的并行处理。核心规则包括：消费者组隔离：不同消费者
《Spring 中上下文传递的那些事儿》Part 5：分布式链路追踪——SkyWalking 实战指南大手你不懂 Spring 中上下文传递的那些事儿 Java项目实战 spring 分布式 skywalking
Part5：分布式链路追踪——SkyWalking实战指南随着微服务架构的广泛应用，分布式系统的链路追踪和性能监控变得尤为重要。在之前的文章中，我们探讨了如何使用Sleuth和Zipkin实现基本的链路追踪。今天，我们将介绍另一种强大的工具——ApacheSkyWalking，它不仅提供了全面的链路追踪功能，还支持JVM、数据库、消息队列等多方面的监控。本文将带你了解SkyWalking的核心概念
【分布式数据库】
分布式数据库是一种数据存储系统，它的设计使得数据库可以存储在多个物理位置（服务器、节点）上，同时对用户呈现为一个统一的数据库。分布式数据库的核心思想是将数据分布在多个地点进行存储和处理，这些地点可以是同一数据中心内的不同服务器，也可以是地理上分散的多个数据中心。分布式数据库的目标是在保证数据一致性、可用性和性能的前提下，提供一个灵活、可扩展且高效的数据存储解决方案。它结合了数据库系统和分布式系统的
2025年Java后端岗互联网大厂技术场景题的总结（附100w字面试题）小凡敲代码 java java后端 java面试 Java面试题互联网大厂求职 Java场景题
一、高并发与分布式系统设计1.百万级QPS秒杀系统问题：如何设计支持瞬时高并发的秒杀系统？解决方案：Redis预减库存：使用Lua脚本保证原子性操作，防止超卖。异步下单：通过MQ（如Kafka/RocketMQ）削峰，降低数据库压力。限流降级：Sentinel/Nginx限流，防止恶意请求。热点数据隔离：独立Redis集群存储秒杀商品数据。2.分布式事务一致性问题：跨服务下单如何保证数据一致性？方
分布式系统核心概念与Go语言实现方案学历真的很重要 golang 面试开发语言 go 职场和发展
GoGoGo，出发咯！一、分布式系统1.分布式系统基础概念定义：分布式系统由多台计算机通过网络连接协同工作，对外表现为单一系统。核心特点：包括可扩展性、一致性、高容错性和透明性。Go语言凭借高并发、轻量级协程（goroutine）和简洁的同步机制（如channel），成为构建分布式系统的理想选择。2.分布式系统的关键特性高容错性：部分节点故障不影响整体服务。可扩展性：通过增加节点横向扩展处理能力。
25年最新Java后端社招场景项目题总结！（附100w字面试题）小凡敲代码 java java面试 Java面试题 Java场景题程序员互联网大厂计算机
一、高并发与分布式系统设计百万级QPS秒杀系统核心问题：如何解决超卖、库存一致性、高并发请求？技术方案：Redis预减库存+异步扣减（Kafka/RocketMQ）分布式锁（Redisson）或乐观锁（CAS）限流策略（Nginx/Sentinel）扩展：热点数据隔离（独立Redis集群）、风控防刷（IP限流、验证码）。分布式文件存储系统（类似GFS）需求：支持海量文件存储、高可用、快速检索。关键
分布式领域后端服务的限流算法实现大厂资深架构师 Spring Boot 开发实战分布式算法 wpf ai
分布式领域后端服务的限流算法实现关键词：分布式系统、限流算法、令牌桶、漏桶、滑动窗口、Redis、高并发摘要：本文深入探讨分布式系统中后端服务的限流算法实现。我们将从基础概念出发，详细分析各种限流算法的原理和适用场景，包括计数器算法、滑动窗口算法、令牌桶算法和漏桶算法。文章将提供Python实现代码和数学建模，并通过实际案例展示如何在分布式环境中使用Redis实现高效的限流机制。最后，我们将讨论限
从攻击者视角看接口加密：基于 Spring Boot 的接口安全防护实践小莫分享 JAVA spring boot 安全后端
引言在现代分布式系统中，接口不仅是功能实现的枢纽，还肩负着数据交互的重任。然而，开放接口的同时也意味着暴露了一定程度的安全风险。随着网络攻击技术的不断演进，识别和防范接口的薄弱点成为每个开发者必须重视的内容。本文旨在深入探讨接口加密的必要性，通过分析攻击者如何利用这些薄弱点，并对防御策略进行探讨。1.从攻击者角度看接口的薄弱点接口的设计原则通常倾向于开放和灵活，但这也成为攻击者的潜在攻击路径。探索
数据库分布式架构：ShardingSphere 实践
一、数据库分布式架构概述1.1分布式架构概念在当今数字化时代，随着业务的不断拓展和数据量的爆炸式增长，传统的单机数据库架构逐渐暴露出诸多局限性。例如，在电商大促期间，海量的订单数据和用户访问请求会让单机数据库不堪重负，出现响应缓慢甚至崩溃的情况。数据库的分布式架构应运而生，它将数据库的数据和操作分散到多个物理节点上，这些节点通过网络连接形成一个有机的分布式系统。其核心目标是显著提高数据库的性能、可
2025系统架构师---管道/过滤器架构风格喜欢猪猪 java 开发语言
引言在分布式系统与数据密集型应用主导技术演进的今天，‌管道/过滤器架构风格‌（PipesandFiltersArchitectureStyle）凭借其‌数据流驱动‌、‌组件解耦‌与‌并行处理能力‌，成为处理复杂数据转换任务的核心范式。从Unix命令行工具到实时金融交易引擎，从图像处理流水线到物联网边缘计算，管道/过滤器架构通过将系统拆分为独立处理单元（过滤器）与数据传递通道（管道），实现了功能模块
大数据基础知识-Hadoop、HBase、Hive一篇搞定原来是猪猪呀 hadoop 大数据分布式
HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构，其核心设计包括分布式文件系统（HDFS）和MapReduce编程模型；Hadoop是一个开源的分布式计算框架，旨在帮助用户在不了解分布式底层细节的情况下，开发分布式程序。它通过利用集群的力量，提供高速运算和存储能力，特别适合处理超大数据集的应用程序。Hadoop生态圈Hadoop生态圈是一个由多个基于Hadoop开发的相
Hadoop、HDFS、Hive、Hbase区别及联系静心观复大数据 hadoop hdfs hive
Hadoop、HDFS、Hive和HBase是大数据生态系统中的关键组件，它们都是由Apache软件基金会管理的开源项目。下面将深入解析它们之间的区别和联系。HadoopHadoop是一个开源的分布式计算框架，它允许用户在普通硬件上构建可靠、可伸缩的分布式系统。Hadoop通常指的是整个生态系统，包括HadoopCommon（共享库和工具）、HadoopDistributedFileSystem(
Redis 的常见问题及解决方案云起川南 Redis redis 数据库缓存
1、性能问题：当Redis负载过高时，可能会出现性能下降的情况。这可能是由于大量的并发访问、数据量过大或复杂的操作导致的。解决方案：优化数据结构的使用，避免使用过于复杂的操作。考虑使用分布式Redis架构行水平扩展，分担负载。还可以对Redis进行性能监控和调优，如调整内存参数、优化key的设计等。2、数据一致性问题：在分布式系统中，Redis可能面临数据一致性的挑战，例如在多个Redis节点之间
大数据(1)-hdfs&hbase viperrrrrrr 大数据 hdfs hbase
hbase&hdfs一、体系结构HDFS是一个标准的主从(Master/Slave)体系结构的分布式系统；HDFS集群包含一个或多个NameNode(NameNodeHA会有多个NameNode)和多个DataNode(根据节点情况规划),用户可以通过HDFS客户端同NameNode和DataNode进行交互以访问文件系统。HDFS公开文件系统名称空间，并允许将用户数据存储在文件中。在内部，一个文
AI人工智能代理工作流AI Agent WorkFlow：高并发场景下AI代理的性能调优 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：高并发场景下AI代理的性能调优关键词：AI代理，工作流，性能调优，高并发，分布式系统，资源管理，负载均衡1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，AI代理（AIAgents）在各个领域的应用越来越广泛。AI代理作为自动化、智能化的执行实体，能够模拟人类智能行为，完成复杂的任务。在高并发场景下，例如在线服务、金融服务、智能城市等，A
探秘阿里云Tablestore：大数据存储与查询的神器云资源服务商阿里云大数据云计算
一、引言在大数据时代，数据量呈爆炸式增长，数据类型也日益丰富多样，这对数据库技术提出了前所未有的挑战。传统的关系型数据库在应对海量数据存储、高并发读写以及复杂数据分析时，往往显得力不从心，难以满足企业日益增长的业务需求。为了解决这些问题，各种新型数据库技术应运而生，阿里云Tablestore便是其中的佼佼者。阿里云Tablestore是一款构建在阿里云飞天分布式系统之上的分布式NoSQL数据存储服
ZooKeeper应用场景和实现方案详解：从分布式协调到微服务架构的全场景实践一切皆有迹可循微服务注册中心分布式技术分布式架构 zookeeper 后端云原生微服务 java
前言在分布式系统中，协调与一致性是构建可靠服务的核心挑战。ApacheZooKeeper作为高性能分布式协调服务，提供了一套通用的分布式原语，被广泛应用于服务注册发现、分布式锁、配置管理等关键场景。本文将深入解析ZooKeeper的典型应用场景，结合具体代码示例展示实现方案，帮助开发者快速掌握其核心用法。一、服务注册与发现：构建弹性微服务架构1.1场景需求微服务架构中，服务实例动态上下线，需要一个
利用分布式锁在ASP.NET Core中实现防抖 yi念zhi间 aspnetcore 防抖分布式锁
前言在Web应用开发过程中，防抖（Debounce）是确保同一操作在短时间内不会被重复触发的一种有效手段。常见的场景包括防止用户在短时间内重复提交表单，或者避免多次点击按钮导致后台服务执行多次相同的操作。无论在单机环境中，还是在分布式系统中都有一些场景需要使用它。本文将介绍如何在ASP.NETCore中通过使用锁的方式来实现防抖，从而保证无论在单个或多实例部署的情况下都能有效避免重复操作。分布式锁
RabbitMQ是一个开源的消息代理和队列服务器大霸王龙 python rabbitmq 开源服务器
RabbitMQ是一个开源的消息代理和队列服务器，它基于AMQP（AdvancedMessageQueuingProtocol，高级消息队列协议）协议实现，同时也支持其他消息协议如STOMP、MQTT等。作为一个可靠的消息传递服务，RabbitMQ在分布式系统中广泛应用于异步处理、应用解耦、流量控制等场景。以下是对RabbitMQ的详细介绍，内容字数控制在3000字以内。一、RabbitMQ的基本
服务导向架构：SOA深入指南与实践夏勇兴
本文还有配套的精品资源，点击获取简介：服务导向架构（SOA）是一种面向服务的分布式系统设计方法论。本书深入剖析了SOA的核心概念、设计原则、实现技术和面临的挑战。涵盖服务、接口、注册、通信协议和治理机制，同时讨论了设计时需遵循的松耦合、自治性、可重用、互操作性和业务驱动原则。实现技术包含Web服务、ESB、消息队列、微服务架构、API管理和服务编排等。本书也探索了SOA带来的灵活性、集成性、重用性
微服务之间的调用方式总结 lanbing 微服务微服务架构云原生
微服务架构是一种将一个单一应用程序划分为多个小型、独立服务的设计模式，每个服务运行在自己的进程中，并通过轻量级通信机制（通常是HTTP或消息队列）进行交互。微服务之间的调用是构建分布式系统的关键部分，常见的调用方式包括以下几种：一、同步调用（SynchronousCommunication）1.HTTP/REST使用标准的HTTP协议和RESTful风格进行服务间通信。使用JSON/XML传输数据
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb