李昊翔的博客

探讨分布式事务的解决方案

分布式事务常用的解决方案有几种呢？大概四种吧，这让我想起鲁迅先生的一篇著名短篇小说《孔乙己》。

在《孔乙己》的故事中，孔乙己因为会写四种不同的“回”字而自豪，是不是也和今天我知道分布式事务常用的解决方案有四种一样呢？

我想，还是有不同吧。

孔乙己会写四种不同的“回”字只能用来考试。

而学习分布式事务常用的解决方案，除了考试以外，还能在实际工作中用到，并且通过这些技术来开发出更强大的系统，让更多的人受益。

书归正传

常用的四种基于分布式事务

两段提交协议（2PC，Two-Phase Commit）：
- 2PC 是一种经典的分布式事务协议。它通过协调者（通常是一个事务管理器）来保证事务的一致性。2PC 分为两个阶段：
  - 准备阶段：协调者询问所有参与者是否准备好提交事务。
  - 提交阶段：如果所有参与者都准备好，则提交事务；否则，回滚事务。
- 缺点：2PC 在遇到网络故障或节点崩溃时可能导致数据不一致，且没有回滚机制，因此不适用于高并发的场景。
三段提交协议（3PC，Three-Phase Commit）：
- 3PC 是对 2PC 的改进，通过引入一个中间阶段，降低了部分失败情况下的阻塞问题。
  - 准备阶段：协调者询问所有参与者是否准备好提交事务。
  - 预提交阶段：参与者确认准备好并进入预提交状态。
  - 提交阶段：如果所有参与者都确认预提交，则协调者提交事务。
- 优点：相比 2PC，3PC 增强了容错性，但依然存在网络分区问题。
最终一致性（Eventual Consistency）：
- 在某些场景中，分布式事务的目标不是立即一致性，而是通过一段时间内的异步操作，最终达到一致性。这种模式通常适用于大规模分布式系统，如微服务架构中的事件驱动架构。
- 优点：允许系统在短时间内处于不一致的状态，但通过后台补偿机制和重试机制最终达到一致。
- 缺点：在某些应用场景中，这种最终一致性可能会导致短期内的数据不一致，可能影响用户体验。
补偿事务（Saga模式）：
- Saga 模式通过将一个大的分布式事务拆分成多个子事务，每个子事务都在独立的服务中执行。当一个子事务失败时，通过执行补偿操作来回滚之前成功执行的事务，从而保证系统的最终一致性。
- 分为两种类型：
  - 编排式 Saga：由一个中央协调者来控制事务的流程，负责决定每个步骤的执行。
  - 微服务式 Saga：每个服务自主执行，彼此间通过消息传递来通知。
- 优点：不会阻塞系统，适用于长事务，可以高效地处理大量的分布式事务。
- 缺点：设计和实现较为复杂，补偿操作可能增加开发负担。

2PC 协议详细说明

2PC 协议是分布式事务中的一种经典协议，旨在保证分布式系统中各参与节点的一致性。它分为两个阶段：准备阶段和提交阶段。虽然2PC在很多场景下能确保事务的一致性，但在遇到网络故障或节点崩溃时，可能会导致数据不一致。

1. 2PC 协议的基本流程

第一阶段（准备阶段）：
- 协调者向所有参与者发出请求，询问它们是否准备好提交事务。
- 每个参与者要么提交事务（答应准备好），要么因某些原因拒绝事务（返回“拒绝”）。
第二阶段（提交阶段）：
- 如果所有参与者都同意提交事务，协调者会向各个参与者发送“提交”命令。
- 如果有任何一个参与者拒绝提交，协调者则会发送“回滚”命令。

2. 发生网络故障或节点崩溃时可能出现的问题

2.1 协调者崩溃

如果协调者（事务管理器）在准备阶段或提交阶段崩溃，会导致所有参与者不知道事务是否应该提交或回滚。
具体情形：
- 假设协调者在准备阶段询问所有参与者是否准备好提交，但在收到部分参与者的响应后崩溃。
- 由于协调者没有完成提交或回滚的决策，参与者不知道该执行提交操作还是回滚操作。它们必须等待协调者重新启动并告知决策，这可能导致事务长时间挂起，甚至最终无法恢复。
问题总结：由于协调者的崩溃，参与者无法知道事务的最终决定，可能导致事务卡住，甚至出现不一致。

2.2 参与者崩溃

如果某个参与者在准备阶段崩溃，它可能没有机会响应协调者的请求，也没有机会完成事务的提交或回滚。
如果参与者在提交阶段崩溃，可能已经接受了提交请求，但由于没有返回确认消息，协调者不知道事务是否已经成功提交。
具体情形：
- 假设参与者在准备阶段回答了“准备提交”，但在收到提交命令之前崩溃。恢复后，参与者不知道该做什么，是继续提交，还是回滚。此时，协调者可能已经提交了事务，但这个参与者仍然处于未知状态。
问题总结：由于参与者的崩溃，它的状态变得不明确，这会导致事务的不一致。

2.3 网络分区

如果在准备阶段或提交阶段，网络出现分区，导致某些参与者与协调者失去联系，但其他参与者仍然与协调者保持通信，那么会出现部分参与者提交，部分参与者回滚的情况。
具体情形：
- 假设在准备阶段，某些参与者收到协调者的“准备提交”请求并回复，但网络故障导致协调者未能接收到部分参与者的回复。
- 如果协调者此时崩溃或无法与未接收到回复的参与者恢复连接，它可能会做出错误的决定（例如，提交或回滚），导致系统处于不一致状态。
问题总结：网络分区导致部分参与者无法正常通信，协调者不能获得全体参与者的状态信息，最终可能导致事务不一致。

3. 没有回滚机制的问题

2PC 协议的一个关键问题是它没有提供自动回滚机制。回滚只能在协调者收到所有参与者的失败反馈后触发。
如果参与者在准备阶段同意提交，但在事务提交前崩溃，协调者不能主动决定如何回滚已提交的事务。
具体情形：
- 假设一个参与者在准备阶段答应提交，之后由于某些原因崩溃，未能收到提交命令。协调者可能会继续等待，直到恢复后才知道状态，但此时可能已经出现部分提交或状态不一致的问题。即使协调者回滚事务，也无法完全撤销已提交的部分操作。

4. 总结：为什么 2PC 不适用于高并发场景

阻塞问题：在 2PC 中，如果有任何节点发生故障，所有其他节点都将被阻塞，直到协调者恢复并做出决定。这种等待可能会影响系统的响应时间，导致系统整体性能下降，尤其在高并发场景中，这种阻塞效应更加明显。
长时间持锁：为了确保事务的一致性，2PC 协议可能导致锁长时间占用，尤其是在网络不稳定或故障恢复时，参与者或协调者的长时间等待会严重影响系统的吞吐量和响应速度。
一致性问题：由于节点崩溃或网络故障，系统可能进入不一致状态，且很难在没有额外的机制（如重试、补偿等）的情况下恢复。

因此，2PC 协议适用于网络稳定和事务量较少的场景，而在高并发、长事务或网络不稳定的环境下，使用 2PC 协议可能导致性能瓶颈和数据不一致。

为什么三段提交协议优于二段提交协议？

“三段提交协议”的好处包括：

提高系统可靠性：通过三阶段的过程（准备阶段、提交阶段、确认阶段），协议确保每个参与节点都可以在操作过程中确认是否可以安全地提交数据，避免了因为部分节点失败而导致的系统状态不一致的问题。
避免数据丢失：三段提交协议通过预先的“准备”阶段确认所有参与者都能接受事务操作，从而避免了在事务提交过程中因为网络或节点故障导致的数据丢失，确保了数据的一致性。
减少分布式事务中的不一致性：在传统的两段提交协议中，如果在提交操作过程中发生故障，可能会导致部分节点提交了事务，而另一些节点没有提交，造成系统的数据不一致。而三段提交协议通过增加一个“确认”阶段，确保只有在所有节点都确认事务能够安全提交后，才会最终执行提交操作，减少了不一致的风险。
更好地处理节点故障：通过三阶段的过程，如果一个节点发生故障，它可以通过“准备”阶段的投票机制及时发现问题并采取适当的补救措施，例如回滚事务或等待故障恢复，避免了事务被错误地提交到不完整或损坏的数据上。
支持长时间事务：三段提交协议支持跨多个节点的长时间事务，确保即使某个节点需要更长时间进行处理，整个事务也能保持一致性并按照预定规则完成。
灵活的事务管理：三段提交协议增加了事务的灵活性，参与节点可以在不同阶段做出决策，允许系统根据不同条件进行调整和优化，进一步提升了系统的健壮性和容错能力。

为什么淘宝可以使用最终一致性而不怕订单不一致？

高可用性和容错设计：淘宝作为一个全球范围的大型电商平台，需要应对海量的并发请求、网络延迟和潜在的节点故障。如果在每次用户下单、支付等操作时都要求强一致性（即每个操作后立刻同步到所有节点），那么即使是网络延迟或节点故障都会导致系统性能下降，影响用户体验。因此，淘宝采用了最终一致性，允许在短时间内存在数据不一致，待系统恢复后，最终会通过后台同步机制确保一致性。
分布式事务和补偿机制：订单的操作涉及多个服务和系统模块，例如库存管理、支付、物流等。淘宝通过分布式事务来保证这些操作的最终一致性。例如，系统可能会在库存和订单管理服务之间使用异步消息、队列等技术进行通信，这样在某些情况下如果系统出现故障，仍能通过补偿机制保证事务的最终一致性。补偿机制的核心是在系统恢复后，根据历史记录和操作日志进行回滚或重试，保证订单数据的一致性。
乐观锁与库存管理：在淘宝等电商平台中，库存管理是一个非常关键的部分。为了防止库存出现超卖（即多个用户同时购买同一件商品），淘宝使用了乐观锁等技术。在这种情况下，订单创建时，系统会检查库存的状态，并在确认库存足够时创建订单。如果库存不足，系统会通过消息通知用户无法完成购买，避免产生不一致的订单。即使在某些情况下库存状态没有立即同步，最终一致性保证了库存和订单信息最终达成一致。
订单状态和幂等性设计：淘宝的订单处理系统中采用了幂等性设计，确保同一订单不会因为重复提交而导致数据不一致。即使在网络波动、请求重试的情况下，系统也能保证每个操作只执行一次，并且结果是唯一的，避免了订单重复或状态错乱的情况。
异步更新与最终一致性：例如，当用户下单后，淘宝系统可能会通过异步的方式更新订单状态、发送确认邮件、通知相关部门等。这种异步操作允许系统高效地处理大量请求，而不需要等待所有操作同步完成。这种方式可能导致订单状态在短时间内不同步，但最终通过后台同步或其他一致性机制，确保数据在所有系统间一致。
库存超卖和订单一致性保障：淘宝等平台通常会使用 分布式锁 或 消息队列 来防止多次购买同一商品的冲突。例如，当用户支付订单时，系统会先通过分布式锁检查库存，然后再更新库存和订单信息。即使在高并发的情况下，系统也能够通过这些机制保证库存不会超卖，并且最终订单和库存信息会保持一致。

什么是补偿事务？

补偿事务是一种用于保证分布式系统中最终一致性的技术。它并不是传统的回滚操作（如ACID事务中的回滚），而是在出现异常时，通过执行与某个操作相反的操作来恢复系统的一致性。例如，在订单支付失败后，可以通过补偿事务来取消订单或释放库存，从而保证系统数据的一致性。

淘宝如何使用补偿事务？

淘宝等平台采用分布式架构，多个微服务间需要进行协作以完成一个完整的业务流程，例如订单生成、支付、库存扣减、物流派送等。这些业务涉及到多个服务和数据库，因此采用传统的单机事务（ACID）模式并不现实，尤其是在高并发、分布式环境下。

分布式事务处理：淘宝通过采用类似 Saga 模式（分布式事务的处理方式）来管理跨服务的业务流程。Saga 模式将一个大事务分解为多个小事务，每个小事务完成后，都有一个补偿事务（rollback action）。如果某个步骤失败，系统会执行对应的补偿操作，确保数据的一致性。

例如：
- 用户下单 → 订单服务创建订单
- 用户支付 → 支付服务确认支付
- 库存扣减 → 库存服务更新库存如果支付成功，但库存扣减失败，系统会通过补偿事务取消订单，释放库存，确保系统的数据一致性。
补偿事务的设计：在淘宝的系统设计中，补偿事务通常用于以下几种场景：
- 支付失败：如果用户支付成功，但库存服务由于某些原因无法扣减库存，则通过补偿事务进行回滚，取消订单或者释放库存，避免出现“超卖”问题。
- 库存问题：如果订单已经创建，但在进行库存扣减时发生了错误，补偿事务会撤销创建的订单，并恢复库存。
- 订单取消：如果用户选择取消订单，而订单已经进入后续处理流程（如支付、物流），系统会执行补偿事务，恢复订单的状态，防止数据不一致。
幂等性：补偿事务的实现需要结合幂等性设计，即相同的操作不会被重复执行导致数据异常。比如，支付服务在用户重复支付请求时，通过幂等性设计保证每次支付请求只会执行一次，避免出现支付失败后再次提交支付造成的问题。
消息队列与异步处理：淘宝利用消息队列（如 Kafka）等异步机制处理跨服务的事务，消息传递过程中若某些服务未能正常处理消息，系统会通过补偿事务进行恢复，确保数据最终一致。

补偿事务的优势

高可用性：补偿事务允许系统在部分服务失败时，依然保持高可用性，避免因为一个小故障导致整个系统的停滞。
可靠性：通过补偿机制，淘宝能够确保在系统发生故障后，能够采取相应的操作恢复系统一致性，避免出现订单重复、库存超卖等问题。
性能和扩展性：使用补偿事务与异步消息队列等机制，淘宝能够处理高并发的用户请求，避免因为事务锁的等待导致性能瓶颈。每个子任务的操作可以异步处理，并在失败时通过补偿恢复。

系统架构设计师论文分享-论软件过程模型及应用码农卿哥系统架构设计师系统架构
我的软考历程摘要2023年2月，我所在的公司通过了研发纱线MES系统的立项，该系统为国内纱线工厂提供SAAS服务，旨在提升纱线工厂的数字化和智能化水平。我在该项目中担任架构设计师，负责该项目的架构设计工作。本文结合我在该项目中的实践，详细论述了常见的软件开发模式如瀑布模型、原型模型、螺旋模式等，本项目采用了瀑布模型和原型模型结合的方式，把项目周期分成了需求分析、系统设计、程序设计、编码实现和测试验
系统架构设计师论文分享-论软件脆弱性分析码农卿哥系统架构设计师系统架构
我的软考历程摘要2023年2月，我所在的公司做了开发纱线MES系统的决定，该系统为国内纱线工厂提供SAAS服务，旨在提高纱线工厂的智能化和数字化水平。我在该项目中被任命为系统架构设计师，全面掌管该项目的架构设计工作。本文将结合我在该项目中的架构设计工作经验，详细论述了不同软件架构脆弱性的问题以及解决方案。常见的软件架构有层次型架构、MVC架构、微服务架构、单体架构等等，比如，层次型架构的脆弱性表现
构建企业级提示词管理平台 AI人工智能与大数据 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
构建企业级提示词管理平台关键词：提示词管理平台、企业级、数据处理、用户交互、系统架构设计摘要：本文将详细探讨如何构建企业级提示词管理平台。我们将从问题背景出发，逐步深入分析核心概念、算法原理、系统设计与项目实战，提供一套完整的解决方案。1.背景介绍1.1问题背景在现代企业中，提示词作为一种重要的信息传递工具，广泛应用于客户服务、市场营销和内部沟通等多个领域。然而，随着数据量的爆炸式增长和业务场景的
为什么选择YashanDB作为您的数据存储解决方案？数据库
在现代数据库管理中，如何在保持快速查询响应并确保数据一致性的基础上，有效管理海量数据，成为许多企业面临的挑战。优化查询性能、加速数据处理流程、确保高可用性和数据安全是数据库技术的关键需求。YashanDB作为一种新兴的数据库解决方案，以其灵活的架构和强大的性能优化能力，逐渐被视为满足这一需求的理想选择。领先的体系架构YashanDB的体系架构灵活且高效，支持单机部署、共享集群部署以及分布式集群部署
企业如何使用YashanDB实现数据资产最大化？数据库
在当今数字化时代，企业面临着海量数据的管理与利用挑战，如何优化数据查询速度以提升业务响应效率成为关键问题。查询速度直接影响数据驱动决策的时效性和准确性，进而关系到企业竞争力的提升。本文将基于先进数据库技术，探讨企业如何利用YashanDB的核心架构、存储引擎与优化机制，最大化数据资产的价值。YashanDB的部署架构与灵活应用YashanDB支持三种部署形态：单机部署、分布式集群部署及共享集群部署
企业如何根据业务需求调整YashanDB数据库配置数据库
在企业中，数据库的性能直接影响到应用的运行效率和用户体验。尤其是随着业务需求的变化，如何根据不同的业务需求及时调整YashanDB的数据库配置便显得尤为重要。本文将探讨YashanDB数据库配置的优化方向，阐明其必要性，并提供具体的可操作性建议。部署架构选择YashanDB支持多种部署形态，包括单机（主备）部署、分布式集群部署和共享集群部署。根据企业的具体需求，可以选择不同的部署架构。单机部署适用
RabbitMQ是一个开源的消息代理和队列服务器大霸王龙 python rabbitmq 开源服务器
RabbitMQ是一个开源的消息代理和队列服务器，它基于AMQP（AdvancedMessageQueuingProtocol，高级消息队列协议）协议实现，同时也支持其他消息协议如STOMP、MQTT等。作为一个可靠的消息传递服务，RabbitMQ在分布式系统中广泛应用于异步处理、应用解耦、流量控制等场景。以下是对RabbitMQ的详细介绍，内容字数控制在3000字以内。一、RabbitMQ的基本
【AI Infra】基础学习汇总篇逆羽飘扬 AI基础知识人工智能学习
系列综述：目的：本系列是个人整理为了学习训练框架优化的，整理期间苛求每个知识点，平衡理解简易度与深入程度。来源：材料主要源于【DeepEP官方介绍】进行的，每个知识点的修正和深入主要参考各平台大佬的文章，其中也可能含有少量的个人实验自证。结语：如果有帮到你的地方，就点个赞和关注一下呗，谢谢！！！请先收藏！！！，后续继续完善和扩充(●’◡’●)文章目录一、分布式与并行基础分布式计算高性能并行GPU硬
从 TCP/IP 协议栈角度深入分析网络文件系统 (NFS)
一、引言：NFS与TCP/IP的关系概述网络文件系统(NetworkFileSystem,NFS)是一种分布式文件系统协议，允许客户端通过网络访问远程服务器上的文件系统，就像访问本地文件系统一样。NFS是SunMicrosystems在20世纪80年代开发的，旨在提供一种透明的、与平台无关的文件共享机制。从设计理念来看，NFS的核心目标是"消除本地文件和远程文件之间的区别"，使用户能够像操作本地文
AutoGen行业应用与典型场景实践
摘要AutoGen作为分布式多智能体AI系统，已在金融、医疗、教育、智能客服等行业落地应用。本文系统梳理AutoGen在各行业的应用模式、业务流程、Python实战、最佳实践与常见问题，助力中国AI开发者高效构建行业级AI解决方案。1.AutoGen行业应用全景与价值支持多智能体协作，适配复杂业务流程易于集成主流大模型与行业工具分布式部署，满足高可用与弹性扩展需求典型行业：金融风控、医疗问答、教育
音视频会议服务搭建(设计方案)-01 卜锦元音视频webrtc golang 流媒体websocket 音视频
前言最近在做音视频会议系统服务搭建的工作任务，因为内容过多，我会逐篇分享相关的设计方案、开发思路、编程语言、使用的组件集合等等。如果你也有大型音视频会议系统搭建架构的需求，希望这些可以对你有所帮助。EchoMeet音视频会议系统架构设计项目概述EchoMeet是基于WebRTC技术的企业级音视频会议解决方案，采用三层音视频架构和Go+Node.js双后端微服务设计，实现了高并发、低延迟、可扩展的视
音视频会议服务搭建(设计方案-两种集成方案对比)-03 卜锦元流媒体websocket 音视频webrtc golang 音视频 go node.js webrtc c++redis mysql
前言在开始计划之前，查阅了不少资料。一种方案是Go层做信令业务，nodejs层来管理和mediasoup的底层交互，通过客户端去调用Go层；第二种方案是客户端直接调用nodejs层来跟mediasoup去交互；最终，当然不出意料的选择了项目复杂的构建方案，为性能去考虑。EchoMeet架构方案对比分析1.两种架构方案概览方案A：Go+Node.js双系统架构（当前方案）前端Vue3+mediaso
为什么YashanDB数据库是大数据处理的理想选择？数据库
在当今大数据时代，如何高效管理和处理海量数据成为了许多企业的首要挑战。针对这一问题，选择合适的数据库系统至关重要。尤其是在大数据场景中，诸如数据存储、数据访问效率和并发控制等技术要求提高，给数据库的选择带来了更高的标准。YashanDB作为一款高性能数据库，以其独特的架构设计与一系列优秀的功能，成为大数据处理的理想选择。高度可扩展的部署架构YashanDB支持多种部署形态，包括单机部署、分布式集群
企业如何选择合适的YashanDB数据库部署策略数据库
在当今数据驱动的商业环境中，企业面临着多种数据库技术选择，如何满足对性能、可用性和扩展性的高要求成为了一项重要挑战。尤其是在高并发、高可用性和性能优化等方面，企业必须在数种数据库部署策略中做出明智选择。YashanDB作为一款高性能数据库，提供了多种部署选项，如单机部署、分布式集群部署和共享集群部署。本文将深入分析这些部署策略的技术原理及其适用场景，帮助企业根据自身需求选择最合适的YashanDB
企业如何利用YashanDB提升系统稳定性数据库
在现代多变的商业环境中，企业面临着信息处理能力的诸多挑战，如系统崩溃、数据丢失等。为应对这些挑战，提升数据库系统的稳定性显得尤为重要。YashanDB作为一款先进的分布式数据库，凭借其独特的架构和技术特性，能够为企业提供更为可靠的系统稳定性保障。本文将深入分析YashanDB提升系统稳定性的核心技术点及其优势。核心技术点高可用性架构YashanDB支持多种部署模式，如单机主备部署、分布式集群部署以
从用户需求出发设计YashanDB数据库的架构数据库
在现代应用中，性能和可扩展性是数据库设计中至关重要的指标。随着数据量的增加，如何在保持高性能的前提下支持复杂的查询需求，已经成为数据库产业面临的一大难题。因此，当前迫切需要一种灵活和高效的数据库架构，能适应变动的用户需求，同时提供良好的业务连续性和可靠性。YashanDB的体系架构部署架构YashanDB支持三种主要的部署架构，包括单机部署、分布式集群部署和共享集群部署。单机部署：适用于小型应用和
从入门到精通：YashanDB数据库学习指南数据库
在现代的数据库技术领域，性能瓶颈和数据一致性问题是开发人员和数据库管理员（DBA）面临的重要挑战。随着数据量的激增和对实时分析的需求上升，如何有效管理和利用数据库显得尤为重要。YashanDB作为一款新兴数据库，提供了一系列功能以应对这些挑战，适合希望深入理解数据库体系结构的开发者和DBA。本文旨在提供一份全面的YashanDB学习指南，内容涵盖系统架构、核心功能，并为实际应用提供具体建议，使读者
大规模分布式数据库读写分离架构：一致性、可用性与性能的权衡实践
目录1引言：数据库架构的核心三角2原创架构设计2.1读写分离系统架构2.2读写核心流程3企业级实现代码3.1Python路由服务核心代码3.2TypeScript复制状态监控3.3Kubernetes部署YAML示例4性能对比量化分析5生产级部署与安全方案5.1高可用部署架构5.2安全审计方案6技术前瞻性分析6.1演进路线图6.2关键趋势解读7附录：完整技术图谱结论1引言：数据库架构的核心三角在大
Redis 详细介绍骑牛小道士 redis 数据库缓存
RedisRedis是什么为什么要用RedisRedis的持久化Redis数据共享分布式Redis缓存的安全性保证(分布式锁)Redis的部署模式分类Redis的全局IDRedisTemplate常用方法Redis的应用Redis在消息队列中应用方式一：基于List的队列方式二：Redis发布/订阅(Pub/Sub)模式Redis发布消息Redis订阅消息（配置监听器）方式三：基于Streams的
自动上报数据报表方案和实施避坑指南 Alex艾力的IT数字空间 java intellij-idea spring boot 数据库架构架构小程序集成测试
一、方案设计系统架构设计采用分层架构：数据采集层→数据处理层→报表生成层→分发展示层（参考数据采集流程&系统架构设计）核心模块组成自动化采集模块（API/数据库/文件接口）智能清洗转换模块（数据治理规则引擎）可视化报表生成模块（模板引擎+动态计算）定时调度与监控模块（任务队列+异常预警）二、实施阶段1：需求分析与规划业务需求确认确定报表类型（日报/周报/月报）识别关键指标（销售额、库存周转率等）明
将代码上传到 GitHub 的详细步骤纸鸢666 github github
简介在当今的软件开发世界中，GitHub是一个不可或缺的协作平台。无论是开源项目还是团队内部开发，掌握将代码上传到GitHub的技能都是至关重要的。本文将详细讲解使用命令行将代码上传到GitHub的步骤。前提准备在开始之前，你需要确保以下事项：安装Git首先，你需要在你的计算机上安装Git。Git是一个分布式版本控制系统，它允许你对代码的每一次更改进行跟踪和管理。你可以根据你的操作系统，从Gith
服务导向架构：SOA深入指南与实践夏勇兴
本文还有配套的精品资源，点击获取简介：服务导向架构（SOA）是一种面向服务的分布式系统设计方法论。本书深入剖析了SOA的核心概念、设计原则、实现技术和面临的挑战。涵盖服务、接口、注册、通信协议和治理机制，同时讨论了设计时需遵循的松耦合、自治性、可重用、互操作性和业务驱动原则。实现技术包含Web服务、ESB、消息队列、微服务架构、API管理和服务编排等。本书也探索了SOA带来的灵活性、集成性、重用性
Rust与Locust集成实战 KENYCHEN奉孝 Rust go python实践大全 python rust 测试工具
Rust与Locust集成实例Rust与Locust的集成通常涉及使用Rust编写高性能的负载测试逻辑，并通过Locust框架进行分布式测试和结果分析，实际应用场景的示例。基础HTTP请求测试使用Rust编写HTTP请求逻辑，通过Locust模拟高并发场景：usereqwest::blocking::Client;pubfnmake_http_request(url:&str)->Result{l
【架构基础】什么是系统架构？
系统架构（信息系统架构，InformationSystemArchitecture，ISA）是信息系统整体结构的高层抽象描述，它定义了系统的核心组件、组件间的交互方式、数据流动路径、技术选择以及设计原则，以支持业务目标的实现。系统架构不仅关注技术实现，还涉及业务、组织、流程等多个维度，是连接业务需求与技术实现的桥梁。核心要素：业务组件：支持业务流程的模块或服务（如用户管理、订单处理）。技术组件：实
MapReduce分布式计算框架：从原理到实战 AI妈妈手把手 mapreduce 前端大数据分布式计算 python 人工智能
大家好！今天我们来聊聊大数据处理领域的一个重要框架——MapReduce。作为Google提出的经典分布式计算模型，MapReduce极大地简化了海量数据的处理流程。无论你是大数据新手还是有一定经验的开发者，这篇文章都会让你对MapReduce有更深入的理解。我们还会通过实际代码示例来展示它的强大功能！一、MapReduce是什么？想象你有一个装满10亿本书的图书馆，现在需要统计所有书中"大数据"
【字节跳动】数据挖掘面试题0003：有一个文件，每一行是一个数字，如何用 MapReduce 进行排序和求每个用户每个页面停留时间
MapReduce是一种适合处理大规模数据的分布式计算框架，其核心思想是将计算任务分解为Map（映射）和Reduce（归约）两个阶段。对文件中的数字进行排序，可以利用MapReduce的特性来实现。要使用MapReduce对文件中的数字进行排序，需要实现一个MapReduce作业，将数字作为键处理，利用Hadoop的默认排序机制对键进行排序。以下是实现步骤和示例代码：文章大纲题目一：有一个文件，每
Jupiter项目版本演进与技术架构深度解析齐飞锴Timothea
Jupiter项目版本演进与技术架构深度解析JupiterJupiter是一款性能非常不错的,轻量级的分布式服务框架项目地址:https://gitcode.com/gh_mirrors/jup/Jupiter项目概述Jupiter是一个高性能的分布式服务框架，专注于提供稳定可靠的RPC通信能力。从版本迭代历史可以看出，该项目在性能优化、功能完善和稳定性提升方面持续演进。本文将深入分析Jupite
微服务之间的调用方式总结 lanbing 微服务微服务架构云原生
微服务架构是一种将一个单一应用程序划分为多个小型、独立服务的设计模式，每个服务运行在自己的进程中，并通过轻量级通信机制（通常是HTTP或消息队列）进行交互。微服务之间的调用是构建分布式系统的关键部分，常见的调用方式包括以下几种：一、同步调用（SynchronousCommunication）1.HTTP/REST使用标准的HTTP协议和RESTful风格进行服务间通信。使用JSON/XML传输数据
Python, C ++,C #开发全球英才阐教版集结令APP Geeker-2025 python c++c语言
以下是为使用**Python、C++和C#**开发**全球英才(阐教版)集结令APP**的深度技术方案，融合三语言优势构建跨平台、高智能的玄门英才聚合系统：---###一、系统架构设计```mermaidgraphTDA[多端客户端]-->B{C#阐道引擎}B-->C[C++玄法核心]C-->D[Python慧识层]D-->E[AI英才匹配]C-->F[天机推演]B-->G[三界通信]G-->H[
Python, Rust 开发教育/医疗/文化资源去中心化分配APP Geeker-2025 python rust
以下是为教育、医疗、文化资源设计的**去中心化分配APP**的完整技术方案，结合Python的灵活性和Rust的高性能与安全性，实现公平透明的资源分配：---###系统架构设计```mermaidgraphTDA[用户终端]-->B[区块链网络]A-->C[分配引擎]B-->D[智能合约]C-->E[资源数据库]D-->F[分配记录]subgraph技术栈C-.Rust.->G[核心分配算法]D-
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &