有莘不殁

DDIA（《数据密集型应用系统设计》）的阅读随笔：第5章数据复制

DDIA这本书，其实我买的挺早，可能中文版刚出的时候我就买了，不过一直在书架上吃灰。可能屁股决定脑袋，当时刚博士毕业，从网络路由算法到AI，我更专注于去看看Machine Learning的经典充实自己的理论底蕴。然而，在工业界摸爬滚打了几年，越发感到一个好的产品不仅仅是一个团队几个精彩算法的事情，而是从需求到选型到规划到管理全方位的思考，立足于开发又不仅仅是开发。有一天，在B站看到DDIA这本书的读书会，想起在架子上的这本书，遂决定认真的去读一读这本分布式系统领域贴合工业界实践的好书。

DDIA这本书有三个部分组成，数据系统基础，分布式数据系统和派生数据。我在写这个系列随笔时候，第一部分已经读完一段时间了，不想为写笔记而写笔记，所以决定从第5章数据复制开始，这一部分也是本书开始涉及分布式系统设计的开始。其实第一部分的内容很精彩，无论是开宗明义的以一个twitter的设计切入介绍系统可靠性、可扩展性和可维护性的第一章还是接下来以数据库为核心的三章，对于数据模型、数据存储与索引以及数据编码的阐述，都有精彩之处。这里给自己插个旗，等到我下一次再次阅读这本书的时候，会补上第一部分的笔记。

文章目录

DDIA（《数据密集型应用系统设计》）的阅读随笔：第5章数据复制
前言
一、单主节点复制
- 1.主从复制
- 2.同步复制和异步复制
- 3.主从复制技术实现
- 4.复制滞后的问题与解决方案讨论
二、多主节点复制
三、无主节点复制
总结

前言

数据复制意味着在通过网络连接的多台机器上保留相同数据的副本。复制数据在系统设计上的出发点主要为：

降低延迟：使得数据与用户在地理上接近
提高可用性：即使系统的一部分出现故障，系统也能继续工作
保证吞吐量：伸缩可以接受读请求的机器数量

本章节有一个基本的假设：将假设你的数据集非常小，每台机器都可以保存整个数据集的副本。对于数据分片的问题会留在下一章进行讨论。

如果复制中的数据不会随时间而改变，那复制就很简单：将数据复制到每个节点一次就万事大吉。复制的困难之处在于处理复制数据的变更（change），这里讨论了三种流行的变更复制算法：单主节点、多主节点和无主节点。几乎所有分布式数据库都使用这三种方法之一。在此基础上，讨论了同步复制和异步复制，以及如何处理失败的副本等内容。

一、单主节点复制

1.主从复制

本章考虑的最根本问题：当存在多个副本时，如何确保所有数据都落在了所有的副本上？

每一次向数据库的写入操作都需要传播到所有副本上，否则副本就会包含不一样的数据。最常见的解决方案为主从复制。它的工作原理如下：

多个副本中的其中一个副本被指定为领导者（leader ），也称为主库（master|primary）。当客户端要向数据库写入时，它必须将请求发送给该领导者，其会将新数据写入其本地存储。
其他副本被称为追随者（followers），亦称为只读副本（read replicas）、从库（slaves）、备库（ secondaries）或热备（hot-standby）。每当领导者将新数据写入本地存储时，它也会将数据变更发送给所有的追随者，称之为复制日志（replication log）或变更流（change stream）。每个跟随者从领导者拉取日志，并相应更新其本地数据库副本，方法是按照与领导者相同的处理顺序来进行所有写入。
当客户想要从数据库中读取数据时，它可以向领导者或任一追随者进行查询。但只有领导者才能接受写入操作（从客户端的角度来看从库都是只读的）。

现在主从复制，基本上在关系数据库，如mysql, postgre 以及nosql，如mong DB, redis,Espresso等都已经是基本的内置配置。但是深入到具体的实习机制，其实还是有一些差异。mysql 的binlog的方式可能是一种经典的主从复制的方案，值得去仔细体会。

2.同步复制和异步复制

复制系统的一个重要细节是：复制是同步（synchronously）发生的还是异步（asynchronously）发生的。这里结合书里的一个图去说明。

上图表达的场景是，网站的用户更新他们的个人头像。在某个时间点，客户向主库发送更新请求；不久之后主库就收到了请求。在某个时间点，主库又会将数据变更转发给自己的从库。最终，主库通知客户更新成功。
从库 1 的复制是同步的：在向用户报告写入成功并使结果对其他用户可见之前，主库需要等待从库 1 的确认，确保从库 1 已经收到写入操作。而从库 2 的复制是异步的：主库发送消息，但不等待该从库的响应。

同步复制的优点是，从库能保证有与主库一致的最新数据副本。如果主库突然失效，我们可以确信这些数据仍然能在从库上找到。缺点是，如果同步从库没有响应（比如它已经崩溃，或者出现网络故障，或其它任何原因），主库就无法处理写入操作。主库必须阻止所有写入，并等待同步副本再次可用。因此，将所有从库都设置为同步的是不切实际的：任何一个节点的中断都会导致整个系统停滞不前。
实际上，如果在数据库上启用同步复制，通常意味着其中一个从库是同步的，而其他的从库则是异步的。如果该同步从库变得不可用或缓慢，则将一个异步从库改为同步运行。这保证你至少在两个节点上拥有最新的数据副本：主库和同步从库。这种配置有时也被称为半同步（semi-synchronous）。
通常情况下，基于领导者的复制都配置为完全异步。在这种情况下，如果主库失效且不可恢复，则任何尚未复制给从库的写入都会丢失。这意味着即使已经向客户端确认成功，写入也不能保证是持久（Durable）的。然而，一个完全异步的配置也有优点：即使所有的从库都落后了，主库也可以继续处理写入。
弱化的持久性可能听起来像是一个坏的折衷，但异步复制其实已经被广泛使用了，特别是在有很多从库的场景下，或者当从库在地理上分布很广的时候。

分布式系统的设计，很多时候就是一个折中的过程，同步复制和异步复制的讨论也是如此。异步的可用性虽然会损失一定的一致性，但在目前大部分应用追求高可用的前提下，依然是首选，毕竟同步失效带来的主库锁死写入的代价，通常是不可接受的。但是，对于这个问题，如果迁移到别的领域，比如安全性要求极高的嵌入式系统，则选择可能完全不同。

3.主从复制技术实现

基于语句的复制
主库记录下它执行的每个写入请求（语句，即 statement）并将该语句日志发送给从库。对于关系数据库来说，这意味着每个INSERT、UPDATE 或 DELETE 语句都被转发给每个从库，每个从库解析并执行该 SQL 语句，就像直接从客户端收到一样。
这个方案，似乎最为简单直接。但是书中提到了三个限制：
1）任何调用非确定性函数（nondeterministic）的语句，可能会在每个副本上生成不同的值。例如，使用 NOW() 获取当前日期时间，或使用 RAND() 获取一个随机数。
2）如果语句使用了自增列（auto increment），或者依赖于数据库中的现有数据（例如，UPDATE … WHERE <某些条件>），则必须在每个副本上按照完全相同的顺序执行它们，否则可能会产生不同的效果。当有多个并发执行的事务时，这可能成为一个限制。
3）有副作用的语句（例如：触发器、存储过程、用户定义的函数）可能会在每个副本上产生不同的副作用，除非副作用是绝对确定性的。
基于预写日志（WAL）传输
存储引擎，对于覆写单个磁盘块的 B 树，每次修改都会先写入预写式日志（Write Ahead Log, WAL），以便崩溃后索引可以恢复到一个一致的状态。该日志都是包含了所有数据库写入的仅追加字节序列。可以使用完全相同的日志在另一个节点上构建副本：除了将日志写入磁盘之外，主库还可以通过网络将其发送给从库。通过使用这个日志，从库可以构建一个与主库一模一样的数据结构拷贝。这种复制方法在 PostgreSQL 和 Oracle 等一些产品中被使用到。
其主要缺点是日志记录的数据非常底层：WAL 包含哪些磁盘块中的哪些字节发生了更改。这使复制与存储引擎紧密耦合。如果数据库将其存储格式从一个版本更改为另一个版本，通常不可能在主库和从库上运行不同版本的数据库软件。这开起来似乎问题不大，但对升级运维确实一个巨大的挑战，意味者数据库版本无法热更新，升级需要停机。
基于行的逻辑日志复制
对复制和存储引擎使用不同的日志格式，这样可以将复制日志从存储引擎的内部实现中解耦出来。这种复制日志被称为逻辑日志（logical log），以将其与存储引擎的（物理）数据表示区分开来。关系数据库的逻辑日志通常是以行的粒度来描述对数据库表的写入记录的序列：
1）对于插入的行，日志包含所有列的新值。
2）对于删除的行，日志包含足够的信息来唯一标识被删除的行，这通常是主键，但如果表上没有主键，则需要记录所有列的旧值。
3）对于更新的行，日志包含足够的信息来唯一标识被更新的行，以及所有列的新值（或至少所有已更改的列的新值）。
MySQL 的binlog就是使用了这种方法。由于逻辑日志与存储引擎的内部实现是解耦的，系统可以更容易地做到向后兼容，从而使主库和从库能够运行不同版本的数据库软件，或者甚至不同的存储引擎。
基于触发器的复制
这个思路是将复制操作上移到应用程序层。
触发器允许你将数据更改（写入事务）发生时自动执行的自定义应用程序代码注册在数据库系统中。触发器有机会将更改记录到一个单独的表中，使用外部程序读取这个表，再加上一些必要的业务逻辑，就可以将数据变更复制到另一个系统去。例如，Databus for Oracle 和 Bucardo for Postgres就是这样工作的。
基于触发器的复制通常比其他复制方法具有更高的开销，并且比数据库内置的复制更容易出错，也有很多限制。但是这种方法赢一手最佳的灵活性，所以也是很多场景值得思考的方式。

4.复制滞后的问题与解决方案讨论

当应用程序从异步从库读取时，如果从库落后，它可能会看到过时的信息。这会导致数据库中出现明显的不一致：同时对主库和从库执行相同的查询，可能得到不同的结果，因为并非所有的写入都反映在从库中。这种不一致只是一个暂时的状态 —— 如果停止写入数据库并等待一段时间，从库最终会赶上并与主库保持一致。出于这个原因，这种效应被称为最终一致性（eventual consistency）。

在正常的操作中，复制延迟（replication lag），即写入主库到反映至从库之间的延迟，可能仅仅是几分之一秒，但如果系统在接近极限的情况下运行，或网络中存在问题时，延迟可以轻而易举地超过几秒，甚至达到几分钟。因为滞后时间太长引入的不一致性，不仅仅是一个理论问题，更是应用设计中会遇到的真实问题。

目前主要的解决方法如下：

读自己的写
1）用户控制：对于用户可能修改过的内容，总是从主库读取；这就要求得有办法不通过实际的查询就可以知道用户是否修改了某些东西。举个例子，社交网络上的用户个人资料信息通常只能由用户本人编辑，而不能由其他人编辑。因此一个简单的规则就是：总是从主库读取用户自己的档案，如果要读取其他用户的档案就去从库。
2）时间控制：如果应用中的大部分内容都可能被用户编辑，那这种方法就没用了，因为大部分内容都必须从主库读取（读伸缩就没效果了）。在这种情况下可以使用其他标准来决定是否从主库读取。例如可以跟踪上次更新的时间，在上次更新后的一分钟内，从主库读。还可以监控从库的复制延迟，防止向任何滞后主库超过一分钟的从库发出查询。
3）时间戳比较：客户端可以记住最近一次写入的时间戳，系统需要确保从库在处理该用户的读取请求时，该时间戳前的变更都已经传播到了本从库中。如果当前从库不够新，则可以从另一个从库读取，或者等待从库追赶上来。这里的时间戳可以是逻辑时间戳（表示写入顺序的东西，例如日志序列号）或实际的系统时钟（在这种情况下，时钟同步变得至关重要，请参阅 “不可靠的时钟”）。
4）路由控制：如果你的副本分布在多个数据中心（为了在地理上接近用户或者出于可用性目的），还会有额外的复杂性。任何需要由主库提供服务的请求都必须路由到包含该主库的数据中心。
这里其实用户控制的实现，相对可操作性强，虽然有比较强的业务耦合性。基于时间来控制，不管是时间段还是时间戳，都会陷入另一个难题，即分布式系统的时间可靠性问题。
单调读
实现单调读的一种方式是确保每个用户总是从同一个副本进行读取（不同的用户可以从不同的副本读取）。例如，可以基于用户 ID 的散列来选择副本，而不是随机选择副本。但是，如果该副本出现故障，用户的查询将需要重新路由到另一个副本。
这主要保证的是多次查询的一致性问题，不出现时光倒流类似的情况，但不能保证当前的查询返回的是最新的结果。不过这已经是设计上一个很好的折中考虑了。
前缀一致读
这个考虑的问题和单调读类似，是希望如果一系列写入按某个顺序发生，那么任何人读取这些写入时，也会看见它们以同样的顺序出现。这是一个因果性的考虑。它的实现主要是确保任何因果相关的写入都写入相同的分区，但在一些应用中可能无法高效地完成这种操作，这就需要依赖一些显式跟踪因果依赖关系的算法。

二、多主节点复制

多主节点复制有意义的语境是在多数据中心下的。假如你有一个数据库，副本分散在好几个不同的数据中心（也许这样可以容忍单个数据中心的故障，或地理上更接近用户）。使用常规的基于但主节点的复制设置，主库必须位于其中一个数据中心，且所有写入都必须经过该数据中心。多主节点配置中可以在每个数据中心都有主库。在每个数据中心内使用常规的主从复制；在数据中心之间，每个数据中心的主库都会将其更改复制到其他数据中心的主库中。

当然这里，作者给出了两个近似的场景，也可以理解为多主节点：一种是离线客户端，即应用程序在断网之后仍然需要继续工作，另一种是多人协作编写文档，如Etherpad和Google Docs。

这个场景下最主要考虑的就是写冲突的处理。本质上写冲突其实目前并没有特别优的解决方法，书中给出的原则：处理冲突的最简单的策略就是避免它们：如果应用程序可以确保特定记录的所有写入都通过同一个主节点，那么冲突就不会发生。由于多主节点复制处理的许多实现冲突相当不好，避免冲突是一个经常推荐的方法。对于冲突合并，最实用的方案还是最后写入胜利（LWW, last write wins）。当然判定最终写入，可以依据一个唯一的ID（例如，一个时间戳，一个长的随机数，一个UUID或者一个键和值的哈希），通常挑选最高ID的写入作为胜利者，并丢弃其他写入。

三、无主节点复制

无主节点架构，最有影响力的是亚马逊的Dynamo系统，遵循该风格的数据库还有Riak，Cassandra和Voldemort等。
无主节点架构最主要的特点是允许任何副本直接接受来自客户端的写入。在一些无主节点的实现中，客户端直接将写入发送到到几个副本中，而另一些情况下，一个协调者（coordinator）节点代表客户端进行写入。但与主节点不同，协调者不执行特定的写入顺序。

一个典型的无主复制的例子如下图所示，无主节复制场景和前两两类场景最大的差异是，客户端的写和读的请求都会发送给所有允许的副本。图示示例可以看出由于副本3宕机，它没有响应User1234的写入，当User 2345读取的时候，则会出现两个版本的数据。

在Dynamo风格的数据存储中经常使用两种机制：

1）读修复（Read repair）

当客户端并行读取多个节点时，它可以检测到任何陈旧的响应。例如，在上图中，用户2345获得了来自Replica 3的版本6值和来自副本1和2的版本7值。客户端发现副本3具有陈旧值，并将新值写回复制品。这种方法适用于频繁阅读的值。

2）反熵过程（Anti-entropy process）

一些数据存储具有后台进程，该进程不断查找副本之间的数据差异，并将任何缺少的数据从一个副本复制到另一个副本。与基于主节点的复制中的复制日志不同，此反熵过程不会以任何特定的顺序复制写入，并且在复制数据之前可能会有显著的延迟。

最后讨论以下，在无主节点风格中，系统可用的读写副本数的约束（仲裁一致性）。一般地说，如果有n个副本，每个写入必须由w节点确认才能被认为是成功的，并且我们必须至少为每个读取查询r个节点。则需要满足 $w + r > n$ 。
在Dynamo风格的数据库中，参数n，w和r通常是可配置的。一个常见的选择是使n为奇数（通常为3或5）并设置 $w = r = （ n + 1 ） / 2$ （向上取整）。但是可以根据需要更改数字。例如，设置 $w = n$ 和 $r = 1$ 的写入很少且读取次数较多的工作负载可能会受益。这使得读取速度更快，但具有只有一个失败节点导致所有数据库写入失败的缺点。

当然本节的后面还有一些比较精彩的讨论，比如上述上述仲裁一致性的局限、松散仲裁原则带来的好处以及版本向量和版本时钟的讨论。这里的写冲入检测相关的讨论其实和多主节点复制的场景类似。

总结

复制可以用于几个目的：

1）高可用性：即使在一台机器（或多台机器，或整个数据中心）停机的情况下也能保持系统正常运行

2）断开连接的操作：允许应用程序在网络中断时继续工作

3）延迟：将数据放置在距离用户较近的地方，以便用户能够更快地与其交互

4）可扩展性：能够处理比单个机器更高的读取量可以通过对副本进行读取来处理

书中讨论了复制的三种主要方法：单主节点复制，多主节点复制和无主节点复制。

复制可以是同步的，也可以是异步的，在发生故障时对系统行为有深远的影响。尽管在系统运行平稳时异步复制速度很快，但是在复制滞后增加和服务器故障时要弄清楚会发生什么，这一点很重要。

针对应用程序在复制滞后时的行为的一致性模型：

1）写后读：用户应该总是看到自己提交的数据。

2）单调读：用户在一个时间点看到数据后，他们不应该在某个早期时间点看到数据。

3）一致前缀读：用户应该将数据视为具有因果意义的状态：例如，按照正确的顺序查看问题及其答复。

多主节点和无主节点复制方法固有的并发问题：写冲突。检测冲突和避免是推荐的，LWW是目前主要的冲突合并策略。

ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
基于Python的智能公示信息监控爬虫系统开发实战 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言音视频搜索引擎 scrapy
摘要本文详细介绍了如何使用Python构建一个高效的公示信息监控爬虫系统。系统采用最新技术栈，包括异步爬取、智能解析、反反爬策略等，能够自动监控各类政府网站、企业公示平台的更新信息。文章从系统设计到具体实现，提供了完整的代码示例和详细的技术解析，帮助读者掌握大规模公示信息采集的核心技术。关键词：Python爬虫、公示监控、信息采集、异步爬取、智能解析1.引言在数字化时代，各类公示信息（如政府采购、
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
分布式选举算法＜一＞ Bully算法
分布式选举算法详解：Bully算法引言在分布式系统中，节点故障是不可避免的。当主节点（Leader）发生故障时，系统需要快速选举出新的主节点来保证服务的连续性。Bully算法是一种经典的分布式选举算法，以其简单高效的特点被广泛应用于各种分布式系统中。什么是Bully算法？Bully算法是一种基于优先级的分布式选举算法。每个节点都有一个唯一的ID，ID值越大的节点优先级越高。当主节点故障时，优先级最
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
python+springboot+vue的音乐系统 QQ_511008285 python spring boot vue.js django flask node.js php
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
服务实现99.99%高可用的核心措施
在分布式系统中，高可用性（HA）是衡量服务可靠性的核心指标。99.99%的可用性意味着系统每年的停机时间不超过约52.6分钟，这对金融交易、电信服务等关键业务至关重要。一、冗余设计与故障转移原理：通过冗余部署消除单点故障，确保部分节点故障时服务仍可用。故障转移机制自动将流量切换至健康节点，缩短服务中断时间。Java服务实现：集群部署：使用SpringCloudAlibaba或Dubbo构建微服务集
分布式事务解决方案总结：本地消息异步确认、可靠消息最终一致性、最大努力通知码到三十五面试攻关分布式 spring cloud spring boot
❃博主首页：「码到三十五」，同名公众号:「码到三十五」☠博主专栏：♝博主的话：搬的每块砖，皆为峰峦之基；公众号搜索「码到三十五」关注这个爱发技术干货的coder，一起筑基分布式系统中事务是一个重要挑战，先从从实现原理、技术细节、适用场景三个维度，对三种主流分布式事务解决方案进行简单总结。一、本地消息异步确认方案实现原理该方案通过「本地事务+消息表」机制实现最终一致性，核心思想是将业务操作与消息发送
鸿蒙系统安全机制全解：安全启动 + 沙箱 + 动态权限实战落地指南 harmonyos
摘要随着鸿蒙系统在智能设备、可穿戴设备、车载终端等领域不断扩展，系统的安全性也成为用户和开发者关注的重点。为了保护系统不被恶意代码破坏，同时保护用户的隐私和数据安全，鸿蒙系统设计了完整的安全机制。其中，安全启动机制负责系统的可信链构建，而运行时的沙箱机制与动态权限管理则在系统运行后继续保障安全。引言鸿蒙系统从底层安全启动，到上层应用的权限控制，设计了一整套可信、安全、可控的机制。这些机制不仅能防止
多核MCU可用于简化嵌入式设计
转自：http://www.elecfans.com/d/851199.html嵌入式系统设计人员面临着对更高性能和更快上市时间的不断增长的需求。嵌入式处理器需要经常实时地执行不断扩展的任务。同时，应用需要高吞吐量和高能效以及小外形和低成本。多核微控制器单元（MCU）提供了一种可行的新解决方案，利用模块化设计以经济的价格提供多倍的性能提升。几十年来，随着IC上晶体管数量的增加，芯片性能不断提高。采
Spring Boot 在后端领域的微服务负载均衡实践 AI大模型应用实战 spring boot 微服务负载均衡 ai
SpringBoot在后端领域的微服务负载均衡实践关键词：SpringBoot、微服务、负载均衡、Ribbon、服务发现、高可用、分布式系统摘要：本文深入探讨了SpringBoot在微服务架构中实现负载均衡的实践方法。我们将从基础概念出发，详细分析负载均衡的核心原理，介绍SpringCloud生态中的关键组件（如Ribbon、Eureka等），并通过完整的代码示例展示如何在实际项目中实现高效的负载
如何通过YashanDB数据库实现企业级数据分区管理？数据库
在当今大数据时代，企业面临着海量数据的管理和优化访问的问题。如何有效地组织和划分庞大的数据集，以提升查询性能和运维效率，成为数据库系统设计的核心挑战。数据分区技术作为解决大规模数据处理的关键手段，能够显著减少无关数据的访问，优化资源利用率。本文聚焦于YashanDB数据库，详细解析其数据分区管理的实现机制及应用，为企业级应用提供高效、灵活的数据分区解决方案。YashanDB中的数据分区基础Yash
【Rust日报】使用Rust开发分布式系统的经验教训
Fjall-一个安全Rust的KV存储引擎Fjall是一个可嵌入的基于LSM的forbid-unsafeRust键值存储引擎。它的目标是成为一个可靠且可预测但性能优异的通用KV存储引擎，适用于小型数据集，尤其是大于内存大小的数据集。我刚刚发布了1.0版本，该版本稳定了其数据格式，适用于所有未来的1.x.x版本。它的设计受到了LevelDB/RocksDB架构的重大影响，并且通常具有相似的性能。它具
Mysql:分库分表爱吃汉堡的Saul. 数据库 mysql 数据库
引言：随着互联网业务的飞速发展，数据量与并发请求呈现爆炸式增长。传统的单机数据库架构，即使经过垂直扩展（如提升硬件配置、优化SQL、引入读写分离），也终将面临性能瓶颈。主要挑战体现在：单表性能极限：当单表数据行数达到千万乃至亿级时，B+树索引深度增加，导致查询效率显著下降。此外，DDL（数据定义语言）操作如添加索引、修改表结构等，可能耗时数小时并长时间锁定表，严重影响业务可用性。单库资源瓶颈：单个
自定义属性报价系统设计方案 buyue__ C++算法设计数据结构
一、系统架构设计1.核心模块划分属性配置引擎：支持无限级分类与继承机制，通过attr_forprice字段标识影响价格的属性动态定价模块：采用CPQ(配置-定价-报价)模式，内置差异化定价策略与审批流程产品建模中心：建立多层级SKU档案，支持材料/工艺等200+参数的自由组合2.数据库设计CREATETABLE`prod_class_attr`(`attr_forprice`tinyint(4)D
5V-8.4V电动咖啡豆研磨机单片机IC方案咖啡豆研磨机方案FH8B26S16 深圳市泛海微电子有限公司泛海微方案单片机嵌入式硬件
随着精品咖啡文化的普及，家用电动咖啡研磨机正从基础功能向智能化、精准化方向升级。本文将深入解析基于FH8B26S16单片机的5V-8.4V电动咖啡研磨机IC解决方案，从芯片特性到系统设计，呈现一套完整的智能研磨控制方案。**一、核心芯片特性解析**FH8B26S16是aisinochip推出的高性能8位MCU，采用增强型8051内核，主频最高达16MHz。该芯片内置16KBFlash存储器和256
商城分销系统：搭建成功的关键要素 hunzi_1 大数据
商城分销系统是一种电子商务模式，通过绑定上下级关系自动管理利润分配，加速搭建销售网络。系统设计需要注重产品质量，规则明晰，公平分成，严格合规。有效培训、技术支持、层级管理、优质客服与巧妙推广是其成功的关键要素。商城分销系统，简单来说就是一种利用商城平台来进行产品销售和分成管理的一种营销模式。这种模式在电子商务领域越来越流行，它通过绑定上下级关系，实现利润的自动分配。比如，传统的线下分销模式往往是依
千亿级消息引擎 Apache Pulsar 深度剖析：架构原理、设计哲学与实战实践北漂老男人 Pulsar apache 架构学习方法运维
千亿级消息引擎ApachePulsar深度剖析：架构原理、设计哲学与实战实践Pulsar不止是消息队列，更是下一代云原生流平台。本文将深入剖析其底层架构、核心特性、关键差异、源码细节、调优技巧与企业级实践路径，力求做到“知其然，知其所以然”。一、架构哲学：分层解耦+IO隔离1.1三层架构模型（Broker+BookKeeper+ZooKeeper）Pulsar基于分布式系统经典设计范式：计算与存储
数据结构课程设计秋悠然深度优先算法图论
项目名称：图的遍历课程设计主要目的：1.了解并掌握数据结构与算法的设计方法。2.通过应用数据结构的基本理论和方法来解决实际问题。3.初步掌握软件开发过程中的问题分析、系统设计、程序编码、调试、数据测试等基本方法和技能。4.学习编写课程设计报告，软件开发文档。课程设计任务要求：任务：实现图的深度遍历（递归和非递归两种方法）以及实现图的广度遍历（队列）要求：1.程序能够正确运行，实现图的深度遍历和广度
【FR801xH】富芮坤FR801xH之全功能按键案例沧海一笑-dj 物联网专栏富芮坤 FR801xH 按键单击双击长按超长按
00.目录文章目录00.目录01.FR801xH概述02.FR801xH功能框图03.Button模块概述04.Button模块核心设计思想05.Button模块系统架构概览06.Button模块数据结构详解07.状态机引擎解析08.定时器系统设计09.事件处理流程10.程序实现参考源码11.测试示例12.附录01.FR801xH概述FR801xH系列芯片是面向SOC（片上系统），易于快速开发的低
03-软件工程-快速应用开发模型
目标：本文主要介绍软件开发模型的「快速应用开发模型（RAD）」，可学习其基本原理、应用场景、操作步骤及优缺点。一、快速应用开发模型快速应用开发模型（RapidApplicationDevelopment，RAD）强调迭代、原型化和用户协作，以加速交付。核心思想是，通过构件快速组装的开发方法获得快速开发。适用于需求明确、模块化强的中小型项目。特点：让用户全程参与项目全生命周期。需求分析、系统设计等活
2.4G收发SOC芯片 XL2417D，集成高性能2.4GHz射频收发器、32位MCU
XL2417D芯片是一款低功耗、高性能和高度集成的2.4GSoC芯片，带有蓝牙5.2BLE和2.4G收发器。它集成了高性能2.4GHz射频收发器、丰富的基带功能、32位MCU和各种外围IO。它支持128KB的flash和8KB的RAM，以实现可编程协议和配置文件，支持定制应用程序。XL2417D采用先进的55nmCMOS低泄漏工艺制造，降低BOM成本的同时简化了整个系统设计。丰富的外围设备包括10
Redis 分布式锁实现与实践佑瞻数据库与知识图谱 redis 分布式数据库
在分布式系统架构中，多个独立进程对共享资源的并发访问控制是常见需求，分布式锁作为解决这一问题的关键技术，在缓存更新、任务调度、库存管理等场景中发挥着重要作用。本文将从基础原理出发，详细阐述基于Redis的分布式锁实现方案，包括单实例模式与Redlock算法，并探讨其在实际应用中的关键考量。分布式锁核心概念分布式锁是一种跨进程、跨机器的同步机制，用于保证多个分布式节点对共享资源的互斥访问。一个可靠的
基于单片机的住宅防火防盗报警系统设计启初科技 51单片机毕业设计单片机毕业设计单片机嵌入式硬件
文章目录一、系统概述二、项目内容和功能介绍三、效果图四、资料获取一、系统概述基于单片机的住宅防火防盗报警系统设计介绍一、系统设计背景与意义随着城市化进程的加快和居民生活水平的提高，住宅安全已成为人们关注的焦点。火灾和盗窃是威胁住宅安全的两大主要因素，传统的人工巡查和简单的安防设备已难以满足现代住宅的安全需求。基于单片机的住宅防火防盗报警系统集成了传感器技术、单片机控制技术和无线通信技术，能够实时监
4.服务注册发现：微服务的神经系统
在微服务架构中，服务之间不再是固定连接，而是高度动态、短暂存在的。如何让每个服务准确找到彼此，是分布式系统治理的核心问题之一。服务注册发现机制，正如神经系统之于人体，承担着连接、协调、感知变化的关键角色。本文将围绕Netflix开源的服务注册发现组件Eureka展开，深入剖析其原理，并以SpringCloud实战为导向，帮助你掌握服务治理的第一步。一、为什么需要服务注册发现？在单体架构中，服务调用
2.Spring Cloud生态全景解析：核心组件、能力边界与定位碎风影 SpringCloud深度解析 spring cloud spring 后端
导语：SpringCloud并非单一框架，而是基于SpringBoot构建的分布式系统工具集。它通过标准化封装，将服务发现、配置管理、熔断限流等复杂基础设施转化为开箱即用的组件，让开发者聚焦业务逻辑。本文将系统解析其核心组成、与SpringBoot的共生关系，并客观审视其能力边界，助您构建清晰的微服务技术选型地图。一、核心基石：SpringBoot与SpringCloud的共生关系关键结论：Spr
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

DDIA（《数据密集型应用系统设计》）的阅读随笔：第5章 数据复制

DDIA（《数据密集型应用系统设计》）的阅读随笔：第5章 数据复制

文章目录

前言

一、单主节点复制

1.主从复制

2.同步复制和异步复制

3.主从复制技术实现

4.复制滞后的问题与解决方案讨论

二、多主节点复制

三、无主节点复制

总结

你可能感兴趣的:(系统设计,分布式系统,数据库架构)

DDIA（《数据密集型应用系统设计》）的阅读随笔：第5章数据复制

DDIA（《数据密集型应用系统设计》）的阅读随笔：第5章数据复制