WilliamDream

谈谈分布式事物

原文链接： https://mp.weixin.qq.com/s/UhT8cQqdHsK4AubFMVK8_Q

分布式事务

高可用是指系统无中断的执行功能的能力，代表了系统的可用程度，是进行系统设计时必须要遵守的准则之一。而高可用的实现方案，无外乎就是冗余，就存储的高可用而言，问题不在于如何进行数据备份，而在于如何规避数据不一致对业务造成的影响。对于分布式系统而言，要保证分布式系统中的数据一致性就需要一种方案，可以保证数据在子系统中始终保持一致，避免业务出现问题。这种实现方案就叫做分布式事务，要么一起成功，要么一起失败，必须是一个整体性的事务。

理论基础

在讲解具体方案之前，有必要了解一下分布式中数据设计需要遵循的理论基础，CAP 理论和 BASE 理论，为后面的实践铺平道路。

CAP 理论

CAP，Consistency Availability Partition tolerance 的简写：

Consistency：一致性，对某个客户端来说，读操作能够返回最新的写操作结果。
Availability：可用性，非故障节点在合理的时间内返回合理的响应。
Partition tolerance：分区容错性，当出现网络分区后，系统能够继续提供服务，你知道什么是网络分区吗？

因为分布式系统中系统肯定部署在多台机器上，无法保证网络做到 100% 的可靠，所以网络分区一定存在，即 P 一定存在。

在出现网络分区后，就出现了可用性和一致性的问题，我们必须要在这两者之间进行取舍，因此就有了两种架构：

CP 架构
AP 架构

①CP 架构

当网络分区出现后，为了保证一致性，就必须拒接请求，否则无法保证一致性：

当没有出网络分区时，系统 A 与系统 B 的数据一致，X=1。
将系统 A 的 X 修改为 2，X=2。
当出现网络分区后，系统 A 与系统 B 之间的数据同步数据失败，系统 B 的 X=1。
当客户端请求系统 B 时，为了保证一致性，此时系统 B 应拒绝服务请求，返回错误码或错误信息。

上面这种方式就违背了可用性的要求，只满足一致性和分区容错，即 CP，CAP 理论是忽略网络延迟，从系统 A 同步数据到系统 B 的网络延迟是忽略的。CP 架构保证了客户端在获取数据时一定是最近的写操作，或者获取到异常信息，绝不会出现数据不一致的情况。

②AP 架构

当网络分区出现后，为了保证可用性，系统 B 可以返回旧值，保证系统的可用性：

当没有出网络分区时，系统 A 与系统 B 的数据一致，X=1。
将系统 A 的 X 修改为 2，X=2。
当出现网络分区后，系统 A 与系统 B 之间的数据同步数据失败，系统 B 的 X=1。
当客户端请求系统 B 时，为了保证可用性，此时系统 B 应返回旧值，X=1。

上面这种方式就违背了一致性的要求，只满足可用性和分区容错，即 AP，AP 架构保证了客户端在获取数据时无论返回的是最新值还是旧值，系统一定是可用的。CAP 理论关注粒度是数据，而不是整体系统设计的策略。

BASE 理论

BASE 理论指的是基本可用 Basically Available，软状态 Soft State，最终一致性 Eventual Consistency，核心思想是即便无法做到强一致性，但应该采用适合的方式保证最终一致性。

BASE，Basically Available Soft State Eventual Consistency 的简写：

BA：Basically Available 基本可用，分布式系统在出现故障的时候，允许损失部分可用性，即保证核心可用。
S：Soft State 软状态，允许系统存在中间状态，而该中间状态不会影响系统整体可用性。
E：Consistency 最终一致性，系统中的所有数据副本经过一定时间后，最终能够达到一致的状态。

BASE 理论本质上是对 CAP 理论的延伸，是对 CAP 中 AP 方案的一个补充。

分布式事务协议

X/Open XA 协议

XA 是一个分布式事务协议，由 Tuxedo 提出。XA 规范主要定义了（全局）事务管理器（Transaction Manager）和（局部）资源管理器（Resource Manager）之间的接口。

XA 接口是双向的系统接口，在事务管理器（Transaction Manager）以及一个或多个资源管理器（Resource Manager）之间形成通信桥梁。

XA 协议采用两阶段提交方式来管理分布式事务。XA 接口提供资源管理器与事务管理器之间进行通信的标准接口。

2PC：二阶段提交协议

二阶段提交（Two-phase Commit），是指，为了使基于分布式系统架构下的所有节点在进行事务提交时保持一致性而设计的一种算法（Algorithm）。通常，二阶段提交也被称为是一种协议（Protocol）。

在分布式系统中，每个节点虽然可以知晓自己的操作是成功或者失败，却无法知道其他节点的操作是成功或失败。

当一个事务跨越多个节点时，为了保持事务的 ACID 特性，需要引入一个作为协调者的组件来统一掌控所有节点（称作参与者）的操作结果并最终指示这些节点是否要把操作结果进行真正的提交（比如将更新后的数据写入磁盘等等）。

因此，二阶段提交的算法思路可以概括为：参与者将操作成败通知协调者，再由协调者根据所有参与者的反馈情报决定各参与者是否要提交操作还是中止操作。

二阶段提交算法的成立基于以下假设：

该分布式系统中，存在一个节点作为协调者（Coordinator），其他节点作为参与者（Cohorts）。且节点之间可以进行网络通信。
所有节点都采用预写式日志，且日志被写入后即被保持在可靠的存储设备上，即使节点损坏不会导致日志数据的消失。
所有节点不会永久性损坏，即使损坏后仍然可以恢复。

二阶段提交分为两阶段：

投票阶段
提交阶段

投票阶段 Prepares：

协调者向所有参与者询问是否可以执行提交操作，并开始等待各参与者的响应。
参与者执行事务操作，如果执行成功就返回 Yes 响应，如果执行失败就返回 No 响应。
如果协调者接受参与者响应超时，也会认为执行事务操作失败。

提交阶段 Commit：

如果第一阶段汇总所有参与者都返回 Yes 响应，协调者向所有参与者发出提交请求，所有参与者提交事务。
如果第一阶段中有一个或者多个参与者返回 No 响应，协调者向所有参与者发出回滚请求，所有参与者进行回滚操作。

二阶段提交优点：尽量保证了数据的强一致，但不是 100% 一致。

二阶段提交缺点：

单点故障，由于协调者的重要性，一旦协调者发生故障，参与者会一直阻塞，尤其是在第二阶段，协调者发生故障，那么所有的参与者都处于锁定事务资源的状态中，而无法继续完成事务操作。
同步阻塞，由于所有节点在执行操作时都是同步阻塞的，当参与者占有公共资源时，其他第三方节点访问公共资源不得不处于阻塞状态。
数据不一致，在第二阶段中，当协调者向参与者发送提交事务请求之后，发生了局部网络异常或者在发送提交事务请求过程中协调者发生了故障，这会导致只有一部分参与者接收到了提交事务请求。

而在这部分参与者接到提交事务请求之后就会执行提交事务操作。但是其他部分未接收到提交事务请求的参与者则无法提交事务。从而导致分布式系统中的数据不一致。

二阶段提交的问题：如果协调者在第二阶段发送提交请求之后挂掉，而唯一接受到这条消息的参与者执行之后也挂掉了，即使协调者通过选举协议产生了新的协调者并通知其他参与者进行提交或回滚操作的话，都可能会与这个已经执行的参与者执行的操作不一样。当这个挂掉的参与者恢复之后，就会产生数据不一致的问题。

3PC：三阶段提交协议

三阶段提交（Three-phase commit），是为解决两阶段提交协议的缺点而设计的。与两阶段提交不同的是，三阶段提交是“非阻塞”协议。

三阶段提交在两阶段提交的第一阶段与第二阶段之间插入了一个准备阶段，使得原先在两阶段提交中，参与者在投票之后，由于协调者发生崩溃或错误，而导致参与者处于无法知晓是否提交或者中止的“不确定状态”所产生的可能相当长的延时的问题得以解决。

三阶段提交的三个阶段：

CanCommit
PreCommit
DoCommit

①询问阶段：CanCommit

协调者向参与者发送 Commit 请求，参与者如果可以提交就返回 Yes 响应，否则返回 No 响应。

②准备阶段：PreCommit

协调者根据参与者在询问阶段的响应判断是否执行事务还是中断事务：

如果所有参与者都返回 Yes，则执行事务。
如果参与者有一个或多个参与者返回 No 或者超时，则中断事务。

参与者执行完操作之后返回 ACK 响应，同时开始等待最终指令。

③提交阶段：DoCommit

协调者根据参与者在准备阶段的响应判断是否执行事务还是中断事务：

如果所有参与者都返回正确的 ACK 响应，则提交事务。
如果参与者有一个或多个参与者收到错误的 ACK 响应或者超时，则中断事务。
如果参与者无法及时接收到来自协调者的提交或者中断事务请求时，会在等待超时之后，会继续进行事务提交。

协调者收到所有参与者的 ACK 响应，完成事务。

解决二阶段提交时的问题：在三阶段提交中，如果在第三阶段协调者发送提交请求之后挂掉，并且唯一的接受的参与者执行提交操作之后也挂掉了，这时协调者通过选举协议产生了新的协调者。在二阶段提交时存在的问题就是新的协调者不确定已经执行过事务的参与者是执行的提交事务还是中断事务。但是在三阶段提交时，肯定得到了第二阶段的再次确认，那么第二阶段必然是已经正确的执行了事务操作，只等待提交事务了。所以新的协调者可以从第二阶段中分析出应该执行的操作，进行提交或者中断事务操作，这样即使挂掉的参与者恢复过来，数据也是一致的。所以，三阶段提交解决了二阶段提交中存在的由于协调者和参与者同时挂掉可能导致的数据一致性问题和单点故障问题，并减少阻塞。因为一旦参与者无法及时收到来自协调者的信息之后，他会默认执行提交事务，而不会一直持有事务资源并处于阻塞状态。

三阶段提交的问题：在提交阶段如果发送的是中断事务请求，但是由于网络问题，导致部分参与者没有接到请求。

那么参与者会在等待超时之后执行提交事务操作，这样这些由于网络问题导致提交事务的参与者的数据就与接受到中断事务请求的参与者存在数据不一致的问题。所以无论是 2PC 还是 3PC 都不能保证分布式系统中的数据 100% 一致。

解决方案

举个栗子：在电商网站中，用户对商品进行下单，需要在订单表中创建一条订单数据，同时需要在库存表中修改当前商品的剩余库存数量。

两步操作一个添加，一个修改，我们一定要保证这两步操作一定同时操作成功或失败，否则业务就会出现问题。

建立时：业务量不大，用户少，系统只是一个单体架构，订单表与库存表都在一个数据库中，这时可以使用 MySQL 的本地事务保证数据一致性。

发展期：业务发展迅速，用户量变多，单数据已经出现了性能瓶颈，按照业务纬度进行分库，分为订单库和库存库，由于跨库跨机器，MySQL 的本地事务不能再保证订单库和库存库的数据一致性。

成熟期：业务拓展，单体架构已经满足不了需求，进而衍化成了分布式系统，这时的订单和库存已经拆分为了两个子系统提供服务，子系统间使用 RPC 进行通信。

但是无论系统发展成什么样，我们都要保证业务不出问题，保证订单和库存的数据一致，这时候要思考下在服务之间我们应如何保证数据一致。

强一致性分布式事务

单体架构多数据源，在业务开发中，肯定是先执行对订单库的操作，但是不提交事务，再执行对库存库的操作，也不提交事务，如果两个操作都成功，在一起提交事务，如果有一个操作失败，则两个都进行回滚。

基于 2PC/XA 协议实现的 JTA：我们已经知道了 2PC 和 XA 协议的原理，而 JTA 是 Java 规范，是 XA 在 Java 上的实现。

JTA（Java Transaction Manager）:

Transaction Manager：常用方法，可以开启，回滚，获取事务。begin()，rollback()...
XAResouce：资源管理，通过 Session 来进行事务管理，commit（xid）...
XID : 每一个事务都分配一个特定的 XID。

JTA 主要的原理是二阶段提交，当整个业务完成了之后只是第一阶段提交，在第二阶段提交之前会检查其他所有事务是否已经提交。

如果前面出现了错误或是没有提交，那么第二阶段就不会提交，而是直接回滚，这样所有的事务都会做回滚操作。基于 JTA 这种方案实现分布式事务的强一致性。

JTA 的特点：

基于两阶段提交，有可能会出现数据不一致的情况
事务时间过长，阻塞
性能低，吞吐量低

实现可以使用基于 JTA 实现的 Jar 包 Atomikos 例子可以自己百度一下。

正常架构设计中是否应该出现这种跨库的操作，我觉得是不应该的，如果按业务拆分将数据源进行分库，我们应该同时将服务也拆分出去才合适，应遵循一个系统只操作一个数据源（主从没关系），避免后续可能会出现的多个系统调用一个数据源的情况。

最终一致性分布式事务方案

JTA 方案适用于单体架构多数据源时实现分布式事务，但对于微服务间的分布式事务就无能为力了，我们需要使用其他的方案实现分布式事务。

①本地消息表

本地消息表的核心思想是将分布式事务拆分成本地事务进行处理。

以本文中例子，在订单系统新增一条消息表，将新增订单和新增消息放到一个事务里完成，然后通过轮询的方式去查询消息表，将消息推送到 MQ，库存系统去消费 MQ。

执行流程：

订单系统，添加一条订单和一条消息，在一个事务里提交。
订单系统，使用定时任务轮询查询状态为未同步的消息表，发送到 MQ，如果发送失败，就重试发送。
库存系统，接收 MQ 消息，修改库存表，需要保证幂等操作。
如果修改成功，调用 RPC 接口修改订单系统消息表的状态为已完成或者直接删除这条消息。
如果修改失败，可以不做处理，等待重试。

订单系统中的消息有可能由于业务问题会一直重复发送，所以为了避免这种情况可以记录一下发送次数，当达到次数限制之后报警，人工接入处理；库存系统需要保证幂等，避免同一条消息被多次消费造成数据一致。

本地消息表这种方案实现了最终一致性，需要在业务系统里增加消息表，业务逻辑中多一次插入的 DB 操作，所以性能会有损耗，而且最终一致性的间隔主要由定时任务的间隔时间决定。

②MQ 消息事务

消息事务的原理是将两个事务通过消息中间件进行异步解耦。

订单系统执行自己的本地事务，并发送 MQ 消息，库存系统接收消息，执行自己的本地事务。

乍一看，好像跟本地消息表的实现方案类似，只是省去了对本地消息表的操作和轮询发送 MQ 的操作，但实际上两种方案的实现是不一样的。

消息事务一定要保证业务操作与消息发送的一致性，如果业务操作成功，这条消息也一定投递成功。

消息事务依赖于消息中间件的事务消息，基于消息中间件的二阶段提交实现的，RocketMQ 就支持事务消息。

执行流程：

发送 Prepare 消息到消息中间件。
发送成功后，执行本地事务。
如果事务执行成功，则 Commit，消息中间件将消息下发至消费端。
如果事务执行失败，则回滚，消息中间件将这条 Prepare 消息删除。
消费端接收到消息进行消费，如果消费失败，则不断重试。

这种方案也是实现了最终一致性，对比本地消息表实现方案，不需要再建消息表，不再依赖本地数据库事务了，所以这种方案更适用于高并发的场景。

③最大努力通知

最大努力通知相比前两种方案实现简单，适用于一些最终一致性要求较低的业务，比如支付通知，短信通知这种业务。以支付通知为例，业务系统调用支付平台进行支付，支付平台进行支付，进行操作支付之后支付平台会尽量去通知业务系统支付操作是否成功，但是会有一个最大通知次数。如果超过这个次数后还是通知失败，就不再通知，业务系统自行调用支付平台提供一个查询接口，供业务系统进行查询支付操作是否成功。

执行流程：

业务系统调用支付平台支付接口，并在本地进行记录，支付状态为支付中。
支付平台进行支付操作之后，无论成功还是失败，都需要给业务系统一个结果通知。
如果通知一直失败则根据重试规则进行重试，达到最大通知次数后，不再通知。
支付平台提供查询订单支付操作结果接口。
业务系统根据一定业务规则去支付平台查询支付结果。

这种方案也是实现了最终一致性。

④补偿事务 TCC

TCC，Try-Confirm-Cancel 的简称，针对每个操作，都需要有一个其对应的确认和取消操作。

当操作成功时调用确认操作，当操作失败时调用取消操作，类似于二阶段提交，只不过是这里的提交和回滚是针对业务上的，所以基于 TCC 实现的分布式事务也可以看做是对业务的一种补偿机制。

TCC 的三阶段：

Try 阶段：对业务系统做检测及资源预留。
Confirm 阶段：对业务系统做确认提交，Try 阶段执行成功并开始执行 Confirm 阶段时，默认 Confirm 阶段是不会出错的。即：只要 Try 成功，Confirm 一定成功。
Cancel 阶段：在业务执行错误，需要回滚的状态下执行的业务取消，预留资源释放。

在 Try 阶段，是对业务系统进行检查及资源预览，比如订单和存储操作，需要检查库存剩余数量是否够用，并进行预留，预留操作的话就是新建一个可用库存数量字段，Try 阶段操作是对这个可用库存数量进行操作。

比如下一个订单减一个库存：

执行流程：

Try 阶段：订单系统将当前订单状态设置为支付中，库存系统校验当前剩余库存数量是否大于 1，然后将可用库存数量设置为库存剩余数量 -1。
如果 Try 阶段执行成功，执行 Confirm 阶段，将订单状态修改为支付成功，库存剩余数量修改为可用库存数量。
如果 Try 阶段执行失败，执行 Cancel 阶段，将订单状态修改为支付失败，可用库存数量修改为库存剩余数量。

基于 TCC 实现分布式事务，代码逻辑相对复杂一些，需要将原来的接口的逻辑拆分为：Try，Confirm ，Cancel 三个接口的逻辑。

基于 TCC 实现的分布式事务框架：

ByteTCC，github.com/liuyangming
tcc-transaction：github.com/changmingxi

作者：陈明羽，就职于京东零售

转载地址：好文地址

Java 雪花算法：生成有序不重复 ID （Java 实现） C_V_Better 算法 java java 后端开发语言算法设计模式性能优化
目录一、雪花算法概述二、雪花算法的组成部分三、雪花算法的实现四、使用示例五、总结在分布式系统中，生成唯一且有序的ID是一个常见的需求。雪花算法（SnowflakeAlgorithm）是一种常用的解决方案，它能够生成全局唯一的ID，并且这些ID具有有序性。本文将详细介绍雪花算法的原理和Java实现，帮助你在分布式系统中生成有序不重复的ID。一、雪花算法概述雪花算法是一种用于生成分布式系统中全局唯一I
分布式session和本地session区别搁浅里妥协分布式
分布式会话（DistributedSession）和本地会话（LocalSession）是两种会话管理方式，它们在存储位置、可扩展性和数据共享方面存在区别。存储位置:本地会话：存储在服务器本地内存中。每个服务器都维护自己的会话信息。分布式会话：会话信息存储在共享的存储介质中，例如Redis、数据库等。多个服务器可以共享和访问同一份会话数据。可扩展性:本地会话：受限于单个服务器的内存大小和处理能力，
使用curl命令在Linux下访问Elasticsearch的RESTful API JipForth linux elasticsearch restful
Elasticsearch是一个强大的开源分布式搜索和分析引擎，它提供了一个RESTfulAPI，用于与其进行交互。在Linux系统中，我们可以使用curl命令来访问Elasticsearch的RESTfulAPI，执行各种操作，如索引文档、搜索、聚合等。本文将详细介绍如何使用curl命令在Linux下与Elasticsearch进行交互。安装curl首先，我们需要确保curl已安装在Linux系
分布式Session 长勺 Java基础分布式
我用「餐厅点餐+代码实战」帮你彻底搞懂分布式Session，看完不仅能应对面试，还能直接应用到实际开发。先记住这个核心矛盾：多服务员如何记住同一顾客的喜好？一、从生活场景理解Session的本质传统单机场景（小餐馆）服务员：Tom（唯一服务员）工作流程：顾客首次点餐→Tom给纸质会员卡（SessionID）Tom把顾客口味记录在自己的笔记本（服务器内存）顾客下次出示会员卡→Tom查笔记本提供服务分
经验分享：用一张表解决并发冲突！数据库事务锁的核心实现逻辑试着奔跑的菜鸟系统设计 java 经验分享 java 高并发分布式锁
背景对于一些内部使用的管理系统来说，可能没有引入Redis，又想基于现有的基础设施处理并发问题，而数据库是每个应用都避不开的基础设施之一，因此分享个我曾经维护过的一个系统中，使用数据库表来实现事务锁的方式。之前在文章Java业务功能并发问题处理中实现了使用MySQL行锁、Redis分布式锁来处理业务并发问题，这次来填坑了，如果想了解其他并发问题处理方式和区别，可以看看文章Java业务功能并发问题处
面试基础--- Spring 事务传播机制底层实现原理 WeiLai1112 后端面试 spring java 爬虫后端架构分布式
深度解析Spring事务传播机制底层实现原理一、事务传播机制的本质与价值是否调用Transactional方法是否存在事务根据传播级别处理现有事务根据传播级别创建新事务挂起/加入/抛出异常等新建Connection/设置隔离级别等在分布式系统架构中，事务传播机制是保证业务一致性的核心机制。Spring通过TransactionInterceptor和TransactionAspectSupport
Flink SQL 底层封装的原理 goTsHgo Flink 大数据分布式 flink sql 大数据
ApacheFlink是一个分布式流处理引擎，而FlinkSQL是其提供的一个SQL层，允许用户通过标准SQL查询对流式或批量数据进行查询和分析。FlinkSQL的实现基于ApacheCalcite，这是一个通用的SQL解析和优化引擎，Flink在其基础上进行了扩展和优化，以支持流数据的查询语义（如窗口、事件时间等）。要理解FlinkSQL的底层实现，首先需要理解Flink是如何通过SQL解析、优
YashanDB安装前操作系统参数调整数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E5%AE%89%E8%A3%85%...当YashanDB安装在Linux环境中时，为使系统达到更好的性能，建议进行下述配置调整。Note：建议对分布式部署中的所有服务器执行下述调整，否则在业务运行将系统资源耗尽的极端场景中将出现服务退出或业务执行卡顿、报错等异常。
避免Hive和Spark生成HDFS小文件穷目楼数据库大数据大数据 spark hive hadoop
HDFS是为大数据设计的分布式文件系统，对大数据做了存储做了针对性的优化，但却不适合存储海量小文件。Hive和spark-sql是两个在常用的大数据计算分析引擎，用户直接以SQL进行大数据操作，底层的数据存储则多由HDFS提供。对小数据表的操作如果没做合适的处理则很容易导致大量的小文件在HDFS上生成，常见的一个情景是数据处理流程只有map过程，而流入map的原始数据数量较多，导致整个数据处理结束
MOSN 基于延迟负载均衡算法——走得更快，期待走得更稳 go网关负载均衡延迟加载开源
文｜纪卓志（GitHubID：jizhuozhi)京东高级开发工程师MOSN项目Committer专注于云原生网关研发的相关工作，长期投入在负载均衡和流量控制领域前言这篇文章主要是介绍MOSN在v1.5.0中新引入的基于延迟的负载均衡算法#2253。首先会对分布式系统中延迟出现的原因进行剖析，之后介绍MOSN都通过哪些方法来降低延迟，最后构建与生产环境性能分布相近的测试用例来对算法进行验证。在开始
面试题：你们的服务是怎么做日志收集的？ clownAdam SpringCloud面试 spring cloud 后端微服务面试
面试题：你们的服务是怎么做日志收集的？在面试中，关于日志收集的问题是一个常见的技术考察点。日志收集是分布式系统中非常重要的一环，用于监控、调试和故障排查。以下是一个清晰、详细的回答模板，帮助你在面试中脱颖而出：日志收集的背景在微服务架构中，服务数量多且分布在不同节点上，日志分散在各个服务实例中。为了便于集中管理和分析，需要将日志收集到一个中心化的存储系统中。日志收集的流程日志收集通常包括以下几个步
Redis——知识点其实不会敲代码面试题真的记不住一点 redis
Redis问答1.认识Redis1.1什么是RedisRedis是一种基于内存的数据库，对数据的读写都在内存上操作，因此读写速度很快，常用于缓存、消息队列、分布式锁等的应用场景Redis提供了很多数据类型来支撑各种场景，例如String、hash、list、set、zset、bitmapas、hyperloglog、GEO，对数据的操作都是原子性的，单线程过程，不存在锁的竞争除此之外，Redis还
Redisson 实现分布式锁山高自有客行路 Redis #Springboot 分布式 redis
一、Redisson分布式锁的工作原理1.基本机制Redisson实现分布式锁的核心是基于Redis的SET命令。具体来说，Redisson使用以下命令来获取锁：SETresource_namemy_random_valueNXPX30000resource_name：锁的名称。my_random_value：每个客户端生成的唯一标识符（通常是UUID+线程ID），用于确保锁只能由持有者释放。NX
深入解析 ZooKeeper：分布式协调服务的原理与应用 guihong004 java面试题分布式 zookeeper 云原生
1.说说Zookeeper是什么？ZooKeeper是一个开源的分布式协调服务，由ApacheSoftwareFoundation开发维护。它为构建分布式应用程序提供了一套简单且高效的协调接口。ZooKeeper的设计目的是为了简化分布式系统中常见的任务，例如命名、配置管理、同步（包括锁和选举）、组成员关系等。ZooKeeper提供了一个类似文件系统的层次结构数据模型，使用一系列以斜杠(/)分隔的
数据库管理-第295期 IT架构与爆炸半径（20250221）胖头鱼的鱼缸（尹海文）数据库数据库架构
数据库管理295期2025-02-21数据库管理-第295期架构与爆炸半径（20250221）1术语新解2硬件：存储VS本地盘3数据库3.1多模VS专用3.2集中式VS分布式4公有云VS非公有云总结数据库管理-第295期架构与爆炸半径（20250221）作者：胖头鱼的鱼缸（尹海文）OracleACEPro:DatabasePostgreSQLACEPartner10年数据库行业经验拥有OCM11g
11、SpringCloud _Mortal__ spring cloud spring 后端
1、常用SpringCloud的组件？1）、Nacos注册中心和配置中心2）、OpenFeign远程调用3）、LoadBalancer负载均衡的Ribbon（2021之前的版本）4）、Gateway网关5）、Sentinel服务保护限流现成隔离熔断降级方法（需要写代码）6）、Seata分布式事务（涉及到多个数据源）XA：执行SQL后事务不提交，统一提交或回滚AT：执行SQL后事务提交，并记录数据改
C#微服务架构的奥秘：深入解析配置管理与服务发现机制墨夶 C#学习资料1 架构 c#微服务
在现代软件开发中，微服务架构已经成为了构建复杂分布式系统的首选。它不仅提高了系统的可扩展性和灵活性，还使得团队能够更快速地响应市场需求。然而，随着服务数量的增长，如何有效地管理和发现这些服务成为了新的挑战。今天，我们将一起揭开C#微服务配置管理和服务发现的神秘面纱，探索实现高可用、自适应的应用程序的最佳实践。配置管理的重要性与挑战️配置管理是确保应用程序正确运行的基础。在一个微服务环境中，每个服务
【Python爬虫(96)】从0到1：打造爬虫驱动的数据分析平台奔跑吧邓邓子 Python爬虫 python 爬虫数据分析开发语言平台
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、平台搭建基础1.1明确平台目标与定位1.2技术选型依据二、数据
HarmonyOS Next跨设备拖拽——文件与文本自由流转 harmonyos
作为一名在华为鸿蒙开发领域摸爬滚打多年的老开发者，今天来和大家深入聊聊HarmonyOSNext中跨设备拖拽这个超酷的功能。它实现了文件与文本在不同设备间的自由流转，极大地提升了用户的分布式交互体验，就像是给设备之间搭建了一座无形的桥梁，让数据传输变得轻松又高效。跨设备拖拽的基本原理跨设备拖拽的实现依赖于两个关键技术：键鼠穿越和数据传输机制。键鼠穿越就像是给用户的键鼠操作赋予了“超能力”，让它们能
Java架构师之路：微服务架构图解和详情技术人小冯分布式微服务微服务架构分布式架构 java
微服务框架搭建：总体规划框架名称当前技术选型方案微服务框架搭建开发框架单体服务SpringBoot分布式框架SpringCloud最新框架SpringCloudAlibaba服务配置中心+服务消息总线阿里巴巴Nacos、Config+Bus+RabbitMQ配合使用、携程apolo服务网关SpringCloud-Gateway服务降级限流阿里Sentienl、SpringCloud-Hystrix
强者联盟——Python语言结合Spark框架博文视点全栈工程师全栈全栈数据 Spark Python PySpark
引言：Spark由AMPLab实验室开发，其本质是基于内存的快速迭代框架，“迭代”是机器学习最大的特点，因此非常适合做机器学习。得益于在数据科学中强大的表现，Python语言的粉丝遍布天下，如今又遇上强大的分布式内存计算框架Spark，两个领域的强者走到一起，自然能碰出更加强大的火花（Spark可以翻译为火花），因此本文主要讲述了PySpark。本文选自《全栈数据之门》。全栈框架Spark由AMP
分布式多卡训练(DDP)踩坑 m0_54804970 面试学习路线阿里巴巴分布式
多卡训练最近在跑yolov10版本的RT-DETR，用来进行目标检测。单卡训练语句（正常运行）：pythonmain.py多卡训练语句：需要通过torch.distributed.launch来启动，一般是单节点，其中CUDA_VISIBLE_DEVICES设置用的显卡编号，也可以不用，直接在main.py里面指定device也行，–nproc_pre_node每个节点的显卡数量。python-m
分布式监控Skywalking安装及使用教程（保姆级教程）(1) 2401_84181145 程序员分布式 skywalking
前言本文主要讲解分布式链路追踪监控系统Skywalking的安装及使用教程，从0到1，图文并茂的保姆级教程。SkyWalking是一款用于分布式系统跟踪和性能监控的开源工具。它可以帮助开发人员了解分布式系统中不同组件之间的调用关系和性能指标，从而进行故障排查和性能优化。它支持多种语言和框架，包括Java、.NET、Node.js等。它通过在应用程序中插入代理或使用特定的SDK来收集跟踪数据，并将这
2024年linux——环境基础开发工具使用_gcc test file(4)，2024年最新程序设计+Linux运维+Web+数据库+框架+分布式 2401_83740189 程序员运维 linux 前端
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
tidb和mysql性能优化有哪些区别大0马浓 tidb mysql
TiDB和MySQL在性能优化上的区别主要体现在架构设计、扩展方式、优化手段和适用场景等方面。以下是主要区别的总结：1.架构设计差异MySQL：单机架构（或主从复制架构），存储和计算耦合。-依赖本地磁盘或集中式存储（如SAN/NAS）。-优化集中在单机资源（CPU、内存、磁盘I/O）的合理利用。TiDB：-分布式架构，存储（TiKV）、计算（TiDBServer）、调度（PD）分离。-数据自动分片
NLP自然语言处理：文本表示总结 - 上篇word embedding（基于降维、基于聚类、CBOW 、Skip-gram、 NNLM 、TF-ID、GloVe ）陈宸-研究僧 NLP自然语言处理
文本表示分类（基于表示方法）离散表示one-hot表示词袋模型与TF-ID分布式表示基于矩阵的表示方法降维的方法聚类的方法基于神经网络的表示方法NNLMCBOWSkip-gramGloVeELMoGPTBERT目录一、文本离散表示1.1文本离散表示：one-hot1.2文本离散表示：词袋模型与TF-IDF1.2.1词袋模型（bagofwords）1.2.2对词袋模型的改进：TF-IDF二、文本分布
全面指南：使用JMeter进行性能压测与性能优化（中间件压测、数据库压测、分布式集群压测、调优） m0_74822999 面试学习路线阿里巴巴 jmeter 性能优化中间件
目录一、性能测试的指标1、并发量2、响应时间3、错误率4、吞吐量5、资源使用率二、压测全流程三、其他注意点1、并发和吞吐量的关系2、并发和线程的关系四、调优及分布式集群压测（待仔细学习）1.线程数量超过单机承载能力时的解决方案2.如何搭建分布式集群3.实施集群压测及监控4.处理集群中单台施压机报错的情况5.长时间压测（10小时）的注意事项6.处理混合场景：用户思考时间及多个服务同时压测7.开发压测
Redis学习笔记之——学习计划 Jack_abu redis redis学习 redis学习计划
Redis——RemoteDictionaryServer，开源、基于内存、速度快、key-value...Redis做为一个高性能的键值存储系统，广泛应用于缓存、会话存储、分布式锁以及其他需要快速访问的数据场景中。熟悉掌握redis，似乎已成为广大码农们必备的一项技能。下面是我的一个redis的学习计划，开启我的redis学习之旅~一、基础数据类型深入学习Redis的五种基本数据类型：字符串（S
ES 的分布式架构原理能说一下么（ES 是如何实现分布式的啊）？小新杂谈社后端面试 elasticsearch 分布式架构搜索引擎
面试题ES的分布式架构原理能说一下么（ES是如何实现分布式的啊）？面试官心理分析在搜索这块，lucene是最流行的搜索库。几年前业内一般都问，你了解lucene吗？你知道倒排索引的原理吗？现在早已经out了，因为现在很多项目都是直接用基于lucene的分布式搜索引擎——ElasticSearch，简称为ES。而现在分布式搜索基本已经成为大部分互联网行业的Java系统的标配，其中尤为流行的就是ES，
分布式系统debug日志链路日志-OnlineDebug 浮生若梦flw 日志 java MDC 分布式链路日志
MDC分布式日志调用日志系统-OnlineDebug1、背景在分布式系统中，在排查线上问题的时候我们希望可以通过请求的唯一ID（或者用户Id等），打印整个请求在多个系统中的全链路，帮助我们提升问题排查能力。下面事我梳理的几个需求点：1：可以通过动态配置userId，来全链路开启该userId的全链路日志。2：在多线程池执行任务下，切换线程，也可以打印debug日志。3：duboo调用其他服务，这个
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 fred@myhost.com # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

谈谈分布式事物

分布式事务

CAP 理论

分布式事务协议

你可能感兴趣的:(分布式事物,分布式)