分布式事务:解决方案之2PC理论

现在我们了解了《分布式事务:三个概念》和《分布式事务:两个理论》,以这些为基础。针对不同的分布式场景,业界常见的有四大解决方案:2PC、TCC、可靠消息最终一致性、最大努力通知。今天我们先说说2PC这个解决方案。

1. 什么是2PC

2PC即两阶段提交协议,是将整个事务流程分为两个阶段:准备阶段(Prepare phase)、提交阶段(commit
phase),2是指两个阶段,P是指准备阶段,C是指提交阶段。

整个事务过程由 事务管理器(TM:Transaction Manager)事务参与者(Resource Manager) 组成,事务管理器负责决策整个分布式事务的提交和回滚,事务事务参与者负责自己本地事务的提交和回滚。

两个阶段:

(1)准备阶段:TM给每个RM发送Prepare消息,每个RM在本地执行事务,并写Undo/Redo日志,此时本地事务没有提交。

(2)提交阶段:TM收到每个RM的执行失败或者超时消息时,直接给每个RM发送回滚(Rollback)消息;否则,发送提交(Commit)消息。每个RM根据消息执行提交或者回滚事务,并释放事务处理中使用的锁资源。注意:必须在最后阶段释放锁资源。

2. 解决方案

2.1 XA方案

2PC的传统方案是在数据库层面实现的,如Oracle、MySQL都支持2PC协议,为了统一标准减少行业内不必要的对
接成本,需要制定标准化的处理模型及接口标准,国际开放标准组织Open Group定义了分布式事务处理模型
DTP(Distributed Transaction Processing Reference Model)。

下面新用户注册送积分为例来说明:

分布式事务:解决方案之2PC理论_第1张图片

执行流程如下:

(1)应用程序(AP)持有用户库和积分库两个数据源。

(2)应用程序(AP)通过TM通知用户库RM新增用户,同时通知积分库RM为该用户新增积分,RM此时并未提交事务,此时用户和积分资源锁定。

(3)TM收到执行回复,只要有一方失败则分别向其他RM发起回滚事务,回滚完毕,资源锁释放。

(4)TM收到执行回复,全部成功,此时向所有RM发起提交事务,提交完毕,资源锁释放。

2.1.1 DTP模型

DTP模型定义如下角色:

  • AP(Application Program):即应用程序,可以理解为使用DTP分布式事务的程序。
  • RM(Resource Manager):资源管理器,可以理解为事务的参与者,一般情况下是指一个数据库实例,通过资源管理器对该数据库进行控制,资源管理器控制着分支事务。
  • TM(Transaction Manager):事务管理器,负责协调和管理事务,事务管理器控制着全局事务,管理事务生命周期,并协调各个RM。全局事务是指分布式事务处理环境中,需要操作多个数据库共同完成一个工作,这个工作即是一个全局事务。

DTP模型定义TM和RM之间通讯的接口规范叫XA,简单理解为数据库提供的2PC接口协议,因此基于数据库的XA协议来实现2PC又称为XA方案。

以上三个角色之间的交互方式如下:

(1)TM向AP提供 应用程序编程接口,AP通过TM提交及回滚事务。

(2)TM交易中间件通过XA接口来通知RM数据库事务的开始、结束以及提交、回滚等。

2.1.2 总结:

整个2PC的事务流程涉及到三个角色AP、RM、TM。AP指的是使用2PC分布式事务的应用程序;RM指的是资源管理器,它控制着分支事务;TM指的是事务管理器,它控制着整个全局事务。

(1)在准备阶段RM执行实际的业务操作,但不提交事务,资源锁定;

(2)在提交阶段TM会接受RM在准备阶段的执行回复,只要有任一个RM执行失败,TM会通知所有RM执行回滚操作,否则,TM将会通知所有RM提交该事务。提交阶段结束资源锁释放。

因此我们得出XA方案存在以下问题:

(1)需要本地数据库支持XA协议。

(2)资源锁需要等到两个阶段结束才释放,性能较差。

2.2 Seata方案

Seata是由阿里中间件团队发起的开源项目 Fescar,后更名为Seata,它是一个是开源的分布式事务框架。

传统2PC的问题(资源被锁定,直到最后阶段才释放,性能差)在Seata中得到了解决,它通过对本地关系数据库的分支事务的协调来驱动完成全局事务,是工作在应用层的中间件。主要优点是性能较好,且不长时间占用连接资源,它以高效并且对业务0侵入的方式解决微服务场景下面临的分布式事务问题。

Seata把一个分布式事务理解成一个包含了若干分支事务的全局事务。全局事务的职责是协调其下管辖的分支事务达成一致,要么一起成功提交,要么一起失败回滚。此外,通常分支事务本身就是一个关系数据库的本地事务,下图是全局事务与分支事务的关系图:

分布式事务:解决方案之2PC理论_第2张图片

与传统2PC 的模型类似,Seata定义了3个组件来协议分布式事务的处理过程:

分布式事务:解决方案之2PC理论_第3张图片

  • Transaction Coordinator (TC): 事务协调器,它是独立的中间件,需要独立部署运行,它维护全局事务的运行状态,接收TM指令发起全局事务的提交与回滚,负责与RM通信协调各个分支事务的提交或回滚。
  • Transaction Manager ™: 事务管理器,TM需要嵌入应用程序中工作,它负责开启一个全局事务,并最终向TC发起全局提交或全局回滚的指令。
  • Resource Manager (RM): 控制分支事务,负责分支注册、状态汇报,并接收事务协调器TC的指令,驱动分支(本地)事务的提交和回滚。

下面还是以新用户注册送积分为例来说明:

分布式事务:解决方案之2PC理论_第4张图片

具体的执行流程如下:

(1)用户服务的 TM 向 TC 申请开启一个全局事务,全局事务创建成功并生成一个全局唯一的XID。

(2)用户服务的 RM 向 TC 注册分支事务,该分支事务在用户服务执行新增用户逻辑,并将其纳入 XID 对应全局事务的管辖。

(3)用户服务执行分支事务,向用户表插入一条记录。

(4)逻辑执行到远程调用积分服务时(XID 在微服务调用链路的上下文中传播)。积分服务的RM 向 TC 注册分支事务,该分支事务执行增加积分的逻辑,并将其纳入 XID 对应全局事务的管辖。

(5)积分服务执行分支事务,向积分记录表插入一条记录,执行完毕后,返回用户服务。

(6)用户服务分支事务执行完毕。

(7)TM 向 TC 发起针对 XID 的全局提交或回滚决议。

(8)TC 调度 XID 下管辖的全部分支事务完成提交或回滚请求。

2.2.1 与传统2PC的差别

(1)架构层次方面,传统2PC方案的 RM 实际上是在数据库层,RM 本质上就是数据库自身,通过 XA 协议实现,而Seata的 RM 是以jar包的形式作为中间件层部署在应用程序这一侧的。

(2)两阶段提交方面,传统2PC无论第二阶段的决议是commit还是rollback,事务性资源的锁都要保持到Phase2完成才释放。而Seata的做法是在Phase1 就将本地事务提交,这样就可以省去Phase2持锁的时间,整体提高效率。

——End——
更多精彩分享,可扫码关注微信公众号哦。

在这里插入图片描述

你可能感兴趣的:(分布式事务)