分布式事务了解吗?你们如何解决分布式事务问题的?
只要聊到做了分布式系统,必问分布式事务,若你对分布式事务一无所知的话,确实很坑,起码得知道有哪些方案,一般怎么来做,每个方案的优缺点是什么。
现在面试,分布式系统成了标配,而分布式系统带来的分布式事务也成了标配.
你做系统肯定要用事务,那你用事务的话,分布式系统之后肯定要用分布式事务.
先不说你搞过没有,起码你得明白有哪几种方案,每种方案可能有啥坑?
比如TCC方案的网络问题、XA方案的一致性问题.
举个例子,比如公司经常团建,然后一般会有个主席(就是负责组织团建的那个人)。
tb,team building,团建
这就是所谓的XA事务,两阶段提交.
有一个事务管理器,负责协调多个数据库(资源管理器)的事务,事务管理器先问各个数据库你准备好了吗?
这种分布式事务方案,比较适合单块应用中,跨多个库的分布式事务,而且因为严重依赖于数据库层面来搞定复杂的事务,效率很低,绝对不适合高并发场景.
如果要玩,那么基于Spring + JTA就可以搞定,自己随便搜个demo看看~
这个方案,很少用,一般某个系统内部如果出现跨多个库的操作,是不合规的!
现在的微服务,一个大的系统分成几十甚至上百个服务。一般来说,我们的规约,是要求每个服务只能操作自己对应的一个数据库!
如果你要操作别的服务对应的库,不允许直连别的服务的库,违反微服务架构的规范
你随便交叉访问,几百个服务的话,全体乱套,这样的一套服务是没法管理的,会经常数据被别人改错,自己的库被别人写挂!
如果你要操作别人的服务的库,你必须通过调用别的服务的接口实现,绝对不允许你交叉访问别人的数据库!
全称:Try、Confirm、Cancel
对各个服务的资源做检测,对资源进行锁定或者预留
在各个服务中执行实际的操作
如果任何一个服务的业务方法执行出错,那么这里就需要进行补偿,即执行已操作成功的业务逻辑的回滚操作
涉及到两个银行的分布式事务,如果用TCC方案来实现,思路是这样的:
该方案说实话几乎很少使用,但也有使用场景.
因为这个事务的回滚实际上严重依赖于你自己写代码来回滚和补偿了,会造成补偿代码巨大,非常恶心!
比如说我们,一般来说和钱相关的支付、交易等相关的场景,我们会用TCC,严格严格保证分布式事务要么全部成功,要么全部自动回滚,严格保证资金的正确性!
除非你是真的一致性要求太高,是系统中核心之核心的场景!
常见的就是资金类的场景,那可以用TCC方案,自己编写大量的业务逻辑,自己判断一个事务中的各个环节是否ok,不ok就执行补偿/回滚代码
而且最好是你的各个业务执行的时间都比较短
但是说实话,一般尽量别这么搞,自己手写回滚逻辑,或者是补偿逻辑,实在太恶心了,业务代码也很难维护
ebay搞出来的这么一套思想
这个方案保证了最终一致性
哪怕B事务失败了,但是A会不断重发消息,直到B那边成功为止
最大的问题就在于严重依赖于数据库的消息表来管理事务,这个会导致高并发场景无力,难以扩展呢,一般确实很少用
干脆不用本地的消息表了,直接基于MQ来实现事务。比如阿里的RocketMQ就支持消息事务!
这个还是比较合适的,目前国内互联网公司大都是这么玩的,要不你举用RocketMQ支持的,要不你就自己基于类似ActiveMQ?RabbitMQ?自己封装一套类似的逻辑出来,总之思路就是这样子的
系统A本地事务执行完后,发送一个消息到MQ
有一专门消费MQ的最大努力通知服务,会消费MQ,然后写入数据库中记录下来,亦可是放入内存队列,接着调用系统B的接口
若系统B执行成功就ok;若系统B执行失败,那么最大努力通知服务就定时尝试重新调用系统B,反复N次,最后还是不行才放弃
最大努力通知方案示意图
你们公司是如何处理分布式事务的呢?欢迎评论交流!!!
讲真的,该突破面试教程没法带着大家实战,因为定位不是这个.
如果你真的被问到,你可以这么说,我们某某特别严格的场景,用的是TCC来保证强一致性;然后其他的一些场景基于了阿里的RocketMQ来实现了分布式事务~
你找一个严格资金要求绝对不能错的场景,你可以说你是用的TCC方案
如果是一般的分布式事务场景,订单插入之后要调用库存服务更新库存,库存数据没有资金那么的敏感,可以用可靠消息最终一致性方案
Rocketmq 3.2.6之前的版本,是可以按照上面的思路来的,但是之后接口做了一些改变.
当然如果你愿意,你可以参考可靠消息最终一致性方案来自己实现一套分布式事务,比如基于RabbitMQ来玩儿。
你其实用任何一个分布式事务的这么一个方案,都会导致你那块儿代码会复杂10倍。很多情况下,系统A调用系统B、系统C、系统D,我们可能根本就不做分布式事务。如果调用报错会打印异常日志。
每个月也就那么几个bug,很多bug是功能性的,体验性的,真的是涉及到数据层面的一些bug,一个月就几个,两三个?如果你为了确保系统自动保证数据100%不能错,上了几十个分布式事务,代码太复杂;性能太差,系统吞吐量、性能大幅度下跌。
99%的分布式接口调用,不要做分布式事务,直接就是监控(发邮件、发短信)、记录日志(一旦出错,完整的日志)、事后快速的定位、排查和出解决方案、修复数据。
每个月,每隔几个月,都会对少量的因为代码bug,导致出错的数据,进行人工的修复数据,自己临时动手写个程序,可能要补一些数据,可能要删除一些数据,可能要修改一些字段的值。
比你做50个分布式事务,成本要来的低上百倍,低几十倍.
trade off,权衡,要用分布式事务的时候,一定是有成本,代码会很复杂,开发很长时间,性能和吞吐量下跌,系统更加复杂更加脆弱反而更加容易出bug;好处,如果做好了,TCC、可靠消息最终一致性方案,一定可以100%保证你那快数据不会出错。
1%,0.1%,0.01%的业务,资金、交易、订单,我们会用分布式事务方案来保证,会员积分、优惠券、商品信息,其实不要这么搞了.
上面的这些面试题都整理成了PDF文档,希望能帮助到你面试前的复习并找到一个好的工作,相对来说也节省了你在网上搜索资料的时间来学习!!!
附欢迎关注我的公种号:it资源之家 ,扫描下面二维码即可领取更多一线大厂Java面试题资料!
欢迎大家评论区一起交流,相互提升;整理资料不易,如果喜欢文章记得点个赞哈,感谢大家支持!!!