啊?这也算事务?!

作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO

联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬

学习必须往深处挖,挖的越深,基础越扎实!

阶段1、深入多线程

阶段2、深入多线程设计模式

阶段3、深入juc源码解析

阶段4、深入jdk其余源码解析

阶段5、深入jvm源码解析

事务的难点在哪?

之前分享过一个观点,设计模式最难的不是代码、也不是设计思想,而是如何准确判断每种设计模式的使用时机。一些人可能对23种设计模式如数家珍、倒背如流,却常常在阴沟里翻船,不知不觉就用了各种if else到处打补丁。

同理,事务本身其实也不难,无论本地事务还是分布式事务,业界都有成熟的解决方案。事务最大的问题也在使用时机:

人们往往不知道此处需要事务

佣金错误案例

日常开发时,我们很容易写出下面的代码:

@Transactional(rollbackFor = Exception.class)
public void execute() {
    updateUserPoint();
    updateUserLevel();
}

由于用户积分和用户等级需要满足“要么同时成功,要么同时失败”的特性,所以加上了@Transactional保证事务。很多人都十分清楚@Transactional什么情况下会失效,但事务往往总在你意想不到的地方失效。

请大家观察下面这段代码,看看有什么问题(代码做了适当简化):

// 根据订单号获取佣金
public List getCmsList(String outerOid) {
    if (StringUtil.isEmpty(outerOid)) {
        return Collections.emptyList();
    }

    List cmsList;

    try {
        // 构造请求参数
        CmsCalculationReqBO reqBO = generateParam(outerOid);
        log.info("CmsCalculateBiz.getCmsList, outerOid:{}, reqBO:{}", outerOid, reqBO);

        // 计算佣金
        cmsList = cmsCalculatorSelector.select(reqBO).calculateAllCms(reqBO);
        log.info("CmsCalculateBiz.getCmsList, outerOid:{}, reqBO:{}, cmsList:{}", outerOid, reqBO, cmsList);

    } catch (Exception e) {
        log.info("CmsCalculateBiz.getCmsList, request error, outerOid:{}", outerOid, e);
    }

    return cmsList;
}

// 计算佣金(每计算一种类型的cms,就往cmsList中add)
public List calculateAllCms(CmsCalculationReqBO reqBO) {
    // ...

    CmsCalculateContextBO contextBO = generateCmsContextBO(reqBO);

    /**
     * 注意:以下执行顺序不能改变!!!!!
     *
     * 计算V0 分享奖励
     * 计算V1 自售或者分享奖励
     * 计算V2 平台补贴
     * 计算V2 自售补贴
     * 计算V2 自售或者分享奖励
     * 计算V2 星火奖励
     * 计算V3 平台补贴
     * 计算V3 自售补贴
     * 计算V3 自售或者分享奖励
     * 计算V3 星火奖励
     */

    calculateV0Profit(reqBO, contextBO);

    calculateV1Profit(reqBO, contextBO);

    calculateV2SubsidyProfit(reqBO, contextBO);

    calculateV2Profit(reqBO, contextBO);

    calculateV2Spark(reqBO, contextBO);

    calculateV3SubsidyProfit(reqBO, contextBO);

    calculateV3Profit(reqBO, contextBO);

    calculateV3Spark(reqBO, contextBO);

    return contextBO.getCmsList();
}

大致逻辑是:

啊?这也算事务?!_第1张图片

上游方法依赖getCmsList(),然后批量插入用户下单所得佣金,具体佣金计算逻辑在calculateAllCms()。一个用户下单所得佣金比较复杂,最终返回的cmsList类似这种:

[
    {
        "bizId": "xxx",
        "cmsAmt": 1,
        "cmsDesc": "V2平台补贴",
        "outerOid": "xxx",
        "uid": 10086
    },
    {
        "bizId": "xxx",
        "cmsAmt": 15,
        "cmsDesc": "V2分享奖励",
        "outerOid": "xxx",
        "uid": 10086
    },
    {
        // 本订单其他类型佣金...
    }
]

一个用户,它的佣金假设有A、B、C三种类型,要么同时插入3种佣金,要么都不插入(后期有问题直接重跑即可),最怕的就是那种只插入一半的情况,修复很麻烦(需要删除原有的,甚至还要回滚由佣金引发的一系列操作)。

而上面的代码,就可能导致部分佣金写入的问题:

啊?这也算事务?!_第2张图片

假设calculateAllCms()中需要计算3类佣金,A、B都没问题,C类佣金计算失败抛异常,那么就会进入上面的catch代码块。然而,此时cmsList中已经有A、B类佣金,代码继续往下走,就会return cmsList,返回了不完整的佣金列表,最终数据库插入的就是不完整的佣金(缺少C类佣金)。

catch里面可以直接返回emptyList,不插入总比插入不完整的好,后面再补就是了。

小结

分布式应用中也很容易因为疏忽导致数据不一致,比如我们往往会引入Manager层,为的是对其他Service的API接口做一层封装:

@Slf4j
@Component
public class MemberServiceManager {
    @Resource
    private MemberDirectRecordService memberDirectRecordService;'
        
        
    public MemberDirectRecordTO getDirectRecord(Long uid) {
        if (Validator.isNotId(uid)) {
            return null;
        }
        try {
            ServiceResultTO resultTO =memberDirectRecordService.getDirectRecord(uid);
            if (Validator.isNullOrEmpty(resultTO) || Validator.isFalse(resultTO.getSuccess())) {
                return null;
            }
            return resultTO.getData();
        } catch (Exception e) {
            log.error("getDirectRecord, error, uid:{}", uid, e);
        }
        return null;
    }
    
}

上面这种写法,由于异常被吞了,调用者往往很难区分到底是远程调用超时导致null,还是接口查询本身为null。如果调用者的逻辑是:

if(result不为null){ // 本意是不为null进行一些操作
   do something;   
}

但如果这个“null”仅仅是因为RPC远程调用失败导致的,而不是对应的数据真的为null,本次操作就会被遗漏,效果和上面的佣金计算是一样的。

这些,其实都是事务范畴,try catch处理不当,容易导致问题被忽略,最终发生数据不一致的问题。

你可能感兴趣的:(生产故障,生产故障)