airflow2使用MutilScheduler的时候未同步任务状态

文章目录

    • 出现的问题
      • 部署方式:
      • 现象
    • 分析
    • 暂时的解决方式

出现的问题

部署方式:

  1. 一个Trigger
  2. 一个Webserver
  3. 两个Scheduler

现象

当一个Defferable Task有机会立刻完成时,这个任务会被Mark Failed。而且是随机的,不管你有几个scheduler,只要用到Defferable Task都会有这种问题。

分析

相关Issue
对于这个情况的分析都在这个Issue里面,里面也有相关的解决方法,但是没人理我,可能大家都没有碰到这个情况吧。

暂时的解决方式

在写我们自己的Defferable Task时,把next_method这个参数修改成为自己自定义的字段
airflow2使用MutilScheduler的时候未同步任务状态_第1张图片
airflow2使用MutilScheduler的时候未同步任务状态_第2张图片
之前源码的逻辑是:当一个Defferable Task完成之后,把这个任务标记成SCHEDULED,再让scheduler调度一次。但是这个过程不能保证调度任务的原子性,所以我们直接在trigger这里把这个任务Mark 成 Success掉
但是mark之后try_number 已经被减1了,所以日志取不到,我们需要把try_number针对于这种情况还原一下。

经过这种修改之后,Issue里面的情况不会再次出现。

你可能感兴趣的:(工具,airflow)