Kafka研究系列之时间轮TimerWheel

what

      电商中经常会有些延时操作的业务,比如30分钟未支付则取消订单,kafka中消息到达broker后,写入延时队列,如果在超时时间内ISR列表节点没有全部同步消息,则返回客户端超时异常,因此时间轮的本质就是一个延时队列。

why

       java中自带的延时队列DeleyQueue,底层使用优先队列PriorityQueue实现,本质是一个小顶堆,在入队时需要和父节点不断比较,如果比父节点大,则插入,如果比父节点小,则交换当前位置和父节点的位置,循环比较,直到比父节点大为止。因此时间复杂度为log(n), 不满足kafka性能需要,因此设计时间轮算法,时间复杂度为O(1);

how

  1. 当消息到达broker后,分区主节点会进行写入操作,然后将消息封装成任务指定超时时间放入时间轮中。
  2. 同时有1个timer不断推进时间,将过期的任务取出提交到线程池
  3. 如果在没有过期前,分区ISR列表完成数据同步,则取消任务。

具体实现:

数据结构:

Kafka研究系列之时间轮TimerWheel_第1张图片

写入:

  1. 根据过期时间计算在时间轮上的刻度值(桶), 如果超时时间大于当前时间轮的最大范围则创建父时间轮
  2. 将任务追加到双向链表中
  3. 如果延时队列中没有该桶,则放入

读出:

  1. timer从延时队列中取出双向链表
  2. 判断里面的任务是否过期,过期则提交到线程池执行
  3. 没过期降级到子时间轮中
  4. 同时更新时间轮中的当前时间

 

你可能感兴趣的:(kafka研究系列)