定时器使得我们可以延迟若干时间执行某项任务,或者以某一时间周期性执行某项任务,Linux系统本身也具备定时器能力,Go语言是定时器是基于系统调用实现的吗?另外,Go语言不是多协程吗,定时器触发时,是在哪个协程执行任务的呢?创建任务的协程吗?
基本操作
Go语言time包提供了时间/定时器相关的API,如获取当前系统时间(可以到达纳秒级别),协程休眠指定时间,延迟指定时间执行某项任务,以某一时间周期性执行某项任务等等,操作如下:
package main
import (
"fmt"
"time"
)
func main() {
//纳秒时间戳
t := time.Now().UnixNano()
fmt.Println(t) //1652510180050345000
//秒时间戳
t = time.Now().Unix()
fmt.Println(t) //1652510180
//格式化显示时间
fmt.Println(time.Now().Format("2006-01-02 15:04:05")) //2022-05-14 14:36:20
// 一秒后执行函数
time.AfterFunc(time.Second, func() {
fmt.Println(time.Now().Format("2006-01-02 15:04:05"))
})
// 以一秒为周期,定时触发
ticker := time.NewTicker(time.Second)
go func() {
for {
<- ticker.C //时间触发时,管道可读
fmt.Println(time.Now().Format("2006-01-02 15:04:05"))
}
}()
//协程休眠3秒
time.Sleep(10 * time.Second)
}
注意格式化时间显示时间年月日时分秒,用的是"2006-01-02 15:04:05",Format方法使用其他格式如"2022-05-14 14:36:20"可以吗?按理说这两个时间字符串格式是一样的,只是值不一样罢了,结果应该没区别。写个小程序测试下,你会发现,结果有点奇怪:
package main
import (
"fmt"
"time"
)
func main() {
//格式化显示时间
fmt.Println(time.Now().Format("2022-05-14 14:36:20"))
//输出:141414-02-540 540:26:140
}
这是什么?为什么不是正常的年月日时分秒显示呢?这就需要研究下Go语言Format方法,支持的格式标识,比如其他一些语言使用Y表示年,M表示月等。Go语言定义的年月日等标识如下:
const (
stdZeroMonth // "01"
stdZeroDay // "02"
stdHour = iota + stdNeedClock // "15"
stdZeroMinute // "04"
stdZeroSecond // "05"
stdLongYear = iota + stdNeedDate // "2006"
//省略了其他标识定义
)
看到了吧,"2006"、"01"等才是Go语言定义的时间格式标识,所以"2006-01-02 15:04:05"才能正常显示年月日时分秒,而其他如"2022-05-14 14:36:20"的结果就有些不符合预期了。当然,这里还省略了很多其他时间格式标识,就定义在time/format.go文件,有兴趣的读者可以自己研究。
再回顾上面的程序,time.AfterFunc可以在指定时间执行函数,time.NewTicker可以以一定时间周期触发时间,time.Sleep可以使协程休眠一定时间(过期后再恢复协程的调度),这如何实现呢?要知道项目中可能大量使用定时器,Go语言如何能在精确的时间触发定时事件呢?另外time.AfterFunc,执行函数时,是在哪个协程执行呢?添加定时器的协程吗?
实现原理-堆
Go语言如何能在精确的时间触发定时事件呢?这意味着定时器的增删改查效率必须要高,不然难道每次都遍历所有定时器,判断哪些该触发吗?如果维护所有定时器有序呢?只需要查找第一个定时器,如果到期了则触发,并且继续查找;如果未到期也就不用继续查找了,因为后面的到期时间肯定大于第一个定时器的到期时间。但是为了维护有序,添加定时器、修改定时器以及删除定时器的效率又太低。
需要具备一定的有序性,增删改查性能还要高,什么数据结构合适呢?有一种数据结构叫堆(最大堆,最小堆),以最小堆为例,它本质上是一棵完全二叉树,只是要求任何一个节点的值,都小于左右两个子节点的值,所以根节点的值一定是最小的。这样如果定时器使用了最小堆,只需要判断根节点是否到期,如果到期则触发并删除根节点,而删除的过程中还需要保证剩下的节点依然满足最小堆的条件;这样一来,获取下一个最近到期的定时器,时间复杂度依然是O(1)。那么,最小堆,节点的删除以及添加的时间复杂度是多少呢?也是比较低的,O(logn)。
普通二叉树节点通常需要左右left、right指针,而堆是完全二叉树,可以基于数组实现的,为什么呢?因为父子节点的索引是有关系的,如下图:
堆在插入节点时,通常先添加到数组的最后,再与父节点比较,如果满足堆的定义,则结束;否则,与父节点交换。持续比较交换到根节点为止,这一过程称之为上浮。一棵节点数为N的完全二叉树,高度为logn,也就是说比较交换最多需要执行logn次,即堆的插入时间复杂度为O(logn)。
堆在删除根节点时,通常先交换根节点与最后一个节点,再直接删除最后一个节点(也就是根节点);此时根节点可能不满足堆的定义,所以,还需要与左右两个子节点比较。持续比较交换到最后一个节点为止,这一过程称之为下沉。删除的时间复杂度同样为O(logn)。删除过程逻辑如下:
普通堆是完全二叉树,而Go语言使用的是四叉树,为什么呢?树更低,时间复杂度更低呗。结合我们介绍的堆的插入与删除逻辑,我们看看Go语言四叉堆的插入与上浮逻辑:
func siftupTimer(t []*timer, i int) int {
tmp := t[i]
for i > 0 {
//四叉树,父节点索引是(i - 1) / 4
p := (i - 1) / 4 // parent
if when >= t[p].when { //父节点小于当前节点,break
break
}
t[i] = t[p] //交换
i = p
}
if tmp != t[i] { //交换
t[i] = tmp
}
return i
}
//添加定时器
func doaddtimer(pp *p, t *timer) {
i := len(pp.timers)
pp.timers = append(pp.timers, t)
siftupTimer(pp.timers, i)
//如果是根节点,记录过期时间(最小)
if t == pp.timers[0] {
atomic.Store64(&pp.timer0When, uint64(t.when))
}
}
Go语言四叉堆的删除与下沉逻辑非常类似,这里就不再赘述,可以参考runtime/time.go文件,dodeltimer0与siftdownTimer这两个函数。
另外可以看到,结构timer就代表了一个定时器,包含了定时器的过期时间,执行周期,执行方法等等,定义如下:
type timer struct {
// Timer wakes up at when, and then at when+period, ... (period > 0 only)
when int64
period int64
//执行方法+参数
f func(any, uintptr)
arg any
seq uintptr
}
思考一下,Go语言是多线程+多协程程序,如果多个协程并发添加定时器呢?如果全局只有一个定时器堆,是不是每次操作都需要加锁呢?Go语言低版本就是这么实现的。现在是每一个P都维护了一个定时器堆,从doaddtimer函数就能看出来,传入了当前线程M绑定的P,而定时器也是添加到该P的定时器堆。看看P结构定义的定时器相关字段:
type p struct {
//定时器堆
timers []*timer
// The when field of the first entry on the timer heap.
// This is updated using atomic functions.
// This is 0 if the timer heap is empty.
//定时器堆根节点的过期时间(最小)
timer0When uint64
}
最后读者要注意的是,time包定义了很多定时器相关的函数,但是这些函数的具体实现往往是在runtime包,比如
func Sleep(d Duration) //实现函数为 timeSleep
func startTimer(*runtimeTimer) //time.NewTicker、time.After等都是基于startTimer函数添加的定时器
func stopTimer(*runtimeTimer) bool
func resetTimer(*runtimeTimer, int64) bool //timeSleep基于resetTimer实现
可以简单看看time.AfterFunc函数的实现:
func AfterFunc(d Duration, f func()) *Timer {
t := &Timer{
r: runtimeTimer{
when: when(d),
f: goFunc, //启动一个协程执行函数f
arg: f,
},
}
startTimer(&t.r)
return t
}
定时器与调度器schedule
每一个P都维护一个定时器四叉堆,那么Go语言是在什么时候检测是否要定时器过期呢?这肯定与调度器schedule有关了:
func schedule() {
//检测定时器并执行
checkTimers(pp, 0)
//查找可执行协程
}
func checkTimers(pp *p, now int64) (rnow, pollUntil int64, ran bool) {
//最近过期的定时器
next := int64(atomic.Load64(&pp.timer0When))
if next == 0 {
// No timers to run or adjust.
return now, 0, false
}
if now == 0 {
now = nanotime()
}
//第一个定时器没有过期,返回
if now < next {
return now, next, false
}
if len(pp.timers) > 0 {
adjusttimers(pp, now)
for len(pp.timers) > 0 {
//运行定时器(获取第一个定时器,如果过期则执行,否则返回时间差)
if tw := runtimer(pp, now); tw != 0 {
//第一个定时器没有过期,结束循环
break
}
ran = true
}
}
}
这下都明白了,调度器schedule在查找可运行协程时,先通过checkTimers检测定时器是否过期,并执行。也就是说,定时器函数f是在调度调度栈执行的;而且,如果某一个协程长时间运行(假设也没有被抢占),也有可能导致定时器的延后触发。
系统时间
最后再思考一个问题,Go语言获取时间戳甚至可以精确到纳秒级别,按理来说,获取时间通常需要通过系统调用完成,而系统调用又会导致程序的低性能。那么Go语言是如何高性能的实现系统时间的获取呢?
这里需要了解一个概念,Linux VDSO(virtual dynamic shared object),他是为了优化用户程序频繁的系统调用,把系统调用改成用户态的函数调用,gettimeofday就是其中一个。
VDSO的介绍可以参考文章:https://zhuanlan.zhihu.com/p/...
总结
本篇文章主要介绍了Go语言定时器的基本使用以及实现原理,堆(最大堆/最小堆)有很多应用场景,如定时器,优先级队列等等。用户程序可能添加很多定时任务,而调度器schedule在调度协程之前,会检测是否有定时任务到期,如果有则执行该定时任务。