协程是Go语言最大的特色之一。
协程并不是Go发明的概念,支持协程的变成语言有很多。Go在语言层面直接提供对协程的支持称为goroutine。
进程
进程是应用程序启动的实例,每个进程都有独立的内存空间,不同进程之前通过进程间的通信方式实现。
线程
线程从属于进程,每个进程至少包含一个线程,线程是CPU调度的基本单位,多个线程之间可以共享进程的资源并通过共享内存等线程间的通信方式来通信。
协程
协程可以理解为一种轻量级线程,与线程相比,协程不受操作系统调度,协程调度器由用户应用程序提供,协程调度器按照调度策略把协程调度到线程中运行。Go应用程序得到协程调度器由runtime包提供,用户使用go关键字即可创建协程。
在高并发应用中频繁的创建线程会造成不必要的开销,所以有了线程池技术。在线程池中预先保存一定数量的线程,新任务将不再以创建线程的方式去执行,而是将任务发布到任务队列中,线程池中的线程不断地从任务队列中取出任务并执行,这样可以有效地减少线程的创建和销毁带来的开销。
我们把任务队列中的每个任务称作G,而G往往代表一个函数。线程池中的worker线程不断地从任务队列中取出任务并执行,而worker线程则交给操作系统进行调度。
如果worker线程执行的G任务中发生系统调用,则操控系统会将线程置为阻塞状态,也就意味着该线程在怠工,由于消费任务队列中的worker线程变少了,所以线程池消费任务队列的能力变弱了。
如果任务队列中的大部分任务都进行系统调用,则会让这种状态恶化,大部分worker线程进入阻塞状态,从而任务队列中的任务产生堆积。
解决这个问题的一个思路是重新审视线程池中线程的数量,增加线程池中的线程数量,以在一定程度上提高消费力,但随着线程数量增多,过多线程争抢CPU资源,消费能力会有上限,甚至出现消费能力下降的现象,如下图所示。
过多的线程会导致上下文切换的开销变大,而工作在用户态的协程能大大减少上下文切换的开销。协程调度器把可运行的协程逐个调度到线程中执行,同时及时把阻塞的协程调度出协程,从而有效地避免了线程的频繁切换,达到了使用少量线程实现高并发地效果。
多个协程分享操作系统分给线程的时间片,从而达到充分利用CPU算力的目的,协程调度器则决定了协程执行的顺序。
线程可分为用户线程和内核线程,用户线程由用户创建、同步和销毁,内核线程则由内核来管理。根据用户线程管理方式的不同,分为三种线程模型。
Go协程调度模型中包含三个关键实体,machine(简称M)、processor(简称P)和 goroutine (简称G)。
M必须持有P才可以执行代码,跟系统中的其他线程一样,M也会被系统调用阻塞。P的个数在程序启动时决定,默认情况下等同于CPU的核数,可以使用环境变量 GOMAXPROCS 或在程序中使用runtime.GOMAXPROCS()犯法指定P的个数。
M的个数通常稍大于P的个数,因为除了运行Go代码,runtime包还有其他内置任务需要处理。一个简单的调度器模型如下图所示。
上图中包括两个工作线程M,每个M持有一个处理器P,并且每个M中有一个绿色背景的协程G在运行。其余的协程正在等待被调用,它们位于被称为runqueues的队列中。每个处理器P中拥有一个runqueues队列,此外还有一个全局的runqueues队列,由多个处理器共享。
早期的调度器实现中(Go1.1之前)只包含全局的runqueues,多个处理器P通过互斥锁来调度队列中的线程,在多个CPU或多核环境中,多个处理器需要经常争抢锁来调度全局队列中的协程,严重影响了并发执行效率。后来便引入了局部runqueues,每个处理器P访问自己的runqueues时不需要加锁,大大提高了效率。
一般来说,处理器P中的协程G额外再创建的协程会加入本地的runqueues中,但如果本地的队列已满,或者阻塞的协程被唤醒,则协程会被放入全局的runqueues中,处理器P除了调度本地的runqueues中的协程,还会周期性地从全局runqueues中摘取协程来调度。
每个处理器P维护着一个协程G的队列,处理器P依次将协程G调度到M中执行。同时每个P会周期性地查看全局队列中是否有G待运行并将其调度到M中执行,全局队列中的G主要来自从系统调用中恢复的G。
当线程在执行系统调用时,可能会阻塞,对应到调度器模型,如果一个协程发起系统调用,那么对应的工作线程会被阻塞,这样一来,处理器P的runqueues队列中的协程将得不到调用,相对于队列中的所有协程都被阻塞
前面提到P的个数默认等于CPU的核数,每个M必须持有一个P才可以执行G。一般情况下M的个数略大于P的个数,多出来的M将会在G产生系统调用时发挥作用。与线程池类似,Go也提供一个M的池子,需要时从池子中获取,用完放回池子,不够时就再创建一个。
当M运行的某个G产生系统调用时,过程如下图所示。
当Go即将进入系统调用时,M0将释放P,进而某个冗余的M1获取P,继续执行P队列中剩下的G。M0由于陷入系统调用而被阻塞,M1接管M0的工作,只要P不空闲,就可以保证充分利用CPU。
冗余的M的来源有可能是缓存池,也可能是新建的。当Go结束系统调用后,根据M0是否能获取到P,对G0进行不同的处理:
通过go关键字创建的协程通常会优先放到当前协程对应的处理器队列中,可能有些协程自身不断地派生出新的协程,而有些协程不派生协程。如此一来,多个处理器P中维护地G队列有可能是不均衡的,如果不加以控制,则有可能出现部分处理器P非常繁忙,而部分处理器怠工的情况。
为此,Go调度器提供了工作量切取策略,当某个处理器P没有需要调度的协程时,将从其他处理器中切取协程。
发生切取前右侧的处理器P在没有协程需要调度时会查询全局队列,如果全局队列中也没有协程需要调度,则会从另一个正在运行的处理器P中偷取协程,每次偷取一半。
调度器会监控每个协程的执行时间,一旦执行时间过长且有其他协程在等待时,会把协程暂停,转而调度等待的协程,以达到类似于时间片轮转的效果。