架构师之路011 进程 线程 协程

如果我们实际就只有一个单核的 CPU,是否就没办法实现多任务呢?当然可以。方法是把 CPU 的时间切成一段段时间片,每个时间片只运行某一个软件。这个时间片给软件 A,下一个时间片给软件 B。因为时间片很小,我们会感觉这些软件同时都在运行。这种分时间片实现的多任务系统,我们把它叫分时系统。分时系统的原理说起来比较简单,把当前任务状态先保存起来,把另一个任务的状态恢复,并把执行权交给它即可。这里面涉及的问题有:任务是什么,怎么抽象任务这样一个概念;任务的状态都有什么?怎么保存与恢复;什么时机会发生任务切换?从今天的现实看,任务的抽象并不是唯一的。大部分操作系统提供了两套:进程和线程。有的操作系统还会提供第三套叫协程(也叫纤程)。

总结就一句话:执行体的上下文,就是一堆寄存器的值。要切换执行体,只需要保存和恢复一堆寄存器的值即可。无论是进程、线程还是协程,都是如此。

多进程
多线程

操作系统提供的标准网络 IO 有以下这些成本:系统调用机制产生的开销;数据多次拷贝的开销(数据总是先写到操作系统缓存再到用户传入的内存);因为没有数据而阻塞,产生调度重新获得执行权,产生的时间成本;线程的空间成本和时间成本(标准 IO 请求都是同步调用,要想 IO 请求并行只能使用更多线程)。

协程 出现

系统中有大量的 IO 请求,大部分的 IO 请求并未命中而发生调度。另外,网络服务器的存储是个共享状态,也必然伴随着大量的同步与互斥操作。综上,协程就是为了这样两个目的而来:回归到同步 IO 的编程模式;降低执行体的空间成本和时间成本。但是,大部分你看到的协程(纤程)库只是一个半吊子。它们都只实现了协程的创建和执行权的切换,缺了非常多的内容。包括:协程的调度;协程的同步、互斥与通讯;协程的系统调用包装,尤其是网络 IO 请求的包装。这包含太多的东西,基本上你看到的服务端操作系统所需的东西都要包装一遍。而且,大部分协程库,连协程的基础功能也是半吊子的。这里面最难搞的是堆栈。为什么协程的堆栈是个难题?因为,协程的堆栈如果太小则可能不够用;而如果太大则协程的空间成本过高,影响能够处理的网络请求的并发数。理想情况下,堆栈大小需要能够自动适应需要。

解决了什么问题

有什么缺点

这世界上有完备的协程库么?有。有两个语言干了这事儿:Erlang 和 Go 语言。Erlang 语言它基于虚拟机,但是道理上是一致的。Go 语言里面的用户态 “进程” 叫 goroutine。它有这样一些重要设计:堆栈开始很小(只有 4K),但可按需自动增长;坚决干掉了 “线程局部存储(TLS)” 特性的支持,让执行体更加精简;提供了同步、互斥和其他常规执行体间的通讯手段,包括大家非常喜欢的 channel;提供了几乎所有重要的系统调用(尤其是 IO 请求)的包装。

你可能感兴趣的:(架构师之路,java,开发语言)