23《Go语言入门》进程、线程、协程

这是我纯手写的《Go语言入门》,手把手教你入门Go。源码+文章,看了你就会,此处应有掌声!
文章中所有的代码我都放到了github.com/GanZhiXiong/go_learning这个仓库中。在看文章的时候,对照仓库中代码学习效果更佳!

目录

  • 进程
  • 线程
  • 任务调度
  • 进程和线程的区别
  • 多线程和多核
    • 内核线程
      • 超线程技术
  • 协程
    • 协程的目的
    • 协程的特点
    • 协程的原理
  • 线程和协程的比较
  • 参考
  • 支持

在学习并发编程前,我们需要了解以下概念。

进程

进程

  • 是一个具有一定独立功能的程序在一个数据集上的一次动态执行过程
  • 是操作系统进行资源分配和调度的一个独立单位
  • 是应用程序的运行的载体

线程

  • 线程是程序执行中一个单一的顺序控制流程
  • 是程序执行流的最小单位
  • 是处理器调度和分配的基本单位
  • 一个进程可以有一个或多个线程
  • 各个线程之间共享程序的内存空间

任务调度

大部分操作系统(Windows、Linux)的任务调度采用时间片轮转的抢占式调度方式
该调度方式如下:

  1. 在一个进程中,当一个线程任务执行几毫秒后,会由操作系统内核进行调度
  2. 通过硬件的计数器中断处理器,让该线程强制暂停并将该线程的寄存器放入内存中
  3. 通过查看线程列表决定接下来执行哪一个线程
  4. 然后从内存中恢复该线程的寄存器,最后恢复该线程的执行,从而去执行下一个任务

这种方式保证了每个线程轮流执行,由于CPU的执行效率非常高,时间片非常短,在各个任务之间快速地切换,给人的感觉就是多个任务在同时进行,这就是我们说的并发

23《Go语言入门》进程、线程、协程_第1张图片

进程和线程的区别

  • 线程是程序执行的最小单位,而进程是操作系统分配资源的最小单位
  • 一个进程由一个或多个线程组成,线程是一个进程中代码的不同执行路线
  • 进程之间相互独立,但是同一进程下的各个线程之间共享程序的内存空间(代码段、数据集、堆等)及一些进程级的资源(如打开文件和信号)
  • 线程上下文切换比进程上下文切换要快得多

多线程和多核

多核处理器是指在一个处理器上集成了多个运算核心从而提高计算能力。也就是有多个真正并行计算的处理核心,每一个处理核心对应一个内核线程。

内核线程

每一个处理核心对应一个内核线程。
比如:

  • 单核处理器对应一个内核线程
  • 双核处理器对应两个内核线程
  • 四核处理器对应四个内核线程

内核线程(Kernel Thread,KLT)就是直接由操作系统内核支持的线程。该线程由内核来完成线程切换,内核通过操作调度器对线程进行调度,并负责将线程的任务映射到各个处理器上。

超线程技术

目前处理器都采用了超线程技术将一个 物理处理核心模拟成两个逻辑处理核心,也就是两个内核线程。
所以我们看到的电脑一般都是双核四线程、四核八线程。
在操作系统中我们看到CPU数量是实际物理CPU数量的两倍,如双核四线程可以看到4CPU。

如我当前编写文章的这台mbp就是i7 6核12线程:
23《Go语言入门》进程、线程、协程_第2张图片
程序一般不会直接使用内核线程,而是使用内核线程的一种高级接口—轻量级进程(Lightweight Process,LWP),也就是我们常说的线程

协程

协程(Coroutines)基于线程之上,比线程更加轻量级。一个线程可以拥有多个协程。

协程的目的

传统应用中一般有会给网络请求创建一个线程去完成业务逻辑。如果是多个请求,就会创建多个线程来出来。
如果遇到很耗时的I/O行为,线程就会一直处于阻塞状态,如果很多线程都是出于这种空闲状态(等待该线程执行完成才能执行),这样就会造成资源应用不彻底,系统的吞吐能力下降。

最常见的很耗时的I/O行为比如JDBC,CPU会一直等待数据I/O操作的返回,这时线程根本没有利用CPU去做运算,而是处于空闲状态。同时使用过多的线程,也会带来更多的上下文切换开销。

解决上述问题有两个方案:

  • 单线程加上异步回调
    比如Node.js、Java的Vert.x
  • 协程
    协程的目的就是当出现长时间I/O操作时,让出当前的协程调度,执行下一个任务,来消除ContexSwith的开销

协程的特点

  • 线程切换由操作系统负责调度,协程由用户自己调度,因此减少了上下文切换,提高了效率
  • 线程默认Stack大小为1M,而协程更轻量,接近1K。因此可以在相同的内存中开启更多的协程
  • 由于协程在同一线程上,因此可以避免竞争关系二使用锁
  • 适用于被阻塞且需要大量并发的场景。但不适用于大量计算的多线程

协程的原理

协程的流程:

  1. 当出现I/O阻塞的时候,由协程的调度器进行调度
  2. 通过将数据流立刻yield掉(主动让出),并记录当前栈上的数据
  3. 阻塞完成后立刻在通过线程恢复栈,并把阻塞的结果放到这个线程上去跑

而跑在由Coroutine负责调度的线程称为Fiber,比如Golang里的go关键字其实就是负责开启一个Fiber,让func逻辑跑在上面。

由于协程的暂停完全由程序控制,发生在用户态上;而线程的阻塞状态是由操作系统内核来进行切换,发生在内核态上。
因此协程的开销远远小于线程,也就没有上下文切换的开销。

线程和协程的比较

比较项 线程 协程
占用资源 初始单位为1MB,固定不可变 初始一般为2KB,可随需要增大
调度所属 有OS内核完成 由用户完成
切换开销 设计模式切换(从用户态切换到内核态),16个寄存器、PC、SP等寄存器的刷新 只有三个寄存器的值修改:PC、SP、DX
性能问题 资源占用太高,频繁创建销毁会带来严重的性能问题 资源占用小,不会带来严重的性能问题
数据同步 需要锁等机制确保数据的一致性和可见性 不需要多线程的锁机制,因此只有一个线程。也不存在同时写变量冲突,在协程中控制共享资源不加锁,只需要判断状态就好了,所以执行效率比线程高很多

参考

  • 一文读懂什么是进程、线程、协程

支持

  • 我会持续编写【软件开发相关】的文章,保持每周至少一篇文章。
  • 如果你也是【软件工程师】,【关注❤️我】,一定会对你有所帮助。
  • 如果这篇文章对你有所帮助,那就麻烦,【点赞】
  • 您的支持将给与我更大的动力,谢谢。

你可能感兴趣的:(#,Go语言入门,go,golang,go语言)