[2.1.6]进程管理——线程的实现方式和多线程模型

文章目录

  • 第二章 进程管理
    • 线程的实现方式和多线程模型
    • 一、线程的实现方式
      • (一)用户级线程
      • (二)内核级线程
    • 二、多线程模型
      • (一)一对一模型
      • (二)多对一模型
      • (三)多对多模型
    • 小结

第二章 进程管理

线程的实现方式和多线程模型

线程

  • 线程的实现方式
    • 用户级线程
    • 内核级线程
  • 多线程模型
    • 一对一模型
    • 多对一模型
    • 多对多模型

一、线程的实现方式

(一)用户级线程

  用户级线程(User-Level Thread, ULT)

  历史背景:早期的操作系统(如:早期Unix)只支持进程,不支持线程。当时的“线程”是由线程库实现的。

  在这个时代,操作系统看到的依然的只有进程。但是程序员们写的程序当中,可以使用线程库来实现多个线程并发地运行这样的事情。

[2.1.6]进程管理——线程的实现方式和多线程模型_第1张图片

  QQ的视频聊天、文字聊天、传送文件,如果要让这三个事情并发地运行的话,那么在不支持线程的操作系统当中,我们可以分别建立三个进程,这三个进程,分别是处理其中的某一个事情的。

  进程1的代码是不断地来处理视频聊天这件事情的,进程2是不断地来处理文字聊天,进程3是不断地处理传送文件的。用一个while(true)控制其不停地循环。

  那么,其实我们可以用这样的方式来实现,让这三段代码并发地运行,如下图。

[2.1.6]进程管理——线程的实现方式和多线程模型_第2张图片

  由于我们while循环执行速度是非常快的,所以这三个事情可以看作并发执行。

  从代码的角度看,线程其实就是一段代码逻辑。上述三段代码逻辑上可以看作三个“线程”。while循环就是一个最弱智的“线程库”,线程库完成了对线程的管理工作(如调度)。

  我们上面通过一个while循环和若干个if语句,就实现了一个最简单的线程库。线程库本质上就是这么个意思。

  很多编程语言提供了用于管理线程的强大的线程库,可以实现线程的创建、销毁、调度等功能。

  操作系统仍然只能看到进程,只不过程序员用代码逻辑实现了内部各个事件的并发,通过线程库的方式创建了“逻辑上的线程”,也就是所谓的用户级线程。


  思考:

  1、线程的管理工作由谁来完成?

  是由应用程序通过线程库来完成的(比如我们上面用while循环,里面三个if语句管理线程的并发执行),并不是操作系统负责的。

  用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)。

  2、线程切换是否需要CPU变态?

  很显然,线程之间的交替执行,只是代码语句中的条件,和请求操作系统服务没有半毛钱关系。是应用程序自己内部执行的,不需要操作系统的干涉,不需要CPU切换状态。

  用户级线程中,线程切换用户态下即可完成,无需操作系统干预。

  3、操作系统能否意识到用户级线程的存在?

  显然,操作系统只能看到这个进程的存在,它只知道有这样一个进程,有一整块代码。这一整块代码里面又分别被分为了几个线程,操作系统是意识不到这些线程的存在的。这也是这种线程的实现方式叫做用户级线程的原因,只有用户才能感知到这个用户级线程的存在,而操作系统感知不到。

  在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。“用户级线程”就是“从用户视角看能看到的线程”。

  4、这种线程的实现方式有什么优点和缺点?

  优点:用户级线程的管理工作,包括切换、创建等,都不需要请求操作系统的服务,只在用户态下就能完成,也就是对用户级线程的管理,并不需要涉及到CPU变态这件事情。而之前说过,CPU变态是有开销、有成本的,所以对于用户级线程的管理工作肯定开销小、效率高。

  缺点:还看我们刚才写的最简单的这个“线程库”,看一下这三个用户级线程的执行,如下图

[2.1.6]进程管理——线程的实现方式和多线程模型_第3张图片

  假设QQ进程上处理机运行。而这次运行的时候,是i==0的,也就是视频聊天的这段代码会上处理机运行。但是,假设视频聊天的这段代码,在运行的过程中发生了阻塞,比如说它想要申请摄像头资源但是申请失败,那么由于它想要的那个系统资源得不到满足,因此这段代码的执行就会被阻塞。那么,代码的执行被阻塞在{处理视频聊天的代码;}这里了,那么这整个while循环,就不能进行下去了。只有这个阻塞被解除之后,这个循环才能继续进行下去。

  所以,这种用户级线程有一个很明显的缺点,就是,如果其中的某一个线程被阻塞,那么其他的线程也会被阻塞、也没办法运行下去。

  此外,这种实现方式,CPU的调度单位依然是进程,操作系统是给进程分配CPU时间的,因此即使电脑是多核处理机,但是由于进程才是CPU调度的基本单位,因此这个进程只能被分配一个核心,其中的各个线程不能并行地运行。

  优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。

  缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高(最大的缺点)。多个线程不可在多核处理机上并行运行。

  这就是在早期的时候,人们实现线程的方式。在这个时候,操作系统还只支持进程,不支持线程。

(二)内核级线程

  之后,随着操作系统的发展,越来越多的系统开始支持线程。

  内核级线程(Kernel-Level Thread, KLT),又称“内核支持的线程”。是由操作系统支持的线程。

  这种内核级线程,就是操作系统视角也可以看得到的线程。大多数现代操作系统都实现了内核级线程,如Windows、Linux。

[2.1.6]进程管理——线程的实现方式和多线程模型_第4张图片

  接下来,同样思考几个问题:

  1、线程的管理工作由谁来完成?

  由于这个线程是在操作系统层面实现的线程,因此这个线程的管理工作当然是需要由操作系统来完成。

  内核级线程的管理工作操作系统内核完成。

  2、线程切换是否需要CPU变态?

  既然这些线程由操作系统管理,那么它们的管理工作肯定是需要操作系统介入的。因此,在进行线程切换的时候,当然是需要从用户态转变为内核态的。

  线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。

  3、操作系统是否能意识到内核级线程的存在?

  能。

  操作系统会为每个内核级线程建立相应的TCB(Thread Control Block,线程控制块),通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程”。

  4、这种线程的实现方式有什么优点和缺点?

  优点:如果一个操作系统支持内核级线程的话,那么在这种操作系统当中,内核级线程是处理机调度的基本单位,而进程只作为分配资源的基本单位。因此在多核CPU的环境下,这几个线程可以分别分派到不同的核心下、并行地执行。

  另外,不同的内核级线程中,可以跑不同的代码逻辑,如上图。那么,由于内核级线程是处理机分配的基本单位,那在这种情况下,即使其中的某一个线程被阻塞,那其他的线程依然可以继续执行下去。

  缺点:当引入了内核级线程之后,一个进程有可能会对应多个内核级线程,操作系统需要对这些线程进行管理,所以内核级线程之间的切换,需要CPU从用户态变为内核态,当切换完成之后还需要从内核态变为用户态。而之前我们提到过很多次,CPU变态是有成本、有开销的,所以这种实现方式会导致线程的管理成本更高、开销更大。

  优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。

  缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。


  我们刚才介绍了用户级线程、内核级线程,这两种线程的实现方式都各有优缺点。

  那么有没有可能,将这两种线程的实现方式,结合起来呢?

  在支持内核级线程的系统当中,如果再引入线程库的话。那么,我们就可以实现,把若干个用户级线程映射到某一个内核级线程,这样的事情。

  根据用户级线程和内核级线程的这种映射关系,就引出了三种多线程模型。

二、多线程模型

  在支持内核级线程的系统中,根据用户级线程和内核级线程的映射关系,可以划分为几种多线程模型。

(一)一对一模型

  像刚才我们一直在讲的这种模型,一个用户级线程,对应一个内核级线程,这个是一对一模型。

  一对一模型:一个用户级线程映射到一个内核级线程。每个进程有多少个内核级线程,就有多少个用户级线程,即每个用户进程有与用户级线程同数量的内核级线程。

  优点:和刚才所说的一样。一个线程被阻塞后,别的进程还能正常执行,因为内核级线程是处理机分配的基本单位。另外,这些用户级线程可以在多核处理机上并行地执行。

  缺点:和刚才所说的一样。一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

[2.1.6]进程管理——线程的实现方式和多线程模型_第5张图片

(二)多对一模型

  多对一模型:多个用户级线程映射到一个内核级线程。且一个进程只被分配到一个内核级线程。

  如果是这种映射关系,其实它就退化到了我们之前提到的纯粹的用户级线程那种实现方式了。

  优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。

  缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。

  注意:对于多对一模型,我们默认“一个进程只对应一个内核级线程”。

  操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位

[2.1.6]进程管理——线程的实现方式和多线程模型_第6张图片

(三)多对多模型

  多对多模型:n个用户级线程映射到m个内核级线程(n ≥ m)。每个用户进程对应m个内核级线程。

[2.1.6]进程管理——线程的实现方式和多线程模型_第7张图片

  上图中,由于一个进程有两个内核级线程,因此,其中一个内核级线程被阻塞的话,另一个内核级线程是可以继续运行下去的。因此,它克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞)。另外,这种多对多的模型,n是大于等于m的,也就是内核级线程的数量,是少于用户级线程的,因此操作系统对这些线程的管理开销也相应的会更小,因此又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。


  至此,我们再来理解一下用户级线程和内核级线程之间的区别和联系。

  可以这么理解:

  所谓的用户级线程,其实就是一个“代码逻辑”的载体。

  而内核级线程,可以理解为是一个“运行机会”的载体。因为操作系统在分配CPU资源的时候,是以内核级线程为单位进行分配的。内核级线程才是处理机分配的单位。(因此,上图中,这个进程最多能被分配两个核心)

  一段“代码逻辑”只有获得了“运行机会”才能被CPU执行。

  这可以让我们的线程管理有更多的灵活性,比如上图中,假设“视频聊天”需要耗费比较多的CPU资源的话,那么我们可以让左边这个内核级线程专门执行“视频聊天”的代码逻辑;而右边这个内核级线程,可以让它并发地执行“文字聊天”和“文件传输”的代码逻辑。

[2.1.6]进程管理——线程的实现方式和多线程模型_第8张图片

  那么,假设在某一时刻,文件传输需要耗费很多的CPU资源,那么此时我们可以让“文字聊天”去左边的内核级线程上处理。

[2.1.6]进程管理——线程的实现方式和多线程模型_第9张图片

  需要注意的是,在引入了内核级线程之后,一个进程可能会对应多个内核级线程,而只有所有的内核级线程都被阻塞的时候,我们才说这个进程进入了阻塞状态。

  内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞。

小结

[2.1.6]进程管理——线程的实现方式和多线程模型_第10张图片

你可能感兴趣的:(操作系统,操作系统)