内核线程与用户线程的一点总结 《程序员的自我修养》·笔记

前言

  • linux内核不存在整真正意义上的线程。linux将所有的执行实体都称之为任务(task),每一个任务在干年上都类似于一个单线程的进程,具有内存空间、执行实体、文件资源等。但是,linux下不同任务之间可以选择公用内存空间,因而在实际意义上,共享同一个内存空间的多个任务构成了一个进程,而这些任务就成为这个任务里面的线程。

内核线程

  • 内核线程又称为守护进程,内核线程的调度由内核负责,一个内核线程处于阻塞状态时不影响其他的内核线程,因为其是调度的基本单位。这与用户线程是不一样的;
  • 这些线程可以在全系统内进行资源的竞争;
  • 内核空间内为每一个内核支持线程设置了一个线程控制块(TCB),内核根据该控制块,感知线程的存在,并进行控制。在一定程度上类似于进程,只是创建、调度的开销要比进程小。有的统计是1:10。
  • 内核线程切换由内核控制,当线程进行切换的时候,由用户态转化为内核态。切换完毕要从内核态返回用户态,即存在用户态和内核态之间的转换比如多核cpu,还有win线程的实现

优点

在多处理器系统中,内核能够同时调度同一进程中多个线程并行执行到多个处理器中;如果进程中的一个线程被阻塞,内核可以调度同一个进程中的另一个线程;内核支持线程具有很小的数据结构和堆栈,线程的切换比较快,切换开销小;内核本身也可以使用多线程的方式来实现。

缺点

即使CPU在同一个进程的多个线程之间切换,也需要陷入内核,因此其速度和效率不如用户级线程。

用户线程

  • 用户线程在用户空间中实现,内核并没有直接对用户线程进程调度,内核的调度对象和传统进程一样,还是进程(用户进程)本身,内核并不能看到用户线程,内核并不知道用户线程的存在。
  • 不需要内核支持而在用户程序中实现的线程,其不依赖于操作系统核心,应用进程利用线程库提供创建、同步、调度和管理线程的函数来控制用户线程。
  • 内核资源的分配仍然是按照进程(用户进程)进行分配的;各个用户线程只能在进程内进行资源竞争
  • 用户级线程内核的切换由用户态程序自己控制内核切换(通过系统调用来获得内核提供的服务),不需要内核干涉,少了进出内核态的消耗,但不能很好的利用多核Cpu。目前Linux pthread大体是这么做的
  • 每个用户线程并不具有自身的线程上下文。因此,就线程的同时执行而言,任意给定时刻每个进程只能够有一个线程在运行,而且只有一个处理器内核会被分配给该进程。

优点

线程的切换无需陷入内核,故切换开销小,速度非常快;

缺点

系统调用的阻塞问题:对应用程序来讲,同一进程中只能同时有一个线程在运行,一个线程的阻塞将导致整个进程中所有线程的阻塞;由于这里的处理器时间片分配是以进程为基本单位,所以每个线程执行的时间相对减少。

用户级线程和内核级线程的区别:

  • 内核支持:用户级线程可在一个不支持线程的OS中实现;内核支持线程则需要得到OS内核的支持。亦即内核支持线程是OS内核可感知的,而用户级线程是OS内核不可感知的。
  • 处理器分配:在多处理机环境下,对用户级线程而言主,内核一次只为一个进程分配一个处理器,进程无法享用多处理机带来的好处;在设置有内核支持线程时,内核可调度一个应用中的多个线程同时在多个处理器上并行运行,提高程序的执行速度和效率。
  • 调度和线程执行时间:设置有内核支持线程的系统,其调度方式和算法与进程的调度十分相似,只不过调度单位是线程;对只设置了用户级线程的系统,调度的单位仍为进程。
  • 用户级线程执行系统调用指令时将导致其所属进程被中断,而内核支持线程执行系统调用指令时,只导致该线程被中断。
  • 在只有用户级线程的系统内,CPU调度还是以进程为单位,处于运行状态的进程中的多个线程,由用户程序控制线程的轮换运行;在有内核支持线程的系统内,CPU调度则以线程为单位,由OS的线程调度程序负责线程的调度。

内核线程与用户线程的联系

一对一模型


  • 特点

有了内核线程,每个用户线程被映射或绑定到一个内核线程。用户线程在其生命期内都会绑定到该内核线程。一旦用户线程终止,两个线程都将离开系统。这被称作”一对一”线程映射。(反过来,一个内核线程不一定就会对应一个用户线程)。一般一直使用API或者是系统调用创建的线程均为一对一线程。例如,linux使用clone创建的线程,以及win下使用CreateThread创建的线程。
  • 弊端
    内核线程数量有限
    许多操作系统内核线程调用的时候,上下文切换的开销很大。
  • 混合线程模型

    混合线程实现是用户线程和内核线程的交叉,使得库和操作系统都可以管理线程。用户线程由运行时库调度器管理,内核线程由操作系统调度器管理。在这种实现中,进程有着自己的内核线程池。可运行的用户线程由运行时库分派并标记为准备好执行的可用线程。操作系统选择用户线程并将它映射到线程池中的可用内核线程。多个用户线程可以分配给相同的内核线程。


    • #### 多对一模型
    • 特点

    多对一的模型将多个用户线程映射到一个内核线程。
    多对一模型线程的切换速度要快很多(线程之间的切换由用户代码来执行)

  • 弊端

    如果其中一个线程阻塞,那么所有线程将无法执行。

  • 多对多模型

  • 特点

    将上述两种模型的特点进行综合,即将多个用户线程映射到少数但不只一个内核线程中去。
    多对多模型对用户线程的数量没有什么限制,在多处理器系统上也会有一定的性能提升,不过提升的幅度比不上一对一模型。

  • 你可能感兴趣的:(linux)