多线程基础

现代软件系统中,除了进程之外 线程也是一个十分重要的概念 特别是随着CPU频率增长开始出现停滞,而开始向多核方向发展。多线程 作为实现软件并发执行的一个重要方法 也开始具有越来越重要的地位。下面让我们来认识什么是线程吧。

什么是线程

线程(Thread),有时被称为轻量级进程(Lightweight Progress,LWP),是程序执行流的最小单元。一个标准的线程由线程ID 、当前指令指针(PC)、寄存器集合和堆栈组成。通常意义上,一个进程由一个到多个线程组成,各个线程之间共享程序的内存空间(包括代码段、数据段、堆栈等)及一些进程级的资源(如打开文件和信号)。一个金典的线程与进程的关系如下图:


多线程基础_第1张图片

大多数软件应用中 线程的数量都不止一个,多线程可以互不干扰地并发执行,并共享进程的全局变量和堆的数据。那么多个线程与单线程的进程相比具有很大的优势。

通常使用多线程原因有如下几点:某个线程可能会陷入长时间等待 等待的线程会进入睡眠状态 无法继续执行。多线程可以有效利用等待时间。典型例子是等待网络响应,这可能花费数秒甚至数十秒。

某个操作会消耗大量的时间,如果只有一个线程 程序和用户之间的交互会中断 多线程会让一个线程负责交互另一个线程负责计算。

程序逻辑本身就要求并发操作 例如一个多端下载软件。

多CPU或多核计算机本身具备同时执行多个线程的能力 因此单线程程序无法全面发挥计算机的全部计算能力 相对于多进程应用 多线程在数据共享方面效率要高很多。

线程的访问权限

线程的访问非常自由 它可以访问进程内存里的所有数据 甚至包括其他线程的堆栈(如果它知道其他线程的堆栈地址),单实际运用中线程也拥有自己的私有存储空间包括以下几个方面。

栈(尽管并非完全无法被其他线程访问 但一般情况下仍然可以认为是私有的数据)。

线程局部存储(Thread Local Storage,TLS),线程局部存储是某些操作系统为线程单独提供的私有空间 但通常只具有很有限的容量。

寄存器(包括PC寄存器),寄存器是执行流的基本数据 因此为线程私有。

线程的优先级与调度

不论是在多处理器的计算机上海市在单处理器的计算机上 线程总是“并发”执行的 当线程数量小于等于处理器数量时(并且操作系统支持多处理器) 线程的并发是真正的并发 不同的线程运行在不同的处理器上彼此之间互不相干 但对于线程数量大于处理器数量的情况 线程的并发会受到一些阻碍 因为此时至少有一个处理器会运行多个线程。

在单处理器对应多线程的情况下 并发是一种模拟出来的状态。 操作系统会让这些多线程程序轮流执行 每次仅执行一小段时间(通常是几十到几百毫秒),这样每个线程就“看起来”在同时执行。这样的一个不断在处理器切换不同的线程的行为称为线程的调度(Thread Schedule)。

在线程调度中 线程通常拥有至少三种状态 分别是: 

运行(Running):此时线程正在执行

就绪(Ready): 此时线程可以立刻运行但CPU 已经被占用

等待(Waiting): 此时线程正在等待某-事件(通常是I/O 或同步)发生 无法执行

处于运行中线程拥有一段可以执行的时间 这段时间称之为 时间片(Time Slice),当时间片用尽的时候 该进程进入就绪状态 如果在时间片用尽之前程序就开始等待某事件 那么它将进入等待状态 每当一个线程离开运行状态时 调度系统就会选择一个其他的就绪线程继续执行 在一个处于等待状态的线程所等待事件发生之后 该线程就进入就绪状态 。


线程状态切换

线程调度自多任务操作系统问世以来就不断的被提出不同的方案和算法 现在主流的调度方式尽管各不相同 但都带有优先级调度(Priority Schedule) 和轮转法(Round Robin)的痕迹。所谓轮转法即是之前提到的让各个线程之间轮流执行一小段时间的方法。这决定了线程之间交错执行的特点。而优先级调度则决定了线程按照什么顺序轮流执行。在具有优先级调度的系统中 线程都拥有各自的线程优先级(Thread Priority)。具有高优先级的线程会更早执行 而低优先级线程往往要等待系统中已经没有高优先级的可执行的线程存在时再能执行。

线程的优先级不近可以由用户手动设置 系统还会根据不同线程的表现自动调整优先级,以使调度更有效率。例如通常情况下 频繁进入等待状态(进入等待状态 会放弃之后仍然可占用的时间份额)的线程(例如I/O的线程)比频繁进行大量计算 以至于每次都要把时间片全部用尽的线程要受欢迎的多。其实道理很简单 频繁等待的线程通常只占用很少的时间 CPU也喜欢先捏软柿子。我们把一段频繁等待的线程称为IO密集型线程(IO Bound Thread),而把很少等待的线程称为CPU密集型线程(CPU Bound Thread). IO密集型线程总是比CPU密集型线程容易得到优先级的提升。

在优先级调度下 存在一种饿死(Starvation)的现象 一个线程被饿死是说它的优先级比较低 在它执行之前 总是有较高优先级的线程视图执行 因此这个低优先级线程始终无法执行。所以为了避免饿死现象 调度系统常常会逐步提升那些等待了过长时间得不到执行的线程优先级。在这样的手段下 一个线程只要等待时间足够长 其优先级一定会提高到足够让它执行的程度。

在优先级调度的环境下 线程优先级改变一般有三种方式。

用户指定优先级 根据进入等待状态的频繁程度提升或降低优先级 长时间得不到执行而被提升优先级 

你可能感兴趣的:(多线程基础)