进程是操作系统分配资源的单位,线程是调度的基本单位,线程之间共享进程资源
进程:
我们都知道计算机的核心是CPU,它承担了所有的计算任务,而操作系统是计算机的管理者,它负责任务的调度,资源的分配和管理,统领整个计算机硬件;应用程序是具有某种功能的程序,程序是运行于操作系统之上的。
进程是一个具有一定独立功能的程序在一个数据集上的一次动态执行的过程,是操作系统进行资源分配和调度的一个独立单位,是应用
程序运行的载体。进程是一种抽象的概念,从来没有统一的标准定义。进程一般由程序,数据集合和进程控制块三部分组成。程序用于描述
进程要完成的功能,是控制进程执行的指令集;数据集合是程序在执行时所需要的数据和工作区;程序控制块包含进程的描述信息和控制信息是进程存在的唯一标志
进程具有的特征:
线程:
在早期的操作系统中并没有线程的概念,进程是拥有资源和独立运行的最小单位,也是程序执行的最小单位。任务调度采用的是时间片
轮转的抢占式调度方式,而进程是任务调度的最小单位,每个进程有各自独立的一块内存,使得各个进程之间内存地址相互隔离。
后来,随着计算机的发展,对CPU的要求越来越高,进程之间的切换开销较大,已经无法满足越来越复杂的程序的要求了。于是就发明
了线程,线程是程序执行中一个单一的顺序控制流程,是程序执行流的最小单元,是处理器调度和分派的基本单位。一个进程可以有一个或
多个线程,各个线程之间共享程序的内存空间(也就是所在进程的内存空间)。一个标准的线程由线程ID,当前指令指针PC,寄存器和堆栈组
成。而进程由内存空间(代码,数据,进程空间,打开的文件)和一个或多个线程组成。
进程与线程的区别
1. 线程是程序执行的最小单位,而进程是操作系统分配资源的最小单位;
2. 一个进程由一个或多个线程组成,线程是一个进程中代码的不同执行路线
3. 进程之间相互独立,但同一进程下的各个线程之间共享程序的内存空间(包括代码段,数据集,堆等)及一些进程级的资源(如打开文件和信
号等),某进程内的线程在其他进程不可见;
4. 调度和切换:线程上下文切换比进程上下文切换要快得多
线程和进程关系示意图
总之,线程和进程都是一种抽象的概念,线程是一种比进程还小的抽象,线程和进程都可用于实现并发。
在早期的操作系统中并没有线程的概念,进程是能拥有资源和独立运行的最小单位,也是程序执行的最小单位,它相当于
一个进程里只有一个线程,进程本身就是线程。所以线程有时被称为轻量级进程
后来,随着计算机的发展,对多个任务之间上下文切换的效率要求越来越高,就抽象出一个更小的概念-线程,一般一个进程会有多个
(也可以是一个)线程。
任务调度
大部分操作系统的任务调度是采用时间片轮转的抢占式调度方式,也就是说一个任务执行一小段时间后强制暂停去执行下一个任务,每个
任务轮流执行。任务执行的一小段时间叫做时间片,任务正在执行时的状态叫运行状态,任务执行一段时间后强制暂停去执行下一个任务,被
暂停的任务就处于就绪状态,等待下一个属于它的时间片的到来。这样每个任务都能得到执行,由于CPU的执行效率非常高,时间片
非常短,在各个任务之间快速地切换,给人的感觉就是多个任务在“同时进行”,这也就是我们所说的并发
为何不使用多进程而是使用多线程?
线程廉价,线程启动比较快,退出比较快,对系统资源的冲击也比较小。而且线程彼此分享了大部分核心对象(File Handle)的拥有权
如果使用多重进程,但是不可预期,且测试困难
逆向思考
查理芒格经常说这样一句话:“反过来想,总是反过来想”。
如果你对线程之间共享了哪些进程资源这个问题想不清楚的话,不妨反过来思考,有哪些资源是线程私有的。
线程私有资源
线程运行的本质其实就是函数的执行。函数的执行总会有一个源头,这个源头就是所谓的入口函数,CPU 从入口函数开始执行从而形成一个执行流,只不过我们人为的给执行流起一个名字,这个名字就叫线程。
既然线程运行的本质就是函数的执行,那么函数执行都有哪些信息呢?
函数运行时的信息保存在栈帧中,栈帧中保存了函数的返回值、调用其它函数的参数、该函数使用的局部变量以及该函数使用的寄存器信息,如图所示,假设函数 A 调用函数 B:
此外,CPU 执行指令的信息保存在一个叫做程序计数器的寄存器中,通过这个寄存器我们就知道接下来要执行哪一条指令。由于操作系统随时可以暂停线程的运行,因此我们保存以及恢复程序计数器中的值就能知道线程是从哪里暂停的以及该从哪里继续运行了。
由于线程运行的本质就是函数运行,函数运行时信息是保存在栈帧中的,因此每个线程都有自己独立的、私有的栈区。
同时函数运行时需要额外的寄存器来保存一些信息,像部分局部变量之类。这些寄存器也是线程私有的,一个线程不可能访问到另一个线程的这类寄存器信息。
从上面的讨论中我们知道,到目前为止,所属线程的栈区、程序计数器、栈指针以及函数运行使用的寄存器是线程私有的。
以上这些信息有一个统一的名字,就是线程上下文,thread context。
我们也说过操作系统调度线程需要随时中断线程的运行并且需要线程被暂停后可以继续运行,操作系统之所以能实现这一点,依靠的就是线程上下文信息。
现在你应该知道哪些是线程私有的了吧。
除此之外,剩下的都是线程间共享资源。
那么剩下的还有什么呢?还有图中的这些。
这其实就是进程地址空间的样子,也就是说线程共享进程地址空间中除线程上下文信息中的所有内容,意思就是说线程可以直接读取这些内容。
接下来我们分别来看一下这些区域。
代码区
进程地址空间中的代码区,这里保存的是什么呢?从名字中有的同学可能已经猜到了,没错,这里保存的就是我们写的代码,更准确的是编译后的可执行机器指令。
那么这些机器指令又是从哪里来的呢?答案是从可执行文件中加载到内存的,可执行程序中的代码区就是用来初始化进程地址空间中的代码区的。
线程之间共享代码区,这就意味着程序中的任何一个函数都可以放到线程中去执行,不存在某个函数只能被特定线程执行的情况。
数据区
进程地址空间中的数据区,这里存放的就是所谓的全局变量。
什么是全局变量?所谓全局变量就是那些你定义在函数之外的变量,在 C 语言中就像这样:
char c; // 全局变量void func() {}
其中字符 c 就是全局变量,存放在进程地址空间中的数据区。
在程序员运行期间,也就是 run time,数据区中的全局变量有且仅有一个实例,所有的线程都可以访问到该全局变量。
值得注意的是,在 C 语言中还有一类特殊的“全局变量”,那就是用 static 关键词修饰过的变量,就像这样:
voidfunc(){staticint a = 10;}
注意到,虽然变量 a 定义在函数内部,但变量 a 依然具有全局变量的特性,也就是说变量 a 放在了进程地址空间的数据区域,即使函数执行完后该变量依然存在,而普通的局部变量随着函数调用结束和函数栈帧一起被回收掉了,但这里的变量 a 不会被回收,因为其被放到了数据区。
这样的变量对每个线程来说也是可见的,也就是说每个线程都可以访问到该变量。
堆区
堆区是程序员比较熟悉的,我们在 C/C++中用 malloc 或者 new 出来的数据就存放在这个区域,很显然,只要知道变量的地址,也就是指针,任何一个线程都可以访问指针指向的数据,因此堆区也是线程共享的属于进程的资源。
栈区
唉,等等!刚不是说栈区是线程私有资源吗,怎么这会儿又说起栈区了?
确实,从线程这个抽象的概念上来说,栈区是线程私有的,然而从实际的实现上看,栈区属于线程私有这一规则并没有严格遵守,这句话是什么意思?
通常来说栈区是线程私有,既然有通常就有不通常的时候。
不通常是因为不像进程地址空间之间的严格隔离,线程的栈区没有严格的隔离机制来保护,因此如果一个线程能拿到来自另一个线程栈帧上的指针,那么该线程就可以改变另一个线程的栈区,也就是说这些线程可以任意修改本属于另一个线程栈区中的变量。
这从某种程度上给了程序员极大的便利,但同时,这也会导致极其难以排查到的 bug。
试想一下你的程序运行的好好的,结果某个时刻突然出问题,定位到出问题代码行后根本就排查不到原因,你当然是排查不到问题原因的,因为你的程序本来就没有任何问题,是别人的问题导致你的函数栈帧数据被写坏从而产生 bug,这样的问题通常很难排查到原因,需要对整体的项目代码非常熟悉,常用的一些 debug 工具这时可能已经没有多大作用了。
说了这么多,那么同学可能会问,一个线程是怎样修改本属于其它线程的数据呢?
接下来我们用一个代码示例讲解一下。
修改线程私有数据
voidthread(void* var) {int* p = (int*)var; *p = 2;}intmain() {int a = 1; pthread_t tid; pthread_create(&tid, NULL, thread, (void*)&a);return0;}
这段代码是什么意思呢?
首先我们在主线程的栈区定义了一个局部变量,也就是 int a= 1这行代码,现在我们已经知道了,局部变量 a 属于主线程私有数据,但是,接下来我们创建了另外一个线程。
在新创建的这个线程中,我们将变量 a 的地址以参数的形式传给了新创建的线程,然后我来看一下 thread 函数。
在新创建的线程中,我们获取到了变量 a 的指针,然后将其修改为了 2,也就是这行代码,我们在新创建的线程中修改了本属于主线程的私有数据。
现在你应该看明白了吧,尽管栈区是线程的私有数据,但由于栈区没有添加任何保护机制,一个线程的栈区对其它线程是可以见的,也就是说我们可以修改属于任何一个线程的栈区。
就像我们上文说到的,这给程序员带来了极大便利的同时也带来了无尽的麻烦,试想上面这段代码,如果确实是项目需要那么这样写代码无可厚非,但如果上述新创建线程是因 bug 修改了属于其它线程的私有数据的话,那么产生问题就很难定位了,因为 bug 可能距离问题暴露的这行代码已经很远了,这样的问题通常难以排查。
动态链接库
进程地址空间中除了以上讨论的这些实际上还有其它内容,还有什么呢?
这就要从可执行程序说起了。
什么是可执行程序呢?在 Windows 中就是我们熟悉的 exe 文件,在 Linux 世界中就是 ELF 文件,这些可以被操作系统直接运行的程序就是我们所说的可执行程序。
那么可执行程序是怎么来的呢?
有的同学可能会说,废话,不就是编译器生成的吗?
实际上这个答案只答对了一半。
假设我们的项目比较简单只有几个源码文件,编译器是怎么把这几个源代码文件转换为最终的一个可执行程序呢?
原来,编译器在将可执行程序翻译成机器指令后,接下来还有一个重要的步骤,这就是链接,链接完成后生成的才是可执行程序。
完成链接这一过程的就是链接器。
其中链接器可以有两种链接方式,这就是静态链接和动态链接。
静态链接的意思是说把所有的机器指令一股脑全部打包到可执行程序中,动态链接的意思是我们不把动态链接的部分打包到可执行程序,而是在可执行程序运行起来后去内存中找动态链接的那部分代码,这就是所谓的静态链接和动态链接。
动态链接一个显而易见的好处就是可执行程序的大小会很小,就像我们在 Windows 下看一个 exe 文件可能很小,那么该 exe 很可能是动态链接的方式生成的。
而动态链接的部分生成的库就是我们熟悉的动态链接库,在 Windows 下是以DLL 结尾的文件,在 Linux 下是以 so 结尾的文件。
说了这么多,这和线程共享资源有什么关系呢?
原来如果一个程序是动态链接生成的,那么其地址空间中有一部分包含的就是动态链接库,否则程序就运行不起来了,这一部分的地址空间也是被所有线程所共享的。
也就是说进程中的所有线程都可以使用动态链接库中的代码。