前言:在计算机操作系统中,进程是资源分配的基本单位,也是独立运行的基本单位
1、进程的定义
2、进程的特征
3、进程和程序的关系
4、进程的组成
5、操作系统的内核:
操作系统的内核是基于硬件的第一次软件扩充。在现代操作系统设计中,往往把一些与硬件紧密相关的模块或运行频率较高的模块以及许多模块所共用的一些基本操作安排在靠近硬件的软件层次中,并使它们常驻内存,以提高操作系统的运行效率,通常把这部分成为操作系统的内核。内核是基于硬件的第一层软件扩充,它为系统控制和进程管理提供了良好的环境
6、线程的概念
(1)线程的引入
如果说,在操作系统中引入进程的目的是使多个程序并发执行,以改善资源利用率及提高系统吞吐量;那么,在操作系统中再引入线程,则是为了减少程序并发执行时所付出的时空开销,使操作系统具有更好的并发性。为了说明它,我们再提一下进程的两个基本属性
上述两个属性构成了程序并发执行的基础。然而为了使进程能并发执行,操作系统还必须进行一系列的操作,如创建进程、撤销进程和进程切换。在进行这些操作时,操作系统要为进程分配资源和回收资源,为运行进程保存现场信息,这些工作都需要付出较多的时间开销。正因为如此,在系统中不宜设置过多的进程,进程切换的频率也不能太高,从而限制了系统并发程度的进一步提高
为了使多个程序更好的并发执行,并尽量减少操作系统的开销,不少操作系统研究者考虑将进程的两个属性分离开,分别交由不同的实体来实现。为此,操作系统的设计者一如了线程,让线程去完成第二个基本属性的任务,而进程只完成第一个基本属性的任务
(2)线程的定义
线程的定义与进程类似,存在多种不同的提法。这些提法可以相互补充对线程的理解
(3)线程的实现
在操作系统有多种方式可实现对线程的支持。最自然的方法是由操作系统内核提供线程的控制机制。在只有进程概念的操作系统中,可由用户程序利用函数库提供线程的控制机制。还有一种做法时同时在操作系统内核和用户程序两个层次上提供线程控制机制
内核级线程是指依赖于内核,由操作系统内核完成创建和撤销工作的线程。在支持内核级线程的操作系统中,内核维护进程和线程的上下文信息并完成线程切换工作。一个内核级线程由于I/O操作而阻塞时,不会影响到其他线程的运行。这时,处理器时间片分配对象是线程,所以由多个线程的进程将获得更多处理器时间
用户及线程是指不依赖于操作系统核心,由应用进程利用线程库提供创建、同步、调度和管理线程的函数来控制的线程。由于用户级线程切换不需要内核特权,用户及线程调度算法可针对应用优化,在许多应用软件中都有自己的用户级线程。由于用户级线程的调度在应用进程内部进行,通常采用非抢占式和更见的的规则,也无需用户态/核心态切换,因此速度特别快。当然由于操作系统内核不了解用户线程的存在,当一个线程阻塞时,整个进程都必须等待。这时处理器时间片时分配给进程的,进程内有多个线程时每个线程的执行时间相对减少
在有些操作系统中,提供了上述两种方法的组合实现。在这种系统中,内核支持多线程的建立、调度与管理:同时,系统中又提供使用线程库的便利,允许用户应用程序建立、调度和管理用户级的线程由于同时提供内核线程控制机制和用户线程库,因此可以很好的将内核级线程和用户线程的优点结合起来
7、线程与进程的比较
8、多线程模型
有些系统同时支持用户级线程和内核级线程,因此根据用户级线程和内核级线程连接方式的不同产生了三种不同的多线程模型
多对一模型:多对一模型将多个用户级线程映射到一个内核级线程上。在采用该模型的系统中,线程在用户空间进行管理,效率相对较高。但是,由于多个用户级线程映射到一个内核级线程,只要一个用户级线程阻塞,就会导致整个进程阻塞。而且由于系统只能识别一个线程(内核级线程),因此即使由多处理器,该进程的若干用户级线程也只能同时运行一个,不能并行执行
一对一模型:一对一模型将内核级线程与用户级线程一一对应。这样做的好处是当一个线程阻塞时不影响其他其他线程的运行,因此并发性比多对一模型更好而且这样做之后,在多处理器上可以实现多线程并行。这种模型的缺点时创建一个用户及线程时需要创建一个相应的内核级线程
多对多模型:多对多模型将多个用户及线程映射到多个内核级线程(内核级线程数不多于用户级线程数,内核级线程数根据具体情况确定)。采用这样的模型可以打破前两种模型对用户级线程的限制,不仅可以是多个用户级线程真正意义上并行执行,而且不会限制用户级线程的数量。用户可以自由创建所需的用户级线程,多个内核级线程根据需要调用用户级线程,当一个用户级线程阻塞时,可以调度执行其他线程
9、进程通信
进程通信是指进程之间的信息交换。进程的互斥与同步就是一种进程间的通信方式。由于进程互斥与同步交换的信息量较少且效率较低,因此称这两种进程通信方式为低级进程通信方式,相应地,也可以将P,V原语称为两条低级进程通信原语。
目前,高级进程通信方式可以分为三大类:共享存储器系统、消息传递系统以及管道通信系统
(1)共享存储器系统
为了传输大量数据,在存储器中划入一块共享存储区,多个进程可以通过对共享存储区进行读写来实现通信。进程在通信前,向系统申请建立一个共享存储区,并指定该共享存储区的关键字。若该共享存储区已经建立,则将共享存储的描述符返回给申请者。然后,申请者把获得的共享存储区附加到进程上。这样进程便可以像读写普通寄存器一样读写共享存储区了。
(2)消息传递系统
在消息传递系统中,进程间以消息为单位交换数据,用户直接给系统提供的一组通信命令(原语)来实现通信,操作系统隐藏了通信的实现细节,简化了通信程序,得到了广泛应用。根据实现方式不同,消息传递系统可以分为以下两类:
直接通信方式:发送进程直接把消息发送给接受进程,并将它挂在接收进程的纤细缓冲队列上,接收进程从消息缓冲区队列中取得消息:
间接通信方式:发送进程消息发送到某个中间实体(通常称为信箱)中,接受进程从中取得消息。这种通信方式又称为信箱通信方式。该通信方式广泛应用于计算机网络中,相应的通信系统称为电子邮件系统
(3)管道通信系统
管道是连接读进程和写进程的以实现他们之间通信的共享文件,相关到提供输入的发送进程(即写进程)以字符流形式将大量的数据送入管道,而接收管道输出的进程(即读进程)可以从管道中接收数据
注意:管道是一个共享文件,不能单纯的从字面上理解管道只是一个传输通道
10、进程同步的基本概念
在学习进程同步之前,先介绍一些关键的概念
(1)两种形式的制约关系
间接相互制约关系(互斥)
若某一进程要求使用某种资源,而该资源正被另一进程使用,并且这一资源不允许两个进程同时使用,那么该进程只好等待已占用资源的进程释放资源后再使用。这种制约关系的基本形式是“进程-资源-进程”
这种制约关系源于多个同种进程需要互斥地共享某种系统资源(比如打印机),互斥是设置在同种进程之间以达到互斥的访问资源的目的(比如在生产者-消费者问题中,生产者与消费者需要互斥地访问缓冲池)。
直接相互制约关系(同步)
某一进程收不到另一进程给他提供的必要信息就不能继续运行下去,这种情况表明了两个进程之间在某个点上要交换信息,相互交流运行情况。这种制约关系的基本形式是“进程-进程
这种制约主要源于进程间的合作,同步设置在不同进程之间以达到多种进程间的同步”(比如在生产者消费者问题中,生产者就可以生产产品并放入缓冲池,消费者从缓冲池取走产品进行消费,若生产者没有生产产品,则消费者无法进行消费)
注意:区分互斥与同步只需记住,只要是同类进程即为互斥关系,不同类进程即为同步关系
(2)临界资源与临界区
进程在运行过程中,一般与其他进程共享资源,而有些资源的使用具有排他性。我们把同时仅允许一个进程使用的资源称为临界资源,如打印机、绘图机等
为了保证临界资源的正确使用,可以把临界资源的访问过程分为四部分。这四部分都属于要访问临界资源的进程,是进程中的一部分代码
进入区:为了进入临界区使用临界资源,在进入区要检查是否可以进入临界区;如果可以进入临界区,同行设置相应的“正在访问临界区”的标志,以阻止其他进程同时进入临界区
临界区:进程中用于访问临界资源的代码,又称临界段
退出区:临界区后用于将“正在访问临界区”标志清除的部分
剩余区:进程中除上述3部分以外的其他部分:
两个容易混淆的概念:有人可能认为临界区就是临界资源的所在地址,这样理解显然是错误的。简单一些说,临界资源是一种系统资源,需要不同进程互斥访问,而临界区则是每个进程中访问临界资源的一段代码,是属于对应进程的,临界区前后需要设置进入区和退出区进行检查和恢复,临界区和临界资源是不同的,临界资源是必须互斥访问的资源,这种资源同时只能被一个进程所使用,但需要这种资源的进程不止一个,因此需要对使用临界资源的进程进行管理,这也就产生了临界区的概念
这里还要弄清楚一个概念:每个进程的临界区代码可以不相同。临界区代码由于要访问临界资源,因此要再进入临界区之前(也就是执行临界区代码之前)进行检查,至于每个进程对临界资源进行怎样的操作,A要写磁盘的前半部分,B要读磁盘的后半部分。这两个进程对磁带操作的部分那就是两个进程各自的临界区,不能同时执行,但内容是不相同的,不可认为临界资源相同,访问这些资源的代码也是相同的
(3)互斥的概念与要求
根据互斥的定义,当一个进程进入临界区使用临界资源时,另一个进程必须等待,知道占用该临界资源的进程退出临界区时,才允许访问该临界资源。为了禁止两个进程同时进入临界区,软件算法或同步机构都应遵循以下的规则:
空闲让进:当没有进程处于临界区时,可以允许一个请求进入临界区的进程立即进入自己的临界区
忙则等待:当已有进程进入其临界区时,其他进入临界区的进程必须等待
有限等待:对要求访问临界资源的进程,应保证能在有限的时间内进入自己的临界区
让权等待:当一个进程因为某些原因不能进入自己的临界区时,应释放处理器给其他进程
(4)同步的概念与实现机制
一般来说,一个进程对另一个进程的运行速度是不确定的。也就是说,进程之间实在异步环境下运行的。但是相互合作的进程需要在某些确定的点上协调他们的工作。所谓进程同步,是指多个相互合作的进程在一些关键点上可能需要互相等待或互相交换信息,这些相互制约的关系称为进程同步,可以用信号量实现同步。