进程管理
在多道程序中,需要从磁盘中同时读入多个进程到内存,我们需要对内存进行管理,使得能够有条理地执行进程。
通常指令先要从内存中读入,进行解码,还要从内存中读取操作数,再将结果返回给内存。内存看到的只是地址。
一个进程占了一块内存,跨度是一串连续的地址,我们用base register和limit register来限定进程访问的范围。
CPU只能访问的存储器是内存和CPU的寄存器,所以如果有指令要访问数据,必须要提前导入到内存。下面会讲到交换方法,和动态载入。
Cache:因为访问CPU寄存器必访问内存速度快了很多,所以我们不能老是访问内存,所以要有Cache。访问内存可能会导致CPU暂停。
进程访问的地址的限定通过硬件实现:即通过base和limit寄存器的比较实现。
OS可以改limit和base的值。
磁盘有一个输入队列,存放准备导入内存的进程。
代码里我们通常用一个变量代表地址,我们可以将变量绑定到可重定位地址,加载程序再将重定位地址绑定成绝对地址。
绑定的情况:
1.编译时:如果在编译时就知道内存的地址,那么直接绑定绝对地址。
2.加载时:在编译时生成可重定位代码,在加载时才生成绝对代码。
3.执行时:如果执行时还要将进程从一个内存块移到另一个内存块,则只有执行时才绑定。
CPU生成的逻辑地址,内存的地址是物理地址。
程序生成的地址空间称为逻辑地址空间。
运行时虚拟地址到物理地址通过MMU映射。通过CPU的逻辑地址+base register就得到物理地址。用户是不知道物理地址的。
动态加载:如果一个程序必须全部加载入内存,那么必须限制程序的大小,所以动态加载是将一个大程序分成多个子程序,每次将某个子程序调入内存,如果一个子程序需要调入另一个子程序,则再加载,加强内存空间的使用率。
动态链接:通过在程序内部存放一个存根引用语言库,可以不必复制多个语言库副本,并且如果版本号不同,可以在内存中存放多个不同版本的库。
--------
如果CPU要执行的进程不再内存中,而在备份存储器中,则需要换入和换出,即交换。
当就进程换出后再次换入时,需要考虑位置问题:
1.当在加载时就绑定到物理地址,则换入到同一个位置。
2.在运行时绑定,则可以换入到任意位置。
交换的时间分为:转移时间,磁盘磁头寻址时间。
换出的进程选择方面需要注意不能选在I/O等待队列中的进程。
因此有一个修正的交换方式,可以在内存吃紧的情况下交换,但是在CPU使用率降低到一定时停止交换。
为了管理内存,需要为每个进程分配连续的内存。
内存映射需要将CPU的逻辑地址先与limit register比较,再加上base register。
当操作系统的一部分不常用时,可以先将它换出到备份存储,这块空间就可以腾给用户进程使用。
内存分配最简单的是将内存分成多个固定大小的分区,每个分区容纳一个进程。
可变分区是OS保存一个表,记录哪些内存可用,哪些内存已占用。
空闲的内存区域称为孔。
当一个进程从输入队列进入内存,有几种选取孔的方案:
1.最佳适应:遍历一遍,找到合适的最小孔。
2.首次适应。
3.最差适应。(真不知道要这个干嘛。。)
在第一第二中方法时,会存在外部碎片问题。
外部碎片问题:进程入孔后,还多出一点小空间,但不能放进程了。
内部碎片问题:分配内存时按块分配,比如一个进程3K,一个孔4K,则直接将4K分给进程,4-3=1K就是内部碎片。
解决外部碎片的方法是紧缩,将进程都挤一块。但是当绑定在加载时,则不能紧缩。
还有一种方法是重点,即可以将内存分配为非连续。
50%规则:在可分配的内存中,有50%的空间是碎片。
分页:将CPU的逻辑地址分成页,而将物理内存地址分成帧。备份存储也分成大小一样的块。先通过页号找到页表对应的帧,再加上页偏移找到内存的位置。
将CPU逻辑地址分成页号和页偏移方法:先将CPU逻辑地址的大小变成2^m,m就是逻辑地址的位数,设2^n为一页的大小,那么n则为页偏移。
m-n就为页号长度。
分页会导致内部碎片。因为帧大小固定,一次分配就是一帧的整数倍。
进程由几页组成,每个页对应一个帧。因此进程的内容就不一定要连续,每个进程对应一个页表。OS还持有每个进程页表的副本。
帧表:包括全部的帧以及他们是空闲还是被占用。
一开始页表放在PCB的寄存器中,因为速度快。但是随着页表的变大,必须把页表放在内存,而PCB只需保留一个页表基寄存器(PTBR),指向页表的头部。得到帧号再加上页偏移后再次访问内存。因此要2次访问。
由于上述方案需要2次内存访问,延迟大,所以产生了(TLB)快表(感觉就像cache),保留页表的一小部分,可以同时访问TLB的每个元素,速度快。如果TLB中没有,则按常规访问,并且将这个页表添加入TLB(局部性原理)。TLB的结构是键为页号,值为帧号。
有时TLB中还会有ASID,地址空间标识符(ASID):唯一标识一个进程,一定要ASID匹配并且页号匹配才算匹配。
如果没有提供ASID时,则TLB保存一个进程的页表,每次进程切换,则TLB被flush。
TLB的命中率:访问TLB能找到的概率。
我们可以为每个帧授予权限,只读,可读写,可执行等。
页表的保护方式是通过在页表中提供一位称为“有效无效位”,即v或i。代表该页号是否合法。因为可能一个程序只有1-5的页号,所以页号为6以后的都被置为i。当然还可以通过PTLR(页表长度寄存器)来限制页表大小。
分页可以共享公共代码,但是这些公共代码是不能修改的。想象一下为什么能共享,因为进程只需要存放独有的页表,页表对应的帧在内存中,所以只需要一个程序即可,但是需要独立的数据,因此数据不能共享。
组织页表有几种方法:
1.多级页表。向前映射页表:从外级页表逐步映射到地址。想到了多级索引。【页表划分出题】
由来:因为我们的地址空间越来越大,所以页表也越来越大,因此到了我们都不能连续存放页表的地步,所以出现了多级页表。
2.hash页表。逻辑地址的页号通过hash后找到hash表对应位置,hash表每个元素对应一个链表,一个元素由虚拟页码、帧号、next组成。
群集页表适用于64位地址空间,hash页表的每个条目存储多个物理页帧的映射。
3.反向页表。通常一个进程有一个页表,但是占用内存大,因此整个系统只有一个反向页表,一个反向页表条目为
分段是考虑到了用户对于内存的视角来构造的。将程序看成是一个段,没有顺序,用户通过<段号,段偏移>确定地址。
类似于页表,分段通过段表来实现地址映射,段表一个元素对应base register和limit register。
内存管理主要包括内存分配和回收、地址变换、内存扩充、内存共享和保护等功能。
下面主要介绍连续分配存储管理、覆盖与交换技术以及页式与段式存储管理等基本概念和原理。
连续分配是指为一个用户程序分配连续的内存空间。连续分配有单一连续存储管理和分区式储管理两种方式。
在这种管理方式中,内存被分为两个区域:系统区和用户区。应用程序装入到用户区,可使用用户区全部空间。其特点是,最简单,适用于单用户、单任务的操作系统。CP/M和DOS 2.0以下就是采用此种方式。这种方式的最大优点就是易于管理。但也存在着一些问题和不足之处,例如对要求内存空间少的程序,造成内存浪费;程序全部装入,使得很少使用的程序部分也占用—定数量的内存。
为了支持多道程序系统和分时系统,支持多个程序并发执行,引入了分区式存储管理。分区式存储管理是把内存分为一些大小相等或不等的分区,操作系统占用其中一个分区,其余的分区由应用程序使用,每个应用程序占用一个或几个分区。分区式存储管理虽然可以支持并发,但难以进行内存分区的共享。
分区式存储管理引人了两个新的问题:内碎片和外碎片。前者是占用分区内未被利用的空间,后者是占用分区之间难以利用的空闲分区(通常是小空闲分区)。为实现分区式存储管理,操作系统应维护的数据结构为分区表或分区链表。表中各表项一般包括每个分区的起始地址、大小及状态(是否已分配)。
分区式存储管理常采用的一项技术就是内存紧缩(compaction):将各个占用分区向内存一端移动,然后将各个空闲分区合并成为一个空闲分区。这种技术在提供了某种程度上的灵活性的同时,也存在着一些弊端,例如:对占用分区进行内存数据搬移占用CPU~t寸间;如果对占用分区中的程序进行“浮动”,则其重定位需要硬件支持。
1)固定分区(nxedpartitioning)。
固定式分区的特点是把内存划分为若干个固定大小的连续分区。分区大小可以相等:这种作法只适合于多个相同程序的并发执行(处理多个类型相同的对象)。分区大小也可以不等:有多个小分区、适量的中等分区以及少量的大分区。根据程序的大小,分配当前空闲的、适当大小的分区。这种技术的优点在于,易于实现,开销小。缺点主要有两个:内碎片造成浪费;分区总数固定,限制了并发执行的程序数目。
2)动态分区(dynamic partitioning)。
动态分区的特点是动态创建分区:在装入程序时按其初始要求分配,或在其执行过程中通过系统调用进行分配或改变分区大小。与固定分区相比较其优点是:没有内碎片。但它却引入了另一种碎片——外碎片。动态分区的分区分配就是寻找某个空闲分区,其大小需大于或等于程序的要求。若是大于要求,则将该分区分割成两个分区,其中一个分区为要求的大小并标记为“占用”,而另一个分区为余下部分并标记为“空闲”。分区分配的先后次序通常是从内存低端到高端。动态分区的分区释放过程中有一个要注意的问题是,将相邻的空闲分区合并成一个大的空闲分区。
下面列出了几种常用的分区分配算法:
首先适配法(nrst-fit):按分区在内存的先后次序从头查找,找到符合要求的第一个分区进行分配。该算法的分配和释放的时间性能较好,较大的空闲分区可以被保留在内存高端。但随着低端分区不断划分会产生较多小分区,每次分配时查找时间开销便会增大。
下次适配法(next-fit):按分区在内存的先后次序,从上次分配的分区起查找(到最后{区时再从头开始},找到符合要求的第一个分区进行分配。该算法的分配和释放的时间性能较好,使空闲分区分布得更均匀,但较大空闲分区不易保留。
最佳适配法(best-fit):按分区在内存的先后次序从头查找,找到其大小与要求相差最小的空闲分区进行分配。从个别来看,外碎片较小;但从整体来看,会形成较多外碎片优点是较大的空闲分区可以被保留。
最坏适配法(worst- fit):按分区在内存的先后次序从头查找,找到最大的空闲分区进行分配。基本不留下小空闲分区,不易形成外碎片。但由于较大的空闲分区不被保留,当对内存需求较大的进程需要运行时,其要求不易被满足。
引入覆盖(overlay)技术的目标是在较小的可用内存中运行较大的程序。这种技术常用于多道程序系统之中,与分区式存储管理配合使用。覆盖技术的原理很简单,一个程序的几个代码段或数据段,按照时间先后来占用公共的内存空间。将程序必要部分(常用功能)的代码和数据常驻内存;可选部分(不常用功能)平时存放在外存(覆盖文件)中,在需要时才装入内存。不存在调用关系的模块不必同时装入到内存,从而可以相互覆盖。覆盖技术的缺点是编程时必须划分程序模块和确定程序模块之间的覆盖关系,增加编程复杂度;从外存装入覆盖文件,以时间延长换取空间节省。覆盖的实现方式有两种:以函数库方式实现或操作系统支持。
交换(swapping)技术在多个程序并发执行时,可以将暂时不能执行的程序送到外存中,从而获得空闲内存空间来装入新程序,或读人保存在外存中而处于就绪状态的程序。交换单位为整个进程的地址空间。交换技术常用于多道程序系统或小型分时系统中,与分区式存储管理配合使用又称作“对换”或“滚进/滚出”(roll-in/roll-out)。其优点之一是增加并发运行的程序数目,并给用户提供适当的响应时间;与覆盖技术相比交换技术另一个显著的优点是不影响程序结构。交换技术本身也存在着不足,例如:对换人和换出的控制增加处理器开销;程序整个地址空间都进行对换,没有考虑执行过程中地址访问的统计特性。
在前面的几种存储管理方法中,为进程分配的空间是连续的,使用的地址都是物理地址。如果允许将一个进程分散到许多不连续的空间,就可以避免内存紧缩,减少碎片。基于这一思想,通过引入进程的逻辑地址,把进程地址空间与实际存储空间分离,增加存储管理的灵活性。地址空间和存储空间两个基本概念的定义如下:
地址空间:将源程序经过编译后得到的目标程序,存在于它所限定的地址范围内,这个范围称为地址空间。地址空间是逻辑地址的集合。
存储空间:指主存中一系列存储信息的物理单元的集合,这些单元的编号称为物理地址存储空间是物理地址的集合。
根据分配时所采用的基本单位不同,可将离散分配的管理方式分为以下三种
段式存储管理和段页式存储管理。其中段页式存储管理是前两种结合的产物。
1)基本原理。将程序的逻辑地址空间划分为固定大小的页(page),而物理内存划分为同样大小的页框(pageframe)。程序加载时,可将任意一页放人内存中任意一个页框,这些页框不必连续,从而实现了离散分配。该方法需要CPU的硬件支持,来实现逻辑地址和物理地址之间的映射。在页式存储管理方式中地址结构由两部构成,前一部分是页号,后一部分为页内地址,如图4-2所示。
这种管理方式的优点是,没有外碎片,每个内碎片不超过页大比前面所讨论的几种管理方式的最大进步是,一个程序不必连续存放。这样就便于改变程序占用空间的大小(主要指随着程序运行,动态生成的数据增多,所要求的地址空间相应增长)。缺点是仍旧要求程序全部装入内存,没有足够的内存,程序就不能执行。
2)页式管理的数据结构。在页式系统中进程建立时,操作系统为进程中所有的页分配页框。当进程撤销时收回所有分配给它的页框。在程序的运行期间,如果允许进程动态地申请空间,操作系统还要为进程申请的空间分配物理页框。操作系统为了完成这些功能,必须记录系统内存中
实际的页框使用情况。操作系统还要在进程切换时,正确地切换两个不同的进程地址空间到物理内存空间的映射。这就要求操作系统要记录每个进程页表的相关信息。为了完成上述的功能,—个页式系统中,一般要采用如下的数据结构。
进程页表:完成逻辑页号(本进程的地址空间)到物理页面号(实际内存空间)的映射。
每个进程有一个页表,描述该进程占用的物理页面及逻辑排列顺序。
物理页面表:整个系统有一个物理页面表,描述物理内存空间的分配使用状况,其数据结构可采用位示图和空闲页链表。
请求表:整个系统有一个请求表,描述系统内各个进程页表的位置和大小,用于地址转换也可以结合到各进程的PCB(进程控制块)里。
3)页式管理地址变换
在页式系统中,指令所给出的地址分为两部分:逻辑页号和页内地址。CPU中的内存管理单元(MMU)按逻辑页号通过查进程页表得到物理页框号,将物理页框号与页内地址相加形成物理地址(见图4-3)。上述过程通常由处理器的硬件直接完成,不需要软件参与。通常,操作系统只需在进程切换时,把进程页表的首地址装入处理器特定的寄存器中即可。一般来说,页表存储在主存之中。这样处理器每访问一个在内存中的操作数,就要访问两次内存。第一次用来查找页表将操作数的逻辑地址变换为物理地址;第二次完成真正的读写操作。这样做时间上耗费严重。为缩短查找时间,可以将页表从内存装入CPU内部的关联存储器(例如,快表)中,实现按内容查找。此时的地址变换过程是:在CPU给出有效地址后,由地址变换机构自动将页号送人快表,并将此页号与快表中的所有页号进行比较,而且这种比较是同时进行的。若其中有与此相匹配的页号,表示要访问的页的页表项在快表中。于是可直接读出该页所对应的物理页号,这样就无需访问内存中的页表。由于关联存储器的访问速度比内存的访问速度快得多。
1)基本原理。
在段式存储管理中,将程序的地址空间划分为若干个段(segment),这样每个进程有一个二维的地址空间。在前面所介绍的动态分区分配方式中,系统为整个进程分配一个连续的内存空间。而在段式存储管理系统中,则为每个段分配一个连续的分区,而进程中的各个段可以不连续地存放在内存的不同分区中。程序加载时,操作系统为所有段分配其所需内存,这些段不必连续,物理内存的管理采用动态分区的管理方法。在为某个段分配物理内存时,可以采用首先适配法、下次适配法、最佳适配法等方法。在回收某个段所占用的空间时,要注意将收回的空间与其相邻的空间合并。段式存储管理也需要硬件支持,实现逻辑地址到物理地址的映射。程序通过分段划分为多个模块,如代码段、数据段、共享段。这样做的优点是:可以分别编写和编译源程序的一个文件,并且可以针对不同类型的段采取不同的保护,也可以按段为单位来进行共享。总的来说,段式存储管理的优点是:没有内碎片,外碎片可以通过内存紧缩来消除;便于实现内存共享。缺点与页式存储管理的缺点相同,进程必须全部装入内存。
2)段式管理的数据结构。
为了实现段式管理,操作系统需要如下的数据结构来实现进程的地址空间到物理内存空间的映射,并跟踪物理内存的使用情况,以便在装入新的段的时候,合理地分配内存空间。
·进程段表:描述组成进程地址空间的各段,可以是指向系统段表中表项的索引。每段有段基址(baseaddress)。
·系统段表:系统所有占用段。
·空闲段表:内存中所有空闲段,可以结合到系统段表中。
3)段式管理的地址变换。
在段式管理系统中,整个进程的地址空间是二维的,即其逻辑地址由段号和段内地址两部分组成。为了完成进程逻辑地址到物理地址的映射,处理器会查找内存中的段表,由段号得到段的首地址,加上段内地址,得到实际的物理地址(见图4—4)。这个过程也是由处理器的硬件直接完成的,操作系统只需在进程切换时,将进程段表的首地址装入处理器的特定寄存器当中。这个寄存器一般被称作段表地址寄存器。
4.页式和段式系统的区别
页式和段式系统有许多相似之处。比如,两者都采用离散分配方式,且都通过地址映射机构来实现地址变换。但概念上两者也有很多区别,主要表现在:
·页是信息的物理单位,分页是为了实现离散分配方式,以减少内存的外零头,提高内存的利用率。或者说,分页仅仅是由于系统管理的需要,而不是用户的需要。段是信息的逻辑单位,它含有一组其意义相对完整的信息。分段的目的是为了更好地满足用户的需要。
·页的大小固定且由系统决定,把逻辑地址划分为页号和页内地址两部分,是由机器硬件实现的。段的长度不固定,且决定于用户所编写的程序,通常由编译系统在对源程序进行编译时根据信息的性质来划分。
·页式系统地址空间是一维的,即单一的线性地址空间,程序员只需利用一个标识符,即可表示一个地址。分段的作业地址空间是二维的,程序员在标识一个地址时,既需给出段名,又需给出段内地址。
原理作业10. 页式存储管理和段式存储管理的工作原理特点、特点 及优劣。 答:页式管理的基本思想是:为了更好地利用分区存储管理中 所产生的"零头"问题,允许把一个作业存放在不连续的内存块中, 又可以连续运行,它允许只调入用户作业中常用部分,不常用部分 不长期驻留内存,有效提高了内存的利用率。 页式存储管理的工作原理: A、划分实页:将物理内存划分成位置固定、大小相同的"块"(实页 面)。 B、划分虚页:将用户逻辑地址空间也分成同样大小的页面,成为虚 拟空间的虚页面。 C、建立页表:有时称为页面表或页面映射表(PMT)。每个作业一 张,按虚页号进行登记,其基本的内容有特征位(表示该页是否 在内存、实页号以及对应外存的地址。 D、地址变换:将虚页面的逻辑地址转化为实页面的物理地址,在程 序执行时改变为物理地址,属于作业的动态重定位,一般由地址 转换机构(硬件)完成。 特点: 允许一个作业存放在不连续的内存块中而又能保证作业连续得以运行 ,既不需要移动内存中的信息,又可较好地解决零头。 优点: a、不要求作业存放在连续的内存块中,有效地解决零头。 b、允许用户作业不是一次集中装入内存而是根据需要调入,作业中 不常用部分不长期驻留内存,而本次运行的不用部分根本就不装 入内存。 c、提供了虚存,使用户作业地址空间不再受内存可用空间大小的限 制。 缺点: a、页式管理在内存的共享和保护方面还欠完善。 b、页面大小相同,位置不能动态增加。 c、往往需要多次缺页中断才能把所需的信息完整地调入内存。 段式存储管理的基本思想是:把程序按内容或过程(函数)关系 分成段,每段有自己的名字。一个用户作业或进程所包含的段对应于 一个二维线性虚拟空间,也就是一个二维虚拟存储器。段式管理程序 以段为单位分配内存,然后通过地址映射机构把段式虚拟存储地址转 化为内存中的实际地址。和页式管理一样,段式管理也采用只把那些 经常访问的段驻留内存,而把那些在将来一段时间内不被访问的段放 在外存,待需要时自动调入内存的方法实现二维虚拟存储器。按照作 业的逻辑单位--段,来分配内存,适合程序的逻辑结构,方便用户设 计程序。 段式存储管理的工作原理: A、采用二维地址空间,如段号(S)、页号(P)和页内单元号(D); B、系统建两张表格每一作业一张段表,每一段建立一张页表,段表 指出该段的页表在内存中的位置; C、地址变换机构类似页式机制,只是前面增加一项段号。 特点: a、每一段分成若干页,再按页式管理,页间不要求连续; b、用分段方法分配管理作业,用分页方法分配管理内存; 优点: 便于段的共享和保护、段的动态增长以及动态连接。 缺点: 为了消除零头和允许段的动态增长,需要花费CPU的大量时间在内存 中移动作业的分段,而且段的大小也给外存管理带来困难。