本文参考于《2021年操作系统考研复习指导》(王道考研),《计算机操作系统教程》
思维导图:
引入多道程序的并发执行后,进程之间共享的不仅仅是处理机,还有主存储器。若不对内存进行管理,则容易导致内存数据的混乱,以至于限制进程的并发执行。因此,为了更好地支持多道程序的并发执行,必须进行内存管理。
OS对内存的划分和动态分配,就是内存管理的概念
内存管理的功能有:
(1)内存空间的分配与回收
由OS完成主存储器空间的分配和管理,使程序员摆脱存储分配的麻烦,提高编程效率
(2)地址转换
在多道程序环境下,程序中的逻辑地址与内存中的物理地址不可能一致,因此存储管理必须提供地址变换功能,把逻辑地址转换成相应的物理地址
(3)内存空间的扩充
利用虚拟存储技术或自动覆盖技术,从逻辑上扩充内存
(4)存储保护
保证各道作业在各自的存储空间内运行,互不干扰
在进行具体的内存管理之前,需了解进程运行的基本原理和要求
创建进程首先要将程序和数据装入内存。将用户源程序变为可在内存中执行的程序,通常需要以下几个步骤:
(1)编译
由编译程序将用户源代码编译成若干目标模块
(2)链接
由链接程序将编译后形成的一组目标模块及所需的库函数链接在一起,形成一个完整的装入模块
(3)装入
由装入程序将装入模块装入内存运行
程序的链接有以下三种方式:
(1)静态链接
在程序运行之前,先将各目标模块及它们所需的库函数链接成一个完整的可执行程序,以后不再拆开
(2)装入时动态链接
将用户源程序编译后所得到的一组目标模块,在装入内存时,采用边装入边链接的方式
(3)运行时动态链接
对某些目标模块的链接,是在程序执行中需要该目标模块时才进行的。其优点是便于修改和更新,便于实现对目标模块的共享
内存的装入模块在装入内存时,同样有以下三种方式:
(1)绝对装入
在编译时,若知道程序将驻留在内存的某个位置,则编译程序将产生绝对地址的目标代码。绝对装入程序按照装入模块中的地址,将程序和数据装入内存。由于程序中的逻辑地址与实际内存地址完全相同,因此不需对程序和数据的地址进行修改。 绝对装入方式只适用于单道程序环境。 另外,程序中所用的绝对地址,可在编译或汇编时给出,也可由程序员直接赋予。而通常情况下在程序中采用的是符号地址,编译或汇编时再转换为绝对地址。
(2)可重定位装入
在多道程序环境下,多个目标模块的起始地址(简称始址)通常都从0开始,程序中的其他地址都是相对于始址的,此时应采用可重定位装入方式。根据内存的当前情况,将装入模块装入内存的适当位置。装入时对目标程序中指令和数据的修改过程称为重定位,地址变换通常是在装入时一次完成的,所以又称静态重定位。
静态重定位的特点是:一个作业装入内存时,必须给它分配要求的全部内存空间,若没有足够的内存,则不能装入该作业。此外,作业一旦进入内存,整个运行期间就不能在内存中移动,也不能再申请内存空间。
(3)动态运行时装入,也称动态重定位
程序在内存中若发生移动,则需要采用动态的装入方式。装入程序把装入模块装入内存后,并不立即把装入模块中的相对地址转换为绝对地址,而是把这种地址转换推迟到程序真正要执行时才进行。 因此,装入内存后的所有地址均为相对地址。这种方式需要一个重定位寄存器的支持。
动态重定位的特点如下:可以将程序分配到不连续的存储区中;在程序运行之前可以只装入它的部分代码即可投入运行,然后在程序运行期间,根据需要动态申请分配内存;便于程序段的共享,可以向用户提供一个比存储空间大得多的地址空间。
编译后,每个目标模块都从0号单元开始编址,这称为该目标模块的相对地址(或逻辑地址)。 当链接程序将各个模块链接成一个完整的可执行目标程序时,链接程序顺序依次按各个模块的相对地址构成统一的从0号单元开始编址的逻辑地址空间。用户程序和程序员只需知道逻辑地址,而内存管理的具体机制则是完全透明的,只有系统编程人员才会涉及内存管理的具体机制。不同的进程可以有相同的逻辑地址,因为这些相同的逻辑地址可以映射到主存的不同位置。
物理地址空间是指内存中物理单元的集合,它是地址转换的最终地址, 进程在运行时执行指令和访问数据,最后都要通过物理地址从主存中存取。当装入程序将可执行代码装入内存时,必须通过地址转换将逻辑地址转换成物理地址,这个过程称为地址重定位。
内存分配前,需要保护OS不受用户进程的影响,同时保护用户进程不受其他用户进程的影响。内存保护可采取两种方法:
(1)在CPU中设置一对上、下限寄存器,存放用户作业在主存中的下限和上限地址,每当CPU要访问一个地址时,分别和两个寄存器的值相比,判断有无越界
(2)采用重定位寄存器(或基址寄存器)和界地址寄存器(又称限长寄存器) 来实现这种保护。重定位寄存器含最小的物理地址值,界地址寄存器含逻辑地址的最大值。 每个逻辑地址值必须小于界地址寄存器;内存管理机构动态地将逻辑地址与界地址寄存器进行比较,若未发生地址越界,则加上重定位寄存器的值后映射成物理地址,再送交内存单元
当CPU调度程序选择进程执行时,派遣程序会初始化重定位寄存器和界地址寄存器。每个逻辑地址都需要与这两个寄存器进行核对,以保证OS和其他用户程序及数据不被该进程的运行影响。
重定位寄存器是用来“加”的,逻辑地址加上重定位寄存器中的值就能得到物理地址;界地址寄存器是用来“比”的,通过比较界地址寄存器中的值与逻辑地址的值来判断是否越界
覆盖与交换技术是在多道程序环境下用来扩充内存的两种方法
早期的计算机系统中,主存容量很小,虽然主存中仅存放一道用户程序,但存储空间放不下用户进程的现象经常发生,这一矛盾可用覆盖技术解决
覆盖的基本思想如下:由于程序运行时并非任何时候都要访问程序及数据的各个部分,因此可把用户空间分成一个固定区和若干覆盖区。将经常活跃的部分放在固定区,其余部分按调用关系分段。首先将那些即将要访问的段放入覆盖区,其他段放在外存中,在需要调用前,系统再将其调入覆盖区,替换覆盖区中原有的段
覆盖技术的特点是,打破了必须将一个进程的全部信息装入主存后才能运行的限制,但当同时运行程序的代码量大于主存时仍不能运行,此外,内存中能够更新的地方只有覆盖区的段,不在覆盖区中的段会常驻内存。
交换的基本思想是:把处于等待状态(或在CPU调度原则下被剥夺运行权利)的程序从内存移到辅存,把内存空间腾出来,这一过程又称换出;把准备好竞争CPU运行的程序从辅存移到内存,这一过程又称换入
例如,有一个CPU采用时间片轮转调度算法的多道程序环境。时间片到,内存管理器将刚刚执行过的进程换出,将另一进程换入刚刚释放的内存空间。同时,CPU调度器可以将时间片分配给其他已在内存中的进程。每个进程用完时间片都与另一进程交换。在理想情况下,内存管理器的交换过程速度足够快,总有进程在内存中可以执行
有关交换,需注意:
(1)交换需要备份存储,通常是快速磁盘。它必须足够大,并提供对这些内存映像的直接访问
(2)为了有效使用CPU,需要使每个进程的执行时间比交换时间长,而影响交换时间的主要是转移时间。转移时间与所交换的内存空间成正比
(3)若换出进程,则必须确保该进程完全处于空闲状态
(4)交换空间通常作为磁盘的一整块,且独立于文件系统,因此使用起来可能很快
(5)交换通常在有许多进程运行且内存空间吃紧时开始启动,而在系统负荷降低时就暂停
(6)普通的交换使用不多,但交换策略的某些变体在许多系统(如UNIX系统)中仍发挥作用
交换技术主要在不同进程(或作业)之间进行,而覆盖则用于同一个程序或进程中。由于覆盖技术要求给出程序段之间的覆盖结构,使得其对用户和程序员不透明,所以对于主存无法存放用户程序的矛盾,现代OS是通过虚拟内存技术来解决的, 覆盖技术已成为历史;而交换技术在现代OS中仍具有较强的生命力
连续分配方式是指为一个用户程序分配一个连续的内存空间, 譬如某用户需要1GB的内存空间,连续分配方式就在内存空间中为用户分配一块连续的1GB空间。连续分配方式主要包括单一连续分配、固定分区分配和动态分区分配
内存在此方式下分为系统区和用户区,系统区仅供OS使用,通常在低地址部分;用户区是为用户提供的、除系统区之外的内存空间。 这种方式无须进行内存保护。因为内存中永远只有一道程序,因此肯定不会因为访问越界而干扰其他程序。
这种方式的优点是简单、无外部碎片,可以采用覆盖技术,不需要额外的技术支持。缺点是只能用于单用户、单任务的OS中, 有内部碎片,存储器的利用率极低
固定分区分配是最简单的一种多道程序存储管理方式,它将用户内存空间划分为若干固定大小的区域,每个分区只装入一道作业。当有空闲分区时,便可再从外存的后备作业队列中选择适当大小的作业装入该分区,如此循环。
固定分区分配在划分分区时有两种不同的方法:
(1)分区大小相等:用于利用一台计算机去控制多个相同对象的场合,缺乏灵活性
(2)分区大小不等:划分为多个较小的分区、适量的中等分区和少量大分区
为便于内存分配,通常将分区按大小排队,并为之建立一张分区说明表,其中各表项包括每个分区的始址、大小及状态(是否已分配),如图所示:
当有用户程序要装入时,便检索该表,以找到合适的分区给予分配并将其状态置为已分配;未找到合适分区时,则拒绝为该用户程序分配内存。存储空间的分配情况如图:
这种分区方式存在两个问题:一是程序可能太大而放不进任何一个分区中,这时用户程序不得不使用覆盖技术来使用内存空间;二是主存利用率低,当程序小于固定分区大小时,也占用一个完整的内存分区空间,这样分区内部就存在空间浪费,这种现象称为内部碎片。
固定分区是可用于多道程序设计的最简单的存储分配,无外部碎片,但不能实现多进程共享一个主存区,所以存储空间利用率低。固定分区分配很少用于现在通用的OS中,但在某些用于控制多个相同对象的控制系统中仍发挥着一定的作用。
动态分区分配又称可变分区分配,是一种动态划分内存的分区方法。这种分区方法不预先划分内存,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。 因此,系统中分区的大小和数目是可变的
如图所示,系统有64MB内存空间,其中低8MB固定分配给OS,其余为用户可用内存。开始时装入前三个进程,它们分别分配到所需的空间后,内存只剩下4MB,进程4无法装入。在某个时刻,内存中没有一个就绪进程,CPU出现空闲,OS就换出进程2,换入进程4。由于进程4比进程2小,这样在主存中就产生了一个6MB的内存块。之后CPU又出现空闲,而主存无法容纳进程2,OS就换出进程1,换入进程2。
动态分区在开始分配时是很好的,但之后会导致内存中出现许多小的内存块。随着时间的推移,内存中会出现越来越多的碎片,内存的利用率随之下降。 这些小的内存块称为外部碎片, 指在所有分区外的存储空间会变成越来越多的碎片,这与固定分区中的内部碎片正好相对。克服外部碎片可以通过紧凑(Compaction)技术来解决,即OS不时地对进程进行移动和整理。 但这需要动态重定位寄存器的支持,且相对费时。紧凑的过程实际上类似于Windows中的磁盘整理程序,只不过后者是对外存空间的紧凑。
在进程装入或换入主存时,若内存中有多个足够大的空闲块,则OS必须确定分配哪个内存块给进程使用,这就是动态分区的分配策略。 考虑以下几种算法:
(1)首次适应(First Fit)算法
空闲分区以地址递增的次序链接。分配内存时顺序查找,找到大小能满足要求的第一个空闲分区。
(2)最佳适应(Best Fit)算法
空闲分区按容量递增的方式形成分区链, 找到第一个能满足要求的空闲分区
(3)最坏适应(Worst Fit)算法
又称最大适应算法,空闲分区以容量递减的次序链接,找到第一个能满足要求的空闲分区,即挑选出最大的分区
(4)邻近适应(Next Fit)算法
又称循环首次适应算法,由首次适应算法演变而成。不同之处是,分配内存时从上次查找结束的位置开始继续查找。
在这几种方法中,首次适应算法不仅是最简单的,而且通常也是最好的和最快的。 在UNIX系统的最初版本中,就是使用首次适应算法为进程分配内存空间的,它使用数组的数据结构(而非链表)来实现。不过,首次适应算法会使得内存的低地址部分出现很多小的空闲分区,而每次分配查找时,都要经过这些分区,因此增加了查找的开销。
邻近适应算法试图解决上述问题。但实际上,它常常导致在内存的末尾分配空间(因为在一遍扫描中,内存前面部分使用后再释放时,不会参与分配),使位于存储空间末尾的大分区被撕裂成小的外部碎片。它通常比首次适应算法的结果要差
最佳适应算法的性能通常很差,因为每次最佳的分配会留下很小的难以利用的内存块,会产生最多的外部碎片。
模拟实验结果表明:首次适应算法可能比最佳适应算法效果好,而它们两者一定比最大适应法效果好。另外要注意,在算法实现时,分配操作中最佳适应法和最大适应法需要对可用块进行排序或遍历查找,而首次适应法和邻近适应法只需要简单查找;在回收操作中,当回收的块与原来的空闲块相邻时,需要将这些块合并。在算法实现时,使用数组或链表进行管理。除了内存的利用率,这里的算法开销也是OS设计需要考虑的一个因素。
三种内存分区管理方式的比较:
以上三种内存分区管理方法有一个共同特点:即用户进程(或作业)在主存中都是连续存放的。
非连续分配允许一个程序分散地装入不相邻的内存分区。 在连续分配管理方式中,即使内存有超过1GB的空闲空间,但若没有连续的1GB空间,则需要1GB空间的作业仍然是无法运行的;但若采用非连续分配管理方式,则作业所要求的1GB内存空间可以分散地分配在内存的各个区域,当然,这也需要额外的空间去存储它们(分散区域)的索引,使得非连续分配方式的存储密度低于连续存储方式的。
非连续分配管理方式根据分区的大小是否固定,分为分页存储管理方式和分段存储管理方式。
在分页存储管理方式中,又根据运行作业时是否要把作业的所有页面都装入内存才能运行,分为基本分页存储管理方式和请求分页存储管理方式。
固定分区会产生内部碎片,动态分区会产生外部碎片, 这两种技术对内存的利用率都比较低。我们希望内存的使用能尽量避免碎片的产生,这就引入了分页的思想:把主存空间划分为大小相等且固定的块,块相对较小,作为主存的基本单位。每个进程也以块为单位进行划分,进程在执行时,以块为单位逐个申请主存中的块空间。
分页的方法从形式上看,有点像分区相等的固定分区技术,分页管理不会产生外部碎片。 但它又有着本质的不同点:块的大小相对分区要小很多,而且进程也按照块进行划分,进程运行时按块申请主存可用空间并执行。这样,进程只会在为最后一个不完整的块申请一个主存块空间时,才产生主存碎片, 所以尽管会产生内部碎片,但这种碎片相对于进程来说也是很小的,每个进程平均只产生半个块大小的内部碎片(也称页内碎片)
(1)分页存储的几个基本概念
a.页面和页面大小
进程中的块称为页(Page),内存中的块称为页框(Page Frame,或页帧)。 外存也以同样的单位进行划分,直接称为块(Block)。进程在执行时需要申请主存空间,即要为每个页面分配主存中的可用页框,这就产生了页和页框的一 一对应。
为方便地址转换,页面大小应是2的整数幂。同时页面大小应该适中,页面太小会使进程的页面数过多,这样页表就会过长,占用大量内存,而且也会增加硬件地址转换的开销,降低页面换入/换出的效率;页面过大又会使页内碎片增多,降低内存的利用率。
b.地址结构
分页存储管理的逻辑地址结构如图:
地址结构包含两部分:前一部分为页号P,后一部分为页内偏移量W。 地址长度32位,其中0~11位为页内地址,即每页大小为4KB;12 ~ 31位为页号,地址空间最多允许2^20页
地址结构决定了虚拟内存的寻址空间有多大
c.页表
为了便于在内存中找到进程的每个页面所对应的物理块,系统为每个进程建立一张页表,它记录页面在内存中对应的物理块号,页表一般存放在内存中。
页表是由页表项组成的。 注意页表项与地址的区别,页表项与地址都由两部分构成,而且第一部分都是页号,但页表项的第二部分是物理内存中的块号, 而地址的第二部分是页内偏移;页表项的第二部分与地址的第二部分共同组成物理地址。
在配置页表后,进程执行时,通过查找该表,即可找到每页在内存中的物理块号。页表的作用是实现从页号到物理块号的地址映射。
(2)基本地址变换机构
地址变换机构的任务是将逻辑地址转换为内存中的物理地址。地址变换是借助于页表实现的。 下图为分页存储管理系统中的地址变换机构
在系统中通常设置一个页表寄存器(PTR),存放页表在内存的起始地址F和页表长度M。进程未执行时,页表的始址和长度存放在进程控制块中,当进程执行时,才将页表始址和长度存入页表寄存器。 设页面大小为L,逻辑地址A到物理地址E的变换过程如下(逻辑地址、页号、每页的长度都是10进制数):
a.计算页号P(P=A/L)和页内偏移量W(W=A%L)
b.比较页号P和页表长度M,若P>=M,则产生越界中断,否则继续执行
c.页表中页号P对应的页表项地址=页表始址F+页号P x 页表项长度,取出该页表项内容b,即为物理块号。注意页表长度和页表项长度的区别,页表长度的值是指一共有多少页,页表项长度是指页地址占多大的存储空间。
d.计算E=b x L+W,用得到的物理地址E取访问内存
以上整个地址变换过程都是由硬件自动完成的。 例如,若页面大小L为1KB,页号2对应的物理块为b=8,计算逻辑地址A=2500的物理地址E:P=2500/1K=2,W=2500%1K=452,查找得到页号2对应的物理块号为8,E=8 x 1024+452=8644
页式管理只需给出一个整数就能确定对应的物理地址,因为页面大小L是固定的。因此,页式管理中地址空间是一维的。
页表项的作用是找到该页在内存中的位置。以32位逻辑地址空间、字节编址单位、一页4KB为例,地址空间内一共有2^32B/4KB=1M页,因此需要20位才能保证表示范围能容纳所有页面,又因为以字节作为编址单位,即页表项的大小>=3B。为保证页表项能指向所有页面,页表项的大小应该>=3B,也可选择更大的页表项让一个页面能够正好容下整数个页表项,进而方便存储(如取成4B,一页正好可以装下1K个页表项),或增加一些其他信息。
下面讨论分页管理方式存在的两个主要问题:a.每次访存操作都需要进行逻辑地址到物理地址的转换,地址转换过程必须足够快,否则访存速度会降低;b.每个进程引入页表,用于存储映射机制,页表不能太大,否则内存利用率会降低
(3)具有快表的地址变换机构
若页表全部放在内存中,则存取一个数据或一条指令至少要访问两次内存:第一次是访问页表,确定所存取的数据或指令的物理地址;第二次是根据该地址存取数据或指令。
在地址变换机构中增设一个具有并行查找能力的高速缓冲存储器——快表,又称相联存储器(TLB),用来存放当前访问的若干页表项,以加速地址变换的过程。 与此对应,主存中的页表常称为慢表。
在具有快表的分页机制中,地址的变换过程如下:
a.CPU给出逻辑地址后,由硬件进行地址转换,将页号送入高速缓存寄存器,并将此页号与快表中的所有页号进行比较
b.若找到匹配的页号,说明所要访问的页表项在快表中,则直接从中取出该页对应的页框号,与页内偏移量拼接形成物理地址。这样,存取数据仅一次访存便可实现。
c.若未找到匹配的页号,则需要访问主存中的页表,在读出页表项后,应同时将其存入快表, 以便后面可能的再次访问。但若快表已满,则必须按照一定的算法对旧的页表项进行替换。
注意:有些处理机设计为快表和慢表同时查找,若在快表中查找成功则终止慢表的查找
快表的有效性基于程序的局部性原理
(4)两级页表
由于引入了分页管理,进程在执行时不需要将所有页调入内存页框,而只需将保存有映射关系的页表调入内存。但我们仍需考虑页表的大小。
以32位逻辑地址空间、页面大小4KB、页表项大小为4B,一个40MB的进程为例,页表项共40KB,若将所有页表项内容保存在内存中,则需要10个内存页框来保存整个页表。为了压缩页表,应用时间换空间的思想,引入二级分页,即使用层次结构的页表:将页表的10页空间也进行地址映射,建立上一级页表,用于存储页表的映射关系。一级页表的页表项是二级页表的起始地址,这里对页表的10个页面进行映射只需要10个页表项,所以上一级页表只需要1页就已足够。在进程执行时,只需要将这一页的上一级页表调入内存即可,进程的页表和进程本身的页面可在后面的执行中再调入内存。
需要一张索引表来告诉我们第几张页表该上哪里去找,这能解决页表的查询问题,且不用把所有的页表都调入内存,只在需要它时才调入,因此能解决占用内存空间过大的问题。实际上就是构造一个页表的页表,也就是二级页表。为查询方便,顶级页表最多只能有一个页面。 因此顶级页表总共可以容纳4KB/4B=1K个页表项,它占用的地址位数为10位,而页内偏移地址占12位,因此一个32位的逻辑地址空间就剩下了10位,正好使得二级页表的大小在一页之内,这样就得到了逻辑地址空间的格式
二级页表实际上是在原有页表结构上再加上一层页表
建立多级页表的目的在于建立索引,以便不用浪费主存空间去存储无用的页表项,也不用盲目地顺序式查找页表项
多级页表解决了当逻辑地址空间过大时,页表的长度会大大增加的问题。而采用多级页表时,一次访问过程需要多次访问内存甚至磁盘,会大大增加一次访存的时间
分页管理方式是从计算机的角度考虑设计的,目的是提高内存的利用率,提升计算机的性能。分页通过硬件机制实现,对用户完全透明。分段管理方式的提出则考虑了用户和程序员,以满足方便编程、信息保护和共享、动态增长及动态链接等多方面的需要。
(1)分段
段式管理方式按照用户进程中的自然段划分逻辑空间。 例如,用户程序由主程序、两个子程序、栈和一段数据组成,于是可以把这个用户进程划分为5段,每段从0开始编址,并分配一段连续的地址空间(段内要求连续,段间不要求连续,因此整个作业的地址空间是二维的),其逻辑地址由段号S与段内偏移量W两部分组成。
在下图中,段号为16位,段内偏移量为16位,因此一个作业最多有2^16=65536段,最大段长为64KB。
在页式系统中,逻辑地址的页号和页内偏移量对用户是透明的,但在段式系统中,段号和段内偏移量必须由用户显式提供,在高级程序设计语言中,这个工作由编译程序完成。
(2)段表
每个进程都有一张逻辑空间与内存空间映射的段表,其中每个段表项对应进程的一段,段表项记录该段在内存中的始址和长度。
配置段表后,执行中的进程可通过查找段表,找到每段所对应的内存区。段表用于实现从逻辑段到物理内存区的映射
在系统中设置了段表寄存器,用于存放段表始址F和段表长度M。从逻辑地址A到物理地址E的地址变换过程如下:
a.从逻辑地址A中取出前几位为段号S,后几位为段内偏移量W
b.比较段号S和段表长度M,若S>=M,则产生越界中断,否则继续执行
c.段表中段号S对应的段表项地址=段表始址F+段号S x 段表项长度,取出该段表项的前几位得到段长C。若段内偏移量>=C,则产生越界中断,否则继续执行。段表项实际上只有两部分,前几位是段长,后几位是始址。
d.取出段表项中该段的始址b,计算E=b+W,用得到的物理地址E去访问内存。
(4)段的共享与保护
在分段系统中,段的共享是通过两个作业的段表中相应表项指向被共享的段的同一个物理副本来实现的。 当一个作业正从共享段中读取数据时,必须防止另一个作业修改此共享段中的数据。不能修改的代码称为纯代码或可重入代码(它不属于临界资源),这样的代码和不能修改的数据可以共享,而可修改的代码和数据不能共享。
与分页管理类似,分段管理的保护方法主要有两种:一种是存取控制保护,另一种是地址越界保护。地址越界保护将段表寄存器中的段表长度与逻辑地址中的段号比较,若段号大于段表长度,则产生越界中断;再将段表项中的段长与逻辑地址中的段内偏移进行比较,若段内偏移大于段长,也会产生越界中断。 分页管理中的地址越界保护只需要判断页号是否越界,页内偏移是不可能越界的。
与页式管理不同,段式管理不能通过给出一个整数便确定对应的物理地址,因为每段的长度是不固定的,无法通过整数除法得出段号,无法通过求余得出段内偏移,所以段号和段内偏移一定要显式给出 (段号,段内偏移),因此分段管理的地址空间是二维的
分页管理方式和分段管理方式各方面的对比:
页式存储管理能有效地提高内存利用率,而分段存储管理能反映程序的逻辑结构并有利于段的共享。将这两种存储管理方法结合起来,便形成了段页式存储管理方式。
在段页式系统中,作业的地址空间首先被分成若干逻辑段,每段都有自己的段号,然后将每段分成若干大小固定的页。对内存空间的管理仍然和分页存储管理一样,将其分成若干和页面大小相同的存储块,对内存的分配以存储块为单位。
在段页式系统中,作业的逻辑地址分为三部分:段号、页号和页内偏移量
为了实现地址变换,系统为每个进程建立一张段表,每个分段有一张页表。 段表表项中至少包括段号、页表长度和页表始址,页表表项中至少包括页号和块号。 此外,系统中还应有一个段表寄存器,指出作业的段表始址和段表长度
注意:在一个进程中,段表只有1个,而页表可能有多个
在进行地址变换时,首先通过段表查到页表始址,然后通过页表找到页帧号,最后形成物理地址。进行一次访问实际需要三次访问主存, 这里同样可以使用快表来加快查找速度,其关键字由段号、页号组成,值是对应的页帧号和保护码。
段页式管理的地址空间是二维的
例题:在虚拟内存管理中,地址变换机构将逻辑地址变换为物理地址,形成该逻辑地址的阶段是()
A.编辑 B.编译 C.链接 D.装载
答案:C;编译后的程序需要经过链接才能装载,而链接后形成的目标程序中的地址就是逻辑地址。以C语言为例:C程序经过预处理——>编译——>汇编——>链接产生了可执行文件,其中链接的前一步是产生可重定位的二进制目标文件。C语言采用源文件独立编译的方法,如程序main.c,file1.c,file2.c,file1.h,file2.h在链接的前一步生成了main.o,file1.o,file2.o,这些目标模块的逻辑地址都从0开始,但只是相对于该模块的逻辑地址。链接器将这三个文件、libc和其库文件链接成一个可执行文件。链接阶段主要完成重定位,形成整个程序的完整逻辑地址空间。
例如,file1.o的逻辑地址为0~1023,main.o的逻辑地址为0 ~1023,假设链接时将file1.o链接在main.o之后,则链接之后file1.o对应的逻辑地址应为1024 ~2047,整个过程如下图所示:
例题:在使用交换技术时,若一个进程正在(),则不能交换出主存
A.创建 B.I/O操作 C.处于临界段 D.死锁
答案:B;进程正在执行I/O操作时不能换出主存,否则其I/O数据区将被新换入的进程占用,导致错误。若处于临界区,当被阻塞时,可换出内存
例题:在存储管理中,采用覆盖与交换技术的目的是()
A.节省主存空间 B.物理上扩充主存容量
C.提高CPU效率 D.实现主存共享
答案:A;
例题:某基于动态分区存储管理的计算机,其主存容量为55MB(初始为空),采用最佳适配算法,分配和释放的顺序为:分配15MB,分配30MB,释放15MB,分配8MB,分配6MB,此时主存中最大空闲分区的大小是
答案:9MB
例题:动态重定位是在作业的()中进行的
A.编译过程 B.装入过程 C.链接过程 D.执行过程
答案:D;
例题:多进程在主存中彼此互不干扰的环境下运行,OS是通过()来实现的
A.内存分配 B.内存保护 C.内存扩充 D.地址映射
答案:B;多进程的执行通过内存保护实现互不干扰, 如页式管理中有页地址越界保护,段式管理中有段地址越界保护
例题:采用分页或分段管理后,提供给用户的物理地址空间()
A.分页支持更大的物理地址空间
B.分段支持更大的物理地址空间
C.不能确定
D.一样大
答案:C;页表和段表同样存储在内存中,系统提供给用户的物理地址空间为总空间大小减去页表或段表的长度。
例题:分页系统中的页面是为()
A.用户所感知的 B.OS所感知的 C.编译系统所感知的 D.连接装配程序所感知的
答案:B;内存分页管理是在硬件和OS层面实现的,对用户、编译系统、连接装配程序等上层是不可见的
例题:对重定位存储管理方式,应()
A.在整个系统中设置一个重定位寄存器
B.为每道程序设置一个重定位寄存器
C.为每道程序设置两个重定位寄存器
D.为每道程序和数据都设置一个重定位寄存器
答案:A;只需在切换程序执行时重置寄存器内容
例题:OS实现()存储管理的代价最小
A.分区 B.分页 C.分段 D.段页式
答案:A;
例题:对外存对换区的管理以()为主要目标
A.提高系统吞吐量 B.提高存储空间的利用率
C.降低存储费用 D.提高换入、换出速度
答案:D;
例题:下列关于虚拟存储器的论述中,正确的是()
A.作业在运行前,必须全部装入内存,且在运行过程中也一直驻留内存
B.作业在运行前,不必全部装入内存,且在运行过程中也不必一直驻留内存
C.作业在运行前,不必全部装入内存,但在运行过程中必须一直驻留内存
D.作业在运行前,必须全部装入内存,但在运行过程中不必一直驻留内存
答案:B;
例题:把作业空间中使用的逻辑地址变为内存中的物理地址称为()
A.加载 B.重定位 C.物理化 D.逻辑化
答案:B;
例题:OS采用分页存储管理方式,要求()
A.每个进程拥有一张页表,且进程的页表驻留在内存中
B.每个进程拥有一张页表,但只有执行进程的页表驻留在内存中
C.所有进程共享一张页表,以节约有限的内存空间,但页表必须驻留在内存中
D.所有进程共享一张页表,只有页表中当前使用的页面必须驻留在内存中,以最大限度地节省有限的内存空间
答案:A;在多个进程并发执行时,所有进程的页表大多数驻留在内存中,在系统中只设置一个页表寄存器(PTR),它存放页表在内存中的始址和长度。平时,进程未执行时,页表的始址和页表长度存放在本进程的PCB中,当调度到某进程时,才将这两个数据装入页表寄存器中。每个进程都有一个单独的逻辑地址,有一张属于自己的页表。
例题:
答案:B;一页可以存放2^9个页表项,逻辑地址空间为2 ^16页,即共需2 ^ 16个页表项,因此需要128个页面保存页表项,即页目录表中包含表项的个数至少是128
例题:在分段存储管理系统中,用共享段表描述所有被共享的段。若进程P1和P2共享段S,则下列叙述中,错误的是()
A.在物理内存中仅保存一份段S的内容
B.段S在P1和P2中应该具有相同的段号
C.P1和P2共享段S在共享段表中的段表项
D.P1和P2都不再使用段S时才回收段S所占的内存空间
答案:B;段S对于进程P1、P2来说,使用位置可能不同,所以在不同进程中的逻辑段号可能不同。段的共享是通过两个作业的段表中相应表项指向被共享的段的同一个物理副本来实现的,因此在内存中仅保存一份段S的内容;段表项存放的是段的物理地址(包括段始址和段长度),对于共享段S来说物理地址是唯一的;
例题:某OS采用段式管理,用户区主存为512KB,空闲块链入空块表,分配时截取空块的前半部分(小地址部分)。初始时全部空闲。执行申请、释放操作序列reg(300KB),reg(100KB),release(300KB),reg(150KB),reg(50KB),reg(90KB)后:
(1)采用最先适配,空块表中有哪些空块(指出大小及始址)
(2)采用最佳适配,空块表中有哪些空块(指出大小及始址)
(3)若随后又要申请80KB,针对上述两种情况会产生什么后果?这说明了什么问题?
答案:(1)290K,10KB;400K,112KB;
(2)240K,60KB;450K,62KB
(3)最先适配算法可以分配成功,而最佳适配算法则没有足够大的空闲区分配。这说明最先适配算法尽可能地使用了低地址部分的空闲区域,留下了高地址部分的大的空闲区,更有可能满足进程的申请
例题:
答案:
(1)4KB,4MB;
(2)页目录号:( ( ( unsigned int )( LA ) >>22 ) ) & 0x3FF
页表索引:( ( ( unsigned int )( LA ) >>12 ) ) & 0x3FF
(3)0020 0020H,0020 0024H;块号和页号一样,是20位,00900H,00901H;0090 1000H
例题:
(1)指出这两种变换各属于何种存储管理
(2)计算出这两种变换所对应的物理地址
答案:(1)页式管理、段式管理
(2)一页的大小为2KB,12 x 2048 +586=25162;4586
例题:某一页式系统,其页表存放在主存中:
(1)若对主存的一次存取需1.5μs,问实现一次页面访问时存取时间是多少
(2)若系统有快表且其平均命中率为85%,而页表项在快表中的查找时间可忽略不计,试问此时的存取时间为多少
答案:3μs,1.725μs
例题:在页式、段式和段页式存储管理中,当访问一条指令或数据时,各需要访问内存几次?其过程如何?假设一个页式存储系统具有快表,多数活动页表项都可以存在其中。若页表存放在内存中,内存访问时间是1μs,检索快表的时间为0.2μs,若快表的命中率是85%,则有效存取时间是多少?若快表的命中率为50%,则有效存取时间是多少
答案:(1)在页式存储管理中,访问指令或数据时,首先要访问内存中的页表,查找到指令或数据所在页面对应的页表项,然后根据页表项查找访问指令或数据所在的内存页面。需要访问内存2次。
段式存储管理需要访问内存2次
段页式存储管理,首先要访问内存中的段表,然后访问内存中的页表,最后访问指令或数据所在的内存页面,需要访问内存3次
对于比较复杂的情况,如多级页表,若页表划分为N级,则需要访问内存N+1次。若系统中有快表,则在快表命中时,只需要访问内存1次
(2)(0.2+1)x 0.85+(0.2+2) x 0.15=1.35μs;
(3)1.7μs;
例题:在一个分页存储管理系统中,地址空间分页(每页1KB),物理空间分块,设主存总容量是256KB,描述主存分配情况的位示图如下图所示(0表示未分配,1表示已分配),此时作业调度程序选中一个长为5.2KB的作业投入内存
(1)为该作业分配内存后(分配内存时,首先分配低地址的内存空间),填写该作业的页表内容
(2)页式存储管理有无零头存在?若有,会存在什么零头?为该作业分配内存后,会产生零头吗?若产生,大小为多少?(零头指一页中未被使用的部分)
(3)假设一个64MB内存容量的计算机,其OS采用页式存储管理(页面大小为4KB),内存分配采用位示图方式管理,请问位示图将占用多大的内存
(1)一次性
作业必须一次性全部装入内存后,才能开始运行。这会导致两种情况:a.当作业很大而不能全部被装入内存时,将使该作业无法运行;b.当大量作业要求运行时,由于内存不足以容纳所有作业,只能使少数作业先运行,导致多道程序度的下降
(2)驻留性
作业被装入内存后,就一直驻留在内存中,其任何部分都不会被换出,直至作业运行结束。运行中的进程会因等待I/O而被阻塞,可能处于长期等待状态
由以上分析可知,许多在程序运行中不用或暂时不用的程序(数据)占据了大量的内存空间,而一些需要运行的作业又无法装入运行,浪费了内存资源
快表、页高速缓存及虚拟内存技术从广义上来讲,都属于高速缓存技术。这个技术所依赖的原理就是局部性原理。 局部性原理既适用于程序结构,又适用于数据结构
局部性原理表现在以下两个方面:
(1)时间局部性
程序中的某条指令一旦执行,不久后该指令可能再次执行;某数据被访问过,不久后该数据可能再次被访问。产生时间局部性的典型原因是程序中存在着大量的循环操作。
(2)空间局部性
一旦程序访问了某个存储单元,在不久后,其附近的存储单元也将被访问,即程序在一段时间内所访问的地址,可能集中在一定的范围之内,因为指令通常是顺序存放、顺序执行的,数据也一般是以向量、数组、表等形式簇聚存储的。
时间局部性通过将近来使用的指令和数据保存到高速缓冲存储器中,并使用高速缓存的层次结构实现。空间局部性通常使用较大的高速缓存,并将预取机制 集成到高速缓存控制逻辑中实现。虚拟内存技术实际上建立了“内存-外存”的两级存储器结构,利用局部性原理实现高速缓存
在物理上扩展内存相对有限的条件下,可在逻辑上扩充内存,因此引入虚存的概念。虚拟内存使用外存上的空间来扩充内存空间,通过一定的换入/换出,使得整个系统在逻辑上能够使用一个远远超出其物理内存大小的内存容量。
基于局部性原理,在程序装入时,将程序的一部分装入内存,而将其余部分留在外存,就可启动程序执行。在程序执行过程中,当所访问的信息不在内存时,由OS将所需要的部分调入内存,然后继续执行程序。 另一方面,OS将内存中暂时不使用的内容换出到外存上,从而腾出空间存放将要调入内存的信息。 这样,系统好像为用户提供了一个比实际内存大得多的存储器,称为虚拟存储器。
之所以将其称为虚拟存储器,是因为这种存储器实际上并不存在,只是由于系统提供了部分装入、请求调入和置换功能后(对用户完全透明),给用户的感觉是好像存在一个比实际物理内存大得多的存储器。虚拟存储器的大小由计算机的地址结构决定,并不是内存和外存的简单相加。虚拟存储器有以下三个主要特征:
(1)多次性
多次性是指无须在作业运行时一次性地全部装入内存,而允许被分成多次调入内存运行
(2)对换性
对换性是指无须在作业运行时一直常驻内存,而允许在作业的运行过程中,进行换进和换出
(3)虚拟性
虚拟性是指从逻辑上扩充内存的容量,使用户看到的内存容量远大于实际的内存容量。
虚存空间的大小由什么因素决定?
虚存的大小要同时满足两个条件:
1.虚存的大小<=内存容量和外存容量之和,这是硬件的硬性条件规定的,若虚存大小超过了这个容量,则没有相应的空间来供虚存使用
2.虚存的大小<=计算机的地址位数能容纳的最大容量。假设地址是32位的,按字节编址,一个地址代表1B存储空间,则虚存的大小<=4GB。若虚存的大小超过4GB,则32位的地址将无法访问全部虚存,即4GB以后的空间被浪费了。
实际虚存的容量是取条件1和2的交集
虚存存在什么问题?
因为虚拟内存技术调换页面时需要访问外存,会导致平均访存时间增加,若使用了不合适的替换算法,则会大大降低系统性能。
虚拟内存技术允许将一个作业多次调入内存。采用连续分配方式时,会使相当一部分内存空间都处于暂时或“永久”的空闲状态,造成内存资源的严重浪费,而且也无法从逻辑上扩大内存容量。因此,虚拟内存的实现需要建立在离散分配的内存管理方式的基础上。
虚拟内存的实现有以下三种方式:
(1)请求分页存储管理
(2)请求分段存储管理
(3)请求段页式存储管理
不管哪种方式,都需要有一定的硬件支持。一般需要的支持有以下几个方面:
(1)一定容量的内存和外存
(2)页表机制(或段表机制),作为主要的数据结构
(3)中断机构,当用户程序要访问的部分尚未调入内存时,则产生中断
(4)地址变换机构,实现逻辑地址到物理地址的变换
请求分页系统建立在基本分页系统基础之上,为了支持虚拟存储器功能而增加了请求调页功能和页面置换功能。 请求分页是目前最常用的一种实现虚拟存储器的方法。
在请求分页系统中,只要求将当前需要的一部分页面装入内存,便可以启动作业运行。在作业执行过程中,当所要访问的页面不在内存中时,再通过调页功能将其调入,同时还可通过置换功能将暂时不用的页面换出到外存上,以便腾出内存空间。
为了实现请求分页,系统必须提供一定的硬件支持。除了需要一定容量的内存及外存的计算机系统,还需要有页表机制、缺页中断机构和地址变换机构。
请求分页系统的页表机制不同于基本分页系统,请求分页系统在一个作业运行之前不要求全部一次性调入内存,因此在作业的运行过程中,必然会出现要访问的页面不在内存中的情况,如何发现和处理这种情况是请求分页系统必须解决的两个基本问题。为此,在请求页表项中增加了4个字段:
(1)状态位P
用于指示该页是否已调入内存,供程序访问时参考
(2)访问字段A
用于记录本页在一段时间内被访问的次数,或记录本页最近已有多长时间未被访问,供置换算法换出页面时参考
(3)修改位M
标识该页在调入内存后是否被修改过
(4)外存地址
用于指出该页在外存上的地址,通常是物理块号,供调入该页时参考
在请求分页系统中,每当所要访问的页面不在内存中时,便产生一个缺页中断,请求OS将所缺的页调入内存。此时应将缺页的进程阻塞(调页完成唤醒),若内存中有空闲块,则分配一个块,将要调入的页装入该块,并修改页表中的相应页表项,若此时内存中没有空闲块,则要淘汰某页(若被淘汰页在内存期间被修改过,则要将其写回外存)
缺页中断作为中断,同样要经历诸如保护CPU环境、分析中断原因、转入缺页中断处理程序、恢复CPU环境等几个步骤。但与一般的中断相比,它有以下两个明显的区别:
(1)在指令执行期间而非一条指令执行完后产生和处理中断信号,属于内部中断。
(2)一条指令在执行期间,可能产生多次缺页中断。
请求分页系统中的地址变换机构,是在分页系统地址变换机构的基础上,为实现虚拟内存,又增加了某些功能而形成的
在进行地址变换时,先检索快表:
(1)若找到要访问的页,则修改页表项中的访问位(写指令还需要重置修改位),然后利用页表项中给出的物理块号和页内地址形成物理地址
(2)若未找到该页的页表项,则应到内存中去查找页表,再对比页表项中的状态位P,,看该页是否已调入内存,未调入则产生缺页中断,请求从外存把该页调入内存
进程运行时,若其访问的页面不在内存中而需将其调入,但内存中已无空闲空间时,就需要从内存中调出一页程序或数据,送入磁盘的对换区。
选择调出页面的算法就称为页面置换算法。 好的页面置换算法应有较低的页面更换频率,即应将以后不会再访问或以后较长时间内不会再访问的页面先调出。
常见的置换算法有以下四种:
最佳(Optimal,OPT)置换算法选择的被淘汰页面是以后永不使用的页面,或是在最长时间内不再被访问的页面,以便保证获得最低的缺页率。 然而,由于无法预知进程在内存下的若干页面中哪个是未来最长时间内不再被访问的,因而该算法无法实现。
最佳置换算法可用来评价其他算法。 假定系统为某进程分配了三个物理块,并考虑有页面号引用串7,0,1,2,0,3,0,4,2,3,0,3,2,1,2,0,1,7,0,1。进程运行时,先将7,0,1三个页面依次装入内存。进程要访问页面2时,产生缺页中断,根据最佳置换算法,选择将第18次访问才需调入的页面7淘汰。然后,访问页面0时,因为它已在内存中,所以不必产生缺页中断。访问页面3时,又会根据最佳置换算法将页面1淘汰…以此类推,如下图所示:
注意最长时间不被访问和以后被访问次数最小是不同的概念
上例中发生缺页中断的次数为9,页面置换的次数为6
优先淘汰最早进入内存的页面,即在内存中驻留时间最久的页面。 该算法的实现只需把调入内存的页面根据先后次序链接成队列,设置一个指针总指向最早的页面。但该算法与进程实际运行时的规律不适应,因为在进程中,有的页面经常被访问。
仍用上面的实例采用FIFO算法进行页面置换,结果进行了12次页面置换:
FIFO算法还会产生所分配的物理块数增大而页故障数不减反增的异常现象,称为Belady异常。 之所以出现Belady现象是因为FIFO算法的置换特征与进程访问内存的动态特征是矛盾的,与置换算法的目标是不一致的(即替换较少使用的页面),因此,被它置换出去的页面并不一定是进程不会访问的。只有FIFO算法可能出现Belady异常,LRU和OPT算法永远不会出现Belady异常。
如下图所示,页面访问顺序为3,2,1,0,3,2,4,3,2,1,0,4。若采用FIFO置换算法,当分配的物理块为3个时,缺页次数为9次;当分配的物理块为4个时,缺页次数为10次。分配给进程的物理块增多,但缺页次数不减反增
选择最近最长时间未访问过的页面予以淘汰,它认为过去一段时间内未访问过的页面,在最近的将来可能也不会被访问。该算法为每个页面设置一个访问字段,来记录页面自上次被访问以来所经历的时间,淘汰页面时选择现有页面中值最大的予以淘汰。
对之前的实例采用LRU算法进行页面置换:
注意LRU算法与OPT算法的不同,LRU算法根据各页以前的情况,是“向前看”的,而最佳置换算法则根据各页以后的使用情况,是“向后看”的。
LRU算法的性能较好,但需要寄存器和栈的硬件支持。 LRU是堆栈类的算法。堆栈类的算法不可能出现Belady异常。
LRU算法有两种可能的实现方法:
(1)系统维护一个页面链表,最近刚刚使用过的页面作为首结点,最久未使用的页面作为尾结点。每一次访问内存时,找到相应的页面,把它从链表中摘下来,再移动到链表之首。每次缺页中断发生时,淘汰链表末尾的页面
(2)设置一个活动页面栈,当访问某页时,将此页号压入栈顶,然后,考察栈内是否有与此页面相同的页号,若有则抽出。当需要淘汰一个页面时,总是选择栈底的页面,它就是最久未使用的
LRU算法的性能接近于OPT算法,但实现起来比较困难,且开销大; FIFO算法实现简单,但性能差。OS的设计者试图用比较小的开销接近LRU算法的性能,这类算法都是CLOCK算法的变体。因为算法要循环扫描缓冲区,像时钟的指针一样转动,所以称为CLOCK算法。
简单的CLOCK算法给每帧关联一个附加位,称为使用位。当某页首次装入主存时,将该帧的使用位设置为1;当该页随后再被访问到时,其使用位也被置为1。对于页替换算法,用于替换的候选帧集合可视为一个循环缓冲区,并有一个指针与之相关联。当某一页被替换时,该指针被设置成指向缓冲区中的下一帧。当需要替换一页时,OS扫描缓冲区,以查找使用位被置为0的一帧。每当遇到一个使用位为1的帧时,OS就将该位重新置为0;若在这个过程开始时,缓冲区中所有帧的使用位均为0,则选择遇到的第一个帧替换;若所有帧的使用位均为1,则指针在缓冲区中完整地循环一周,把所有使用位都置为0,并停留在最初的位置上,替换该帧中的页。 由于该算法循环检查各页面的情况,因此称CLOCK算法,又称最近未用(Not Recently Used,NRU)算法
CLOCK算法的性能比较接近LRU算法,而通过增加使用的位数目,可以使得CLOCK算法更加高效。在使用位的基础上再增加一个修改位,则得到改进型CLOCK替换算法。 这样,每帧都处于以下4中情况之一:
(1)最近未被访问,也未被修改(u=0,m=0)
(2)最近被访问,但未被修改(u=1,m=0)
(3)最近未被访问,但被修改(u=0,m=1)
(4)最近被访问,被修改(u=1,m=1)
算法执行如下操作步骤:
(1)从指针的当前位置开始,扫描帧缓冲区。在这次扫描过程中,对使用位不做任何修改。选择遇到的第一个最近未被访问,也未被修改的帧(u=0,m=0)用于替换。
(2)若第(1)步失败,则重新扫描,查找最近未被访问,但被修改的帧(u=0,m=1)。选择遇到的第一个这样的帧用于替换。在这个扫描过程中,对每个跳过的帧,把它的使用位设置成0。
(3)若第(2)步失败,则指针将回到它的最初位置,且集合中所有帧的使用位均为0。重复第(1)步,并且若有必要,重复第(2)步,以便可以找到供替换的帧。
改进型CLOCK算法优于简单CLOCK算法的地方在于替换时首选没有变化的页。由于修改过的页在被替换之前必须写回,因而这样做会节省时间。
OS中任何经过优化而有效的页面置换算法都有一个原则,即尽可能保留曾经使用过的页面,而淘汰未使用的页面,认为这样可以在总体上减少换页次数。CLOCK算法只考虑到是否被访问过,因此被访问过的当然尽可能留下,未使用过的就淘汰;而改进型CLOCK算法对使用过的页面又做了细分,分为使用过但未修改过和使用过且修改过。因此,若有未使用过的页面,则当然首先把它换出,若全部页面都使用过,则当然优先把未修改过的页面换出。
假设系统给某进程分配了5个页框,刚开始,进程依次访问1,3,4,2,5号页面,系统会将这些页面连成一个循环队列,刚开始扫描指针指向第一个被访问的页面(即1号页)
图中,小括号内的数字为使用位。接下来,若进程请求访问6号页面,则由于此时分配给进程的5个页框都被使用,因此必须选择一个页面置换出去。按照CLOCK置换算法的规则,在第一轮扫描中,指针扫过的页面的使用位应置为0,第一轮扫描过程如图:
第一轮扫描中,未找到使用位为0的页面,因此需要进行第二轮扫描。第二轮扫描中,1号页面的使用位为0,因此将1号页面换出,将6号页面换入,将6号页的访问位设置为1,并将扫描指针后移(若下次需要换出页面,则从3号页面开始扫描)
需注意:假设1号页面原先占有的是x号物理块(页框),则6号页面换入内存后也放在x号物理块中
LRU、FIFO和CLOCK算法的比较:
LRU算法和FIFO本质上都是先进先出的思路,只不过LRU是针对页面的最近访问的时间来进行排序,所以需要在每一次页面访问的时候动态地调整各个页面之间的先后顺序(有一个页面的最近访问时间变了);而FIFO是针对页面进入内存的时间来排序,这个时间是固定不变的,所以各页面之间的先后顺序是固定的。若一个页面在进入内存后没有被访问,那么它的最近访问时间就是它进入内存的时间。即若内存当中的所有页面都未曾访问过,那么LRU算法退化为FIFO算法
CLOCK算法是对LRU算法的近似,它用使用位模拟访问时间的先后顺序
对于分页式的虚拟内存,在进程准备执行时,不需要也不可能把一个进程的所有页都读入主存。因此,OS必须决定读取多少页,即决定给特定的进程分配几个页框。给一个进程分配的物理页框的集合就是这个进程的驻留集。 需要考虑以下几点:
(1)分配给一个进程的存储量越小,任何时候驻留在主存中的进程数就越多,从而可以提高处理机的时间利用效率。
(2)若一个进程在主存中的页数过少,则尽管有局部性原理,页错误率仍然会相对较高
(3)若页数过多,则由于局部性原理,给特定的进程分配更多的主存空间对该进程的错误率没有明显的影响
基于上述因素,现代OS通常采用3种策略:
(1)固定分配局部置换
它为每个进程分配一定数目的物理块,在整个运行期间都不改变。 若进程在运行中发生缺页,则只能从该进程在内存中的页面中选出一页换出,然后调入需要的页面。实现这种策略时,难以确定应为每个进程分配的物理块数目;太少会频繁出现缺页中断,太多又会使CPU和其他资源利用率下降。
(2)可变分配全局置换
这是最易于实现的物理块分配和置换策略,它为系统中的每个进程分配一定数目的物理块,OS自身也保持一个空闲物理队列。当某进程发生缺页时,系统从空闲物理块队列中取出一个物理块分配给该进程,并将欲调入的页装入其中。 这种方法比固定分配局部置换更加灵活,可以动态增加进程的物理块,但它会盲目地给进程增加物理块,从而导致系统多道程序的并发能力下降
(3)可变分配局部置换
它为每个进程分配一定数目的物理块,当某个进程发生缺页时,只允许从该进程在内存的页面中选出一页换出,因此不会影响其他进程的运行。若进程在运行中频繁地换页,则系统再为该进程分配若干物理块,直至该进程缺页率趋于适当程度;反之,若进程运行中的缺页率特别低,则可适当减少分配给该进程的物理块。 比起可变分配全局置换,这种方法不仅可以动态增加进程物理块的数量,还能动态减少进程物理块的数量,在保证进程不会过多地调页的同时,也保持了系统的多道程序并发能力。当然它需要更复杂的实现,也需要更大的开销,但对比频繁地换入/换出所浪费的计算机资源,这种牺牲是值得的
为确定系统将进程运行时所缺的页面调入内存的时机,可采取以下两种调页策略:
(1)预调页策略
根据局部性原理,一次调入若干相邻的页可能会比一次调入一页更高效。但若调入的一批页面中大多数都未被访问,则又是低效的。因此,需要采用以预测为基础的预调页策略,将预计在不久之后便会被访问的页面预先调入内存。但目前预调页的成功率仅约50%。因此这种策略主要用于进程的首次调入,由程序员指出应先调入哪些页。
(2)请求调页策略
进程在运行中需要访问的页面不在内存而提出请求,由系统将所需页面调入内存。由这种策略调入的页一定会被访问,且这种策略比较易于实现,因此在目前的虚拟存储器中大多采用此策略。它的缺点是每次只调入一页,调入/调出页面数多时会花费过多的I/O开销。
预调入实际上就是运行前的调入,请求调页实际上就是运行期间调入。 一般情况下,两种调页策略会同时使用。
请求分页系统中的外存分为两部分:用于存放文件的文件区和用于存放对换页面的对换区。 对换区通常采用连续分配方式,而文件区采用离散分配方式,因此对换区的磁盘I/O速度比文件区的更快。 这样,从何处调入页面就存在三种情况:
(1)系统拥有足够的对换区空间
可以全部从对换区调入所需页面,以提高调页速度。为此,在进程运行前,需将与该进程有关的文件从文件区复制到对换区。
(2)系统缺少足够的对换区空间
凡不会被修改的文件都直接从文件区调入;而当换出这些页面时,由于它们未被修改而不必再将它们换出。但对于那些可能被修改的部分,在将它们换出时须调到对换区,以后需要时再从对换区调入(因为读的速度比写的速度快)
(3)UNIX方式
与进程有关的文件都放在文件区,因此未运行过的页面都应从文件区调入。曾经运行过但又被换出的页面,由于放在对换区,因此下次调入时应从对换区调入。 进程请求的共享页面若被其他进程调入内存,则无须再从对换区调入。
在页面置换过程中,一种最糟糕的情形是,刚刚换出的页面马上又要换入主存,刚刚换入的页面马上又要换出主存,这种频繁的页面调度行为称为抖动或颠簸。 若一个进程在换页上用的时间多于执行时间,则这个进程就在颠簸。
频繁发生缺页中断(抖动)的主要原因是,某个进程频繁访问的页面数目高于可用的物理页帧数目。 虚拟内存技术可在内存中保留更多的进程以提高系统效率。在稳定状态,几乎主存的所有空间都被进程块占据,处理机和OS可以直接访问到尽可能多的进程。然而,如果管理不当,那么处理机的大部分时间都将用于交换块,即请求调入页面的操作,而不是执行进程的指令,因此会大大降低系统效率。
工作集是指在某段时间间隔内,进程要访问的页面集合。基于局部性原理,可以用最近访问过的页面来确定工作集。 一般来说,工作集W可由时间t和工作集窗口大小△来确定。 例如,某进程对页面的访问次序如下:
实际应用中,工作集窗口会设置得很大,即对于局部性好的程序,工作集大小一般会比工作集窗口△小很多。 工作集反映了进程在接下来的一段时间内很有可能会频繁访问的页面集合,因此,若分配给进程的物理块小于工作集大小,则该进程就很有可能频繁缺页,所以为了防止这种抖动现象,一般来说分配给进程的物理块数(即驻留集大小)要大于工作集大小。
工作集模型的原理是,让OS跟踪每个进程的工作集,并为进程分配大于其工作集的物理块。落在工作集内的页面需要调入驻留集中,而落在工作集外的页面可从驻留集中换出。若还有空闲物理块,则可以再调一个进程到内存以增加多道程序数。若所有进程的工作集之和超过了可用物理块的总数,则OS会暂停一个进程,将其页面调出并将其物理块分配给其他进程,防止出现抖动现象。
工作集大小的变化:进程开始执行后,随着访问新页面逐步建立较稳定的工作集。当内存访问的局部性区域的位置大致稳定时,工作集的大小也大致稳定;局部性区域的位置改变时,工作集快速扩张和收缩过渡到下一个稳定值
设某系统满足以下条件:
(1)有一个TLB与一个data Cache
(2)存储器以字节为编址单位
(3)虚拟地址14位
(4)物理地址12位
(5)页面大小为64B
(6)TLB为四路组相联,共有16个条目
(7)data Cache是物理寻址、直接映射的,行大小为4B,共有16组
写出访问地址为0x03d4,0x00f1和0x0229的过程
因为系统以字节编址,页面大小为64B,则页内偏移地址为6位,虚拟页号8位,物理页号6位。因为TLB为四路组相联,共有16个条目,则TLB共有16/4=4组,因此虚拟页号中低2位为组索引,高6位为TLB标记。又因为Cache行大小为4B,因此物理地址中低2位为块偏移,Cache共有16组,接下来4位为组索引,剩下高6位作为标记
TLB、页表、data Cache内容如表所示:
先把16进制的虚拟地址转化为2进制形式:
得到每个地址的组索引和TLB标记,接下来就要找出每个地址的页面在不在主存中,若在主存中,则还要找出物理地址
对于0x03d4,组索引为3,TLB标记为0x03,查TLB,第3组中正好有标记为03的项,有效位为1,可知页面在主存中,对应的物理地址为0d(001101),再拼接页内地址010100,可得物理地址为0x354(001101010100)。
对于0x00f1,组索引为3,TLB标记为0x00,查TLB,第3组中没有标记为00的项,再去找页表,虚拟页号为0x03,页表第3行的有效位为1,可知页面在主存中,物理地址为02(000010),再拼接页内地址110001,可得物理地址为0x0b1(000010110001)
对于0x0229,组索引为0,TLB标记为0x02,查TLB,第0组中没有标记为02的项,再去找页表,虚拟页号为0x08,页表第8行的有效位为0,页面不在主存中,产生缺页中断
找出在主存中的页面的物理地址后,就要通过物理地址访问数据,接下来要找该物理地址的内容在不在Cache中,物理地址结构如表所示:
对于0x354,Cache索引为5,Cache标记为0x0d,对照Cache中索引为5的行,标记正好为0d,有效位为1,可知该块在Cache中,偏移0,即块0,可得虚拟地址0x03d4的内容为36H
对于0x0b1,Cache索引为c,Cache标记为0x02,对照Cache中索引为c的行,有效位为0,可知该块不在Cache中,要去主存中查找物理页号为2、偏移为0x31的内容
注意在整个查找过程中,查找顺序是从TLB到页表(TLB不命中),再到Cache和主存,最后到外存。
例题:若用户进程访问内存时产生缺页,则下列选项中,OS可能执行的操作是()
1.处理越界错 2.置换页 3.分配内存
答案:2,3;用户进程访问内存时缺页,会发生缺页中断,发生缺页中断时,系统执行的操作可能是置换页面或分配内存。系统内没有越界错误,不会进行越界出错处理
例题:考虑页面置换算法,系统有m个物理块供调度,初始时全空,页面引用串长度为p,包含了n个不同的页号,无论用什么算法,缺页次数不会少于()
A.m B.p C.n D.min(m,n)
答案:C;每种页面第一次访问时不可能在内存中
例题:设主存容量为1MB,外存容量为400MB,计算机系统的地址寄存器有32位,那么虚拟存储器的最大容量是()
A.1MB B.401MB C.1MB+2^32MB D.2 ^ 32B
答案:D;在本题中,虽然从实际使用来说,虚拟存储器使得进程可使用内存扩大到内外存容量之和;但是进程的内存寻址还是由计算机的地址结构决定,这就决定了虚拟存储器理论上的最大容量
例题:导致LRU算法实现起来耗费高的原因是()
A.需要硬件的特殊支持 B.需要特殊的中断处理程序
C.需要在页表中标明特殊的页类型 D.需要对所有的页进行排序
答案:D;D是造成A的原因
例题:在页面置换算法中,()策略可能引起抖动
A.FIFO B.LRU C.没有一种 D.所有
答案:D;
例题:请求分页存储管理的主要特点是()
A.消除了页内零头 B.扩充了内存
C.便于动态链接 D.便于信息共享
答案:B;
例题:已知系统为32位实地址,采用48位虚拟地址,页面大小为4KB,页表项大小为8B。假设系统使用纯页式存储,则要采用()级页表,页内偏移()位
A.3,12 B.3,14 C.4,12 D.4,14
答案:C;
例题:覆盖技术与虚拟存储技术有何本质上的不同?交换技术与虚拟存储技术中使用的调入/调出技术有何相同与不同之处?
答案:(1)覆盖技术与虚拟存储技术最本质的不同在于,覆盖程序段的最大长度要受内存容量大小的限制,而虚拟存储器中程序的最大长度不受内存容量的限制,只受计算机地址结构的限制。另外,覆盖技术中的覆盖段由程序员设计,且要求覆盖段中的各个覆盖具有相对独立性,不存在直接联系或相互交叉访问;而虚拟存储技术对用户的程序段没有这种要求
(2)交换技术就是把暂时不用的某个程序及数据从内存移到外存中,以便腾出必要的内存空间,或把指定的程序或数据从外存读到内存中的一种内存扩充技术。交换技术与虚存中使用的调入/调出技术的主要相同点是,都要在内存与外存之间交换信息。交换技术与虚存中使用的调入/调出技术的主要区别是:交换技术调入/调出整个进程,因此一个进程的大小要受内存容量大小的限制;而虚存中使用的调入/调出技术在内存和外存之间来回传递的是页面或分段,而不是整个进程,从而使得进程的地址映射具有更大的灵活性,且允许进程的大小比可用的内存空间大。
例题:假定某操作系统存储器采用页式存储管理,一个进程在相联存储器中的页表项见表A,不在相联存储器的页表项见表B
假定该进程长度为320B,每页32B。现有逻辑地址(8进制)为101,204,576,若上述逻辑地址能转换成物理地址,说明转换的过程,并指出具体的物理地址;若不能转换,说明其原因
答案:101:(f3,1):204:页号为4,不在相联存储器中,查内存的页表得(f5,4),并用其更新相联存储器中的一项:576:超出页表范围,产生越界中断
例题:某分页式虚拟存储系统,用于页面交换的磁盘的平均访问及传输时间是20ms。页表保存在主存中,访问时间为1μs,即每引用一次指令或数据,需要访问内存两次。为改善性能,可以增设一个关联寄存器,若页表项在关联寄存器中,则只需访问一次内存。假设80%的访问的页表项在关联寄存器中,剩下的20%中,10%的访问(即总数的2%)会产生缺页。请计算有效访问时间
答案:0.8x1+0.2 x 0.9 x2 + 0.02 x (1x3 + 20x1000)=401.22μs
页表和主存均未命中,缺页中断后,将缺页调入主存,此时系统恢复缺页中断发生前的状态,将PC重新指向引起缺页中断的指令,重新执行该指令,这时页表项已在关联寄存器中,则根据取得的物理地址仅访存一次即可取得对应的页面,总用时3+20x1000
例题:在页式虚存管理系统中,假定驻留集为m个页帧(初始所有页帧均为空),在长为p的引用串中具有n个不同页号(n>m),对于FIFO、LRU两种页面置换算法,试给出页故障数的上限和下限,说明理由并举例说明
答案:n个不同的页号在首次进入主存时必须要发生一次页故障;当每访问一个页号时,该页都不在主存中,这样共发生p次故障;对于两种算法,页故障数上限均为p,下限均为n
例题:请求分页管理系统中,假设某进程的页表内容如下表所示。页面大小为4KB,一次内存的访问时间是100ns,一次快表TLB的访问时间是10ns,处理一次缺页的平均时间为10^8ns(已含更新TLB和页表的时间),进程的驻留集大小固定为2,采用最近最少使用LRU置换算法和局部淘汰策略。假设:(1)TLB初始为空;(2)地址转换时先访问TLB,若TLB未命中,再访问页表(忽略访问页表后的TLB更新时间);(3)有效位为0表示页面不在内存,产生缺页中断,缺页中断处理后,返回到产生缺页中断的指令处重新执行。设有虚地址访问序列2362H,1565H,25A5H
(1)依次访问上述三个虚拟地址,各需多少时间
(2)基于上述访问序列,虚地址1565H的物理地址是多少?
答案:(1)210ns,100000220ns,110ns (2)101565H
例题:在一个请求分页存储管理系统中,一个作业的页面走向为4,3,2,1,4,3,5,4,3,2,1,5,当分配给作业的物理块数分别为3和4时,试计算采用下述页面淘汰算法时的缺页率(假设开始执行时主存中没有页面),并比较结果
(1)最佳置换算法
(2)先进先出置换算法
(3)最近最久未使用算法
答案:(1)7/12,1/2;(2)3/4,5/6;(3)5/6,2/3;
OPT算法和LRU算法增加分配作业的内存块数可以降低缺页率,而FIFO算法则出现了Belady现象
例题:一个页式虚拟存储系统,其并发进程数固定为4个。最近测试了它的CPU利用率和用于页面交换的磁盘的利用率,得到的结果就是下列3组数据中的一组。针对每组数据,说明系统发生了什么事情。增加并发进程数能提升CPU的利用率吗?页式虚拟存储系统有用吗?
(1)CPU利用率为13%,磁盘利用率为97%
(2)CPU利用率为87%,磁盘利用率为3%
(3)CPU利用率为13%,磁盘利用率为3%
答案:(1)系统出现抖动现象。这时若再增加并发进程数,反而会恶化系统性能。页式虚拟存储系统因抖动现象而未能充分发挥作用
(2)系统正常,不需要采取什么措施
(3)CPU没有充分利用,应该增加并发进程数
例题:已知系统为32位实地址,采用48位虚拟地址,页面大小为4KB,页表项大小为8B,每段最大为4GB。
(1)假设系统使用纯页式存储,则要采用多少级页表?页内偏移多少位
(2)假设系统采用一级页表,TLB命中率为98%,TLB访问时间为10ns,内存访问时间为100ns,并假设当TLB访问失败时才开始访问内存,问平均页面访问时间是多少
(3)若是二级页表,页面平均访问时间是多少
(4)上题中,若要满足访问时间小于120ns,则命中率至少需要为多少
(5)若系统采用段页式存储,则每用户最多可以有多少个段?段内采用几级页表
答案:(1)4级页表,12位;(2)112ns;(3)114ns;
(4)95%;(5)段内地址32位,段号为16位,最多可有2^16段。3级页表
例题:
答案:(1)FIFO:第3号页帧;(2)LRU:第1号页帧
(3)题中指的是标准的CLOCK算法(NRU算法),而非改进的CLOCK算法;NRU:第0号页帧;NRU按照装入的顺序建立循环队列如下(数字为页帧号):
在经过一段时间的运行后,我们暂时不知道时钟所指的位置;寻找题目中的条件,当进程访问第4页时,产生缺页中断,时针开始移动,我们发现0、1号页帧的访问位都被置为0,说明时针是从0号页帧的位置开始移动的,最后回到0号页帧,将其置出
例题:在页式虚拟管理的页面替换算法中,对于任何给定的驻留集大小,在什么样的访问串情况下,FIFO与LRU替换算法一样(即被替换的页面和缺页情况完全一样)
答案:FIFO替换最早进入主存的页面,LRU替换上次访问以来最久未被访问的页面,两个页面一致,即最先进入主存的页面在此次缺页之前不能再被访问,这样该页面就同时是最久未被访问的页面。
例如,合法驻留集大小为4时,对访问串1,2,3,4,1,2,5,当5号页面调入主存时,应在1,2,3,4页中选择一个替换,FIFO选择1,LRU选择3。原因在于1号页面虽然最先进入主存,但由于其进入主存后又被再次访问,所以它不是最久未被访问的页面。若去掉对1号页面的第二次访问,则FIFO与LRU的替换选择就相同。同理,当5号页面调入主存后,若再访问新的6号页面,则2号页面会遇到同样的问题。因此,以此类推,访问串中的所有页面号都应不同,但要注意到,连续访问相同页面时不影响后面的替换选择,所以对访问串的要求是:不连续的页面号均不相同。
例题:某请求分页系统的页面置换策略如下:从0时刻开始扫描,每隔5个时间单位扫描一轮驻留集(扫描时间忽略不计)且本轮未被访问过的页框将被系统回收,并放入空闲页框链尾,其中内容在下一次分配之前不清空。当发生缺页时,若该页曾被使用过且还在空闲页链表中,则重新放回进程的驻留集中;否则,从空闲页框链表头部取出一个页框。
忽略其他进程的影响和系统开销。初始时进程驻留集为空。目前系统空闲页的页框号依次为32,15,21,41。进程P依次访问的<虚拟页号,访问时刻>为<1,1>,< 3 ,2>,<0,4>,<0,6>,<1,11>,<0,13>,<2,14>。
(1)当虚拟页为<0,4>时,对应的页框号是什么
(2)当虚拟页为<1,11>时,对应的页框号是什么
(3)当虚拟页为<2,14>时,对应的页框号是什么
(4)这种方法是否适合于时间局部性好的程序
答案:(1)21;(2)32;(3)41;(4)合适,程序的时间局部性越好,从空闲页框链表中重新取回的机会越大,该策略的优势越明显
例题:
答案:50,5000,100,10000;缺页的次数与内存中数据存放的方式及程序执行的顺序有很大关系;同时说明,当缺页中断次数不多时,减少页面大小影响并不大,但缺页中断次数很多时,减小页面大小会带来很严重的影响
答案:(1)1页;(2)第1个表项(最开始的为第0个表项)
(3)在执行scanf()的过程中,进程P等待输入而从执行态——>阻塞态。输入结束时,P被中断处理程序唤醒,变为就绪态。P被调度程序调度,变为运行态。 CPU状态会从用户态变为内核态
例题:Gribble公司正在开发一款64位的计算机体系结构,也就是说,在访问内存时,最多可以使用64位的地址。假设采用的是虚拟页式存储管理,现在要为这款机器设计相应的地址映射机制
(1)假设页面的大小是4KB,每个页表项的长度是4B,而且必须采用三级页表结构,每级页表结构中的每个页表都必须正好存放在一个物理页面中,请问在这种情形下,如何实现地址的映射?具体来说,对于给定的一个虚拟地址,应该把它划分为几部分,每部分的长度分别是多少,功能是什么?另外,采用这种地址映射机制后,可以访问的虚拟地址空间有多大?(64位地址并不一定全部用上)
(2)假设每个页表项的长度变成了8B,而且必须采用四级页表结构,每级页表结构中的页表都必须正好存放在一个物理页面中,请问在这种情形下,系统能够支持的最大的页面大小是多少?此时,虚拟地址应该如何划分
答案:(1)逻辑地址被划分为5个部分:
(2)页内偏移地址15位,每级页表索引位为12位,最大页面大小32KB
例题:
答案:(1)4KB,2^20页;(2)页目录占一页,总共有2 ^10个页表,每个页表占1页, 总共1025页;(3)访问一个二级页表
答案:(1)01806008H;(2)PDBR为页目录基址地址寄存器(Page-Directory Base Register),其存储页目录表物理内存基地址。进程切换时,PDBR的内容会变化;同一进程的线程切换时,PDBR的内容不会变化。每个进程的地址空间、页目录和PDBR的内容存在一 一对应的关系。进程切换时,地址空间发生了变化,对应的页目录及其起始地址也相应变化,因此需要用进程切换后当前进程的页目录起始地址刷新PDBR。同一进程中的线程共享该进程的地址空间,其线程发生切换时,地址空间不变,线程使用的页目录不变,因此PDBR的内容也不变
(3)使用位、修改位(脏位)