可见,我们写的代码要翻译成CPU能识别的指令。这些指令会告诉CPU应该去内存的哪个地址存/取数据,这个数据应该做什么样的处理。在这个例子中,指令中直接给出了变量x的实际存放地址(物理地址)。但实际在生成机器指令的时候并不知道该进程的数据会被放到什么位置。所以编译生成的指令中一般是使用逻辑地址(相对地址)。
Eg:编译时只需确定变量x存放的相对地址是100 ( 也就是说相对于进程在内存中的起始地址而言的地址)。CPU想要找到x在内存中的实际存放位置,只需要用进程的起始地址+100即可。
相对地址又称逻辑地址,绝对地址又称物理地址。
编译:由编译程序将用户源代码编译成若千个目标模块(编译就是把高级语言翻译为机器语言)
链接:由链接程序将编译后形成的一组目标模块,以及所需库函数链接在一起,形成- -个完整的装入模块装入(装载) :由装入程序将装入模块装入内存运行
操作系统作为系统资源的管理者,当然也需要对内存进行管理,要管些什么呢?
- 操作系统负责内存空间的分配与回收。
- 操作系统需要提供某种技术从逻辑.上对内存空间进行扩充。
- 操作系统需要提供地址转换功能,负责程序的逻辑地址与物理地址的转换。
- 操作系统需要提供内存保护功能。保证各进程在各自存储空间内运行,互不干扰
内存空间的分配与回收:由操作系统完成主存储器空间的分配和管理,使程序员摆脱存储分配麻烦,提高编程效率。
内存空间的扩充:利用虚拟存储技术或者自动覆盖技术,从逻辑上扩充内存。
游戏GTA的大小超过60GB,按理来说这个游戏程序运行之前需要把60GB数据全部放入内存。然而,实际我的电脑内存才4GB, 但为什么这个游戏可以顺利运行呢?
–虚拟技术(操作系统的虚拟性)
地址转换:在多道程序环境下,程序中的逻辑地址与内存中的物理地址不可能一致,因此存储管理器必须提供地址变换功能,把逻辑地址转换成相应的物理地址。
为了使编程更方便,程序员写程序时应该只需要关注指令、数据的逻辑地址。而逻辑地址到物理地址的转换(这个过程称为地址重定位(三种装入方式))应该由操作系统负责,这样就保证了程序员写程序时不需要关注物理内存的实际情况。
存储保护:保证各道作业在各自的存储空间内运行,互不干扰。
两种方式:
1.CPU中设置一对上,下限寄存器,存放用户作业在主存中的下限和上限,每当CPU要访问一个地址时,分别和两个寄存器的值相比,判断有无越界。
2.通过采用重定位寄存器(或基址寄存器)和界地址寄存器(又称限长寄存器)来实现这种保护,重定位寄存器含最小的物理地址值,界地址寄存器含逻辑地址的最大值,每个逻辑地址值必须小于界地址寄存器,内存管理机构动态的将逻辑地址与界地址寄存器进行比较,如果未发生地址越界。则加上重定位寄存器的值后映射成物理地址,再送交内存单元。
由于程序运行时并非任何时候都要访问程序及数据的各个部分(尤其是大程序),因此可以把用户空间分成为一个固定区和若干个覆盖区。将经常活跃的部分放在固定区,其余部分按照调用关系分段,首先将那些即将要访问的段放入覆盖区,其他段放在外存中,在需要调用前,系统将其调如覆盖区,替换覆盖区中原有的段。
覆盖技术的特点:是打破了必须将一个进程的全部信息装入内存后才能运行的限制,但当同时运行程序的代码量大于主存时仍不能运行,再而,大家要注意到,内存中能够更新的地方只有覆盖区的段,不在覆盖区的段会常驻内存。
早期的计算机内存很小,比如IBM推出的第一台PC机最大只支持1MB大小的内存。因此经常会出现内存大小不够的情况。后来人们引入了覆盖技术,用来解决“程序大小超过物理内存总和”的问题
覆盖技术的思想:将程序分为多个段(多个模块)。常用的段常驻内存,不常用的段在需要时调入内存。
内存中分为一个“固定区”和若干个“覆盖区”。
需要常驻内存的段放在“固定区”中,调入后就不再调出(除非运行结束)
不常用的段放在“覆盖区”,需要用到时调入内存,用不到时调出内存
必须由程序员声明覆盖结构,操作系统完成自动覆盖。缺点:对用户不透明,增加了用户编程负担。覆盖技术只用于早期的操作系统中,现在已成为历史。
交换(对换)技术的设计思想:内存空间紧张时,系统将内存中某些进程暂时换出外存,把外存中某些已具备运行条件的进程换入内存(进程在内存与磁盘间动态调度)
换入:把准备好竞争CPU运行的程序从辅存移到内存。
换出:把处于等待状态(或CPU调度原则下被剥夺运行权力)的程序从内存移到辅存,把内存空间腾出来。
暂时换出外存等待的进程状态为挂起状态(挂起态,suspend),挂起态又可以进–步细分为就绪挂起、阻塞挂起两种状态。
应该在外存(磁盘)的什么位置保存被换出的进程?
答:具有对换功能的操作系统中,通常把磁盘空间分为文件区和对换区两部分。文件区主要用于存放文件,主要追求存储空间的利用率,因此对文件区空间的管理采用离散分配方式;对换区空间只占磁盘空间的小部分,被换出的进程数据就存放在对换区。由于对换的速度直接影响到系统的整体速度,因此对换区空间的管理主要追求换入换出速度,因此通常对换区采用连续分配方式(学过文件管理章节后即可理解)。总之,对换区的I/O速度比文件区的更快。
什么时候应该交换?
答:交换通常在许多进程运行且内存吃紧时进行,而系统负荷降低就暂停。例如:在发现许多进程运行时经常发生缺页,就说明内存紧张,此时可以换出一些进程;如果缺页率明显下降,就可以暂停换出。
应该换出哪些进程?
答:可优先换出阻塞进程;可换出优先级低的进程;为了防止优先级低的进程在被调入内存后很快又被换出,有的系统还会考虑进程在内存的驻留时间…
(注意: PCB 会常驻内存,不会被换出外存)
注意:
- 交换需要备份存储,通常是快速磁盘,它必须足够大,并且提供对这些内存映像的直接访问。
- 为了有效使用CPU,需要每个进程的执行时间比交换时间长,而影响交换时间的主要是转移时间,转移时间与所交换的空间内存成正比。
- 如果换出进程,比如确保该进程的内存空间成正比。
- 交换空间通常作为磁盘的一整块,且独立于文件系统,因此使用就可能很快。
- 交换通常在有许多进程运行且内存空间吃紧时开始启动,而系统负荷降低就暂停。
- 普通交换使用不多,但交换的策略的某些变种在许多系统中(如UNIX系统)仍然发挥作用。
交换技术主要是在不同进程(或作业)之间进行,而覆盖则用于同一程序或进程中。
内存在此方式下分为系统区和用户区。
系统区仅提供给操作系统使用,通常在低地址部分;
用户区是为用户提供的,除系统区之外的内存空间,我们平常运行的软件都在用户区里分配空间。
优点:无外部碎片,可以采用覆盖技术,不需要额外技术支持。
缺点:只能用于单用户,单任务操作系统中,有内部碎片,存储器利用率极低。
固定分区分配是最简单的一种多道程序存储管理方式,它将用户内存空间划分为若干个固定大小的区域,每个分区只装入一道作业。当有空闲分区时,便可以再从外存的后背作业队列中,选择适当大小的作业装入该分区,如此循环。
- 分区大小相等:用于利用一台计算机控制多个相同对象的场合,缺乏灵活性
- 分区大小不等:划分为含有多个较小的分区,适量的中等分区及少量的大分区。
优点:1.没有外部碎片
缺点:1.程序可能太大而放不进任何一个分区中,这时用户不得不使用覆盖技术来使用内存空间。- 主存利用率低,当程序小于固定分区大小时,也占用一个完整的内存分区空间,这样分区内部有空间浪费,这种现象称为内部碎片。
- 不能多个进程共享一个主存区
动态分区分配又称为可变分区分配,是一种动态划分内存的分区方法。这种分配方式不会预先划分内存分区,而是在进程装入内存时, 根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。(eg: 假设某计算机内存大小为64MB, 系统区8MB,用户区共56 M…)
!
缺点:外部随便很多(通过紧凑消除,就是操作系统不时地对进程进行移动和整理。但是这需要动态重定位寄存器地支持,且相对费时。紧凑地过程实际上类似于Windows系统中地磁盘整理程序,只不过后者是对外存空间地紧凑)
1.系统要用什么样的数据结构记录内存的使用情况?
2.当很多个空闲分区都能满足需求时,应该选择哪个分区进行分配?
3.如何进行分区的分配与回收操作? 假设系统采用的数据结构是“空闲分区表”如何分配?
动态分区分配又称为可变分区分配。这种分配方式不会预先划分内存分区,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。
1.首次适应算法
2.最佳适应算法
3.最坏适应算法
4.邻近适应
算法思想:每次都从低地址开始查找,找到第–个能满足大小的空闲分区。
如何实现:空闲分区以地址递增的次序排列。每次分配内存时顺序查找空闲分区链( 或空闲分[表),找到大小能满足要求的第-一个空闲分区。
算法思想:由于动态分区分配是一种连续分配方式,为各进程分配的空间必须是连续的一整片区域。因此为了保证当“大进程”到来时能有连续的大片空间,可以尽可能多地留下大片的空闲区,即,优先使用更小的空闲区。
如何实现:空闲分区按容量递增次序链接。每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第-一个空闲分区。
又称最大适应算法(Largest Fit)
算法思想:为了解决最佳适应算法的问题—即留下太多难以利用的小碎片,可以在每次分配时优先使用最大的连续空闲区,这样分配后剩余的空闲区就不会太小,更方便使用。
如何实现:空闲分区按容量递减次序链接。每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第-一个空闲分区。
算法思想:首次适应算法每次都从链头开始查找的。这可能会导致低地址部分出现很多小的空闲分区,而每次分配查找时,都要经过这些分区,因此也增加了查找的开销。如果每次都从上次查找结束的位置开始检索,就能解决上述问题。
如何实现:空闲分区以地址递增的顺序排列(可排成-一个循环链表)。每次分配内存时从上次查找结束的位置开始查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
首次适应不仅最简单,通常也是最好最快,不过首次适应算法会使得内存低地址部分出现很多小的空闲分区,而每次查找都要经过这些分区,因此也增加了查找的开销。邻近算法试图解决这个问题,但实际上,它常常会导致在内存的末尾分配空间分裂成小的碎片,它通常比首次适应算法结果要差。
最佳导致大量碎片,最坏导致没有大的空间。
进过实验,首次适应比最佳适应要好,他们都比最坏好。
算法 | 算法思想 | 分区排列顺序 | 优点 | 缺点 |
---|---|---|---|---|
首次适应 | 从头到尾找适合的分区 | 空闲分区以地址递增次序排列 | 综合看性能最好。算法开销小,回收分区后一.般不需要对空闲分区队列重新排序 | |
最佳适应 | 优先使用更小的分区,以保留更多大分区 | 空闲分区以容量递增次序排列 | 会有更多的大分区被保留下来,更能满足大进程需求 | 会产生很多太小的、难以利用的碎片;算法开销大,回收分区后可能需要对空闲分区队列重新排序 |
最坏适应 | 优先使用更大的分区,以防止产生太小的不可用的碎片 | 空闲分区以容量递减次序排列 | 可以减少难以利用的小碎片 | 大分区容易被用完,不利于大进程;算法开销大(原因同上) |
邻近适应 | 由首次适应演变而来,每次从上次查找结束位置开始查找 | 空闲分区以地址递增次序排列(可排列成循环链表) | 不用每次都从低地址的小分区开始检索。算法开销小(原因同首次适应算法) | 会使高地址的大分区也被用完 |
在前面的几种存储管理方法中,为进程分配的空间是连续的,使用的地址都是物理地址。如果允许将一个进程分散到许多不连续的空间,就可以避免内存紧缩,减少碎片。基于这一思想,通过引入进程的逻辑地址,把进程地址空间与实际存储空间分离,增加存储管理的灵活性。
非连续分配管理:
需要额外地空间存储(分散区域)地索引,使得非连续分配地方式存储密度低于连续存储方式。
根据分区大小是否固定分为分页存储管理方式和分段存储管理方式。
根据分配时所采用的基本单位不同,可将离散分配的管理方式分为以下三种:
页式存储管理、段式存储管理、段页式存储管理。其中段页式存储管理是前两种结合的产物。
根据分区大小是否固定分为分页存储管理方式和分段存储管理方式。
1.1 基本分页存储管理
1.2请求分页存储管理
分页的方法形式上看,像分区相等的固定分区技术,分页管理不会产生外部碎片,但它又又本质不同点:块的大小相对分区要小很多,而且进程页按照块进行划分,进程运行时按块申请主存可用空间执行。每个进程平均只产生半个块大小的内部碎片(也称页内碎片)
进程中的块称为页,内存中的块称为页框(页帧),外存页以同样的单位进行划分,直接称为块。
页面过小页表占用空间大,页面过大,碎片大。
页式管理只需要给出一个整数就能确定对应的物理地址,这是因为页面大小L是固定的,因此,页式管理中地址空间是一维空间。
如何计算:
页号=逻辑地址/页面长度(取除法的整数部分)
页内偏移量=逻辑地址%页面长度(取除法的余数部分)(为了方便计算页号、页内偏移量 重页面大小一般要为2的整数幂)
假设用32个二进制位表示逻辑地址,页面大小为2^12 B = 4096B = 4KB
0号页的逻辑地址空间应该是0~4095,用二进制表示应该是:
0000 0000 0000 0000 0000 0000 0000 0000 ~ 0000 0000 0000 0000 0000 1111 1111 11111号页的逻辑地址空间应该是4096~8191, 用二进制表示应该是:
0000 0000 0000 0000 0001 0000 0000 0000 ~ 0000 0000 0000 0000 0001 1111 1111 11112号页的逻辑地址空间应该是8192~12287, 用二进制表示应该是:
0000 0000 0000 0000 0100 0000 0000 0000 ~ 0000 0000 0000 0000 0101 1111 1111 1111Eg:逻辑地址2,用二进制表示应该是0000 0000 0000 0000 0000 0000 0000 0010
若0号页在内存中的起始地址为X,则逻辑地址2对应的物理地址应该是X+0000 0000 0100
与另一种算法的结果对比:页号=逻辑地址/页面长度,页内偏移量=逻辑地址%页面长度Eg:逻辑地址4097,用-二进制表示应该是 0000 0000 0000 0000 0001 0000 0000 0001
若1号页在内存中的起始地址为X,则逻辑地址4097 对应的物理地址应该是X+0000 0000 0001
假设用32个二进制位表示逻辑地址,页面大小为2^10 B = 1024B = 1KB
0号页的逻辑地址空间应该是0~1023,用二进制表示应该是:
0000 0000 0000 0000 0000 0000 0000 0000 ~ 0000 0000 0000 0000 0000 0011 1111 11111号页的逻辑地址空间应该是1024~2047, 用二进制表示应该是:
0000 0000 0000 0000 0000 0100 0000 0000 ~ 0000 0000 0000 0000 0000 0111 1111 11112号页的逻辑地址空间应该是2048~3021, 用二进制表示应该是:
0000 0000 0000 0000 0000 1000 0000 0000 ~ 0000 0000 0000 0000 0000 1011 1100 1101
结论:如果每个页面大小为2^K B,用二进制数表示逻辑地址,则末尾K位即为页内偏移量,其余部分就是页号
因此,如果让每个页面的大小为2的整数幂,计算机就可以很方便地得出一个逻辑地址对应的页号和页内偏移量。
为了能知道进程的每个页面在内存中存放的位置,操作系统要为每个进程建立–张页表。
为什么每个页表项的长度是相同的,页号是“隐含”的?
Eg:假设某系统物理内存大小为4GB,页面大小为4KB,则每个页表项至少应该为多少字节?
4GB= 2^32 B,4KB= 2^12 B
因此4GB的内存总共会被分为2^32/ 2^12= 220个内存块,因此内存块号的范围应该是0~220 -1,因此至少要20个二进制位才能表示这么多的内存块号,因此至少要3个字节才够
(每个字节8个二进制位,3个字节共24个二进制位)
基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。
通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的始址和页表长度放在进程控制块(PCB) 中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。
注意:页面大小是2的整数幂
设页面大小为L,逻辑地址A到物理地址E的变换过程如下:
例:若页面大小L为1K字节,页号2对应的内存块号b=8,将逻辑地址A=2500转换为物理地址E。
等价描述:某系统按字节寻址,逻辑地址结构中,页内偏移量占10位(说明一个页面的大小为2^10B = 1KB),页号2对应的内存块号 b=8,将逻辑地址A=2500转换为物理地址E。
①计算页号、页内偏移量
页号P=A/L = 2500/1024 = 2; 页内偏移量W= A%L = 2500%1024 = 452②根据题中条件可知,页号2没有越界,其存放的内存块号b=8
③物理地址E=b*L+W=8 * 1024+ 425 = 8644
在分页存储管理(页式管理)的系统中,只要确定了每个页面的大小,逻辑地址结构就确定了。因此,页式管理中地址是-维的。即,只要给出一个逻辑地址,系统就可以自动地算出页号、页内偏移量两个部分,并不需要显式地告诉系统这个逻辑地址中,页内偏移量占多少位。
快表,又称联想寄存器(TLB) ,是一种访问速度比内存快很多的高速缓冲存储器,用来存放当前访问的若干页表项,以加速地址变换的过程。与此对应,内存中的页表常称为慢表。
①CPU给出逻辑地址,由某个硬件算得页号、页内偏移量,将页号与快表中的所有页号进行比较。②如果找到匹配的页号,说明要访问的页表项在快表中有副本,则直接从中取出该页对应的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表命中,则访问某个逻辑地址仅需一次访存即可。
③如果没有找到匹配的页号,则需要访问内存中的页表,找到对应页表项,得到页面存放的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表未命中,则访问某个逻辑地址需要两次访存(注意:在找到页表项后,应同时将其存入快表,以便后面可能的再次访问。但若快表已满,则必须按照-定的算法对旧的页表项进行替换)
由于查询快表的速度比查询页表的速度快很多,因此只要快表命中,就可以节省很多时间。
因为局部性原理,–般来说快表的命中率可以达到90%以上。
例:某系统使用基本分页存储管理,并采用了具有快表的地址变换机构。访问- -次快表耗时1us, 访问一次内存耗时100us。若快表的命中率为90%,那么访问一个逻辑地址的平均耗时是多少?
(1+100) * 0.9 + (1+100+100) * 0.1 = 111 us
有的系统支持快表和慢表同时查找,如果是这样,平均耗时应该是(1+100) * 0.9+ (100+100) *0.1=110.9 us
若未采用快表机制,则访问一个逻辑地址需要100+100 = 200us
显然,引入快表机制后,访问一个逻辑地址的速度快多了。
地址变换过程 | 访问一个逻辑地址的访存次数 | |
---|---|---|
基本地址变换机构 | ①算页号、页内偏移量 ②检查页号合法性 ③查页表,找到页面存放的内存块号 ④根据内存块号与页内偏移量得到物理地址 ⑤访问目标内存单元 |
两次访存 |
具有快表的地址变换机构 | ①算页号、页内偏移量 ②检查页号合法性 ③查快表。若命中,即可知道页面存放的内存块号,可直接进行⑤;若未命中则进行④ ④查页表,找到页面存放的内存块号,并且将页表项复制到快表中 ⑤根据内存块号与页内偏移量得到物理地址 ⑥访问目标内存单元 |
快表命中,只需一次访存 快表未命中,需要两次访存 |
根据局部性原理可知,很多时候,进程在一段时间内只需要访问某几个页面就可以正常运行了,因此没有必要让整个页表都常驻内存。
进程的地址空间:按照程序自身的逻辑关系划分为若千个段,每个段都有一个段名(在低级语言中,程序员使用段名来编程),每段从0开始编址
内存分配规则:以段为单位进行分配,每个段在内存中占据连续空间,但各段之间可以不相邻。
问题:程序分多个段,各段离散地装入内存,为了保证程序能正常运行,就必须能从物理内存中找到各个逻辑段的存放位置。为此,需为每个进程建立- -张段映射表,简称“段表”
将进程按逻辑模块分段,再将各段分页(如每个页面4KB )再将内存空间分为大小相同的内存块/页框/页帧/物理块进程前将各页面分别装入各内存块中
一次性(可用虛拟存储技术解决问题):作业必须一次性全部装入内存后才能开始运行。这会造成两个问题:①作业很大时,不能全部装入内存,导致大作业无法运行;②当大量作业要求运行时,由于内存无法容纳所有作业,因此只有少量作业能运行,导致多道程序并发度下降。
驻留性:一旦作业被装入内存,就会- 直驻留在内存中,直至作业运行结束。事实上,在一个时间段内,只需要访问作业的一-小部分数据即可正常运行,这就导致了内存中会驻留大量的、暂时用不到的数据,浪费了宝贵的内存资源。
时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据很可能再次被访问。(因为程序中存在大量的循环)
空间局部性:一旦程序访问了某个存储单元,在不久之后,其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的,并且程序的指令也是顺序地在内存中存放的)
基于局部性原理,在程序装入时,可以将程序中很快会用到的部分装入内存,暂时用不到的部分留在外存,就可以让程序开始执行。
在程序执行过程中,当所访问的信息不在内存时, 由操作系统负责将所需信息从外存调入内存,然后继续执行程序。
若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存。
在操作系统的管理下,在用户看来似乎有-一个比实际内存大得多的内存,这就是虚拟内存(操作系统虚拟性的一个体现,实际的物理内存大小没有变,只是在逻辑.上进行了扩充)
易混知识点:
虚拟内存的最大容量是由计算机的地址结构(CPU寻址范围)确定的
虚拟内存的实际容量= min (内存和外存容量之和,CPU寻址范围)
如:某计算机地址结构为32位,按字节编址,内存大小为512MB,外存大小为2GB。
则虚拟内存的最大容量为2^32 B = 4GB
虚拟内存的实际容量= min (2^32 B, 512MB+2GB) = 2GB+512MB
虚拟内存有以下三个主要特征
多次性:无需在作业运行时一次性全部装入内存,二十运行被分成多次调入内存
对换性:在作业运行时无需一直常驻内存,而是允许在作业运行过程中,讲作业换出、换入。
虚拟性:从逻辑上扩充了内存的容量,使用户看到的内存容量,远大于实际的容量
虚拟内存中,允许将一个作业分多次调入内存,采用连续分配方式时,会使相当一部分内存空间都处于暂时或“永久”的空闲状态,造成内存资源的严重浪费,而且也无法从逻辑上扩大内存容量,因此,虚拟内存的实现需要建立在离散分配的内存管理方式基础上。
传统的非连续分配存储管理:
- 基本分页存储管理
- 基本分段存储管理
- 基本段页式存储管理
虚拟内存的实现有以下三种方式:
1.请求分页存储管理
2.请求分段存储管理
3.请求段页式存储管理
请求分页系统建立在基本分页系统的基础上,为了支持虚拟存储器功能而增加了请求调页功能和页面置换功能。请求分页是目前最常用的一种虚拟存储器方法。
主要区别:
在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存(操作系统要提供请求调页(或请求调段)功能),然后继续执行程序。
若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存(操作系统要提供页面置换(或段置换)的功能)。
与基本分页管理相比,请求分页管理中,为了实现“请求调页”,操作系统需要知道每个页面是否已经调入内存;如果还没调入,那么也需要知道该页面在外存中存放的位置。
当内存空间不够时,要实现“页面置换” 操作系统需要通过某些指标来决定到底换出哪个页面;有的页面没有被修改过,就不用再浪费时间写回外存。有的页面修改过,就需要将外存中的旧数据覆盖,因此,操作系统也需要记录各个页面是否被修改的信息。
在基本分页系统基础上增加了四个字段:页号 | 物理块号 | 状态位P | 访问字段A | 修改位M | 外存地址
(1) 状态位P:用于指示该页是否已调入内存,供程序訪问时參考。
(2) 访问字段A:用于记录本页在一段时间内被訪问的次数,或记录本页近期已有多长时间未被訪问,供选择换出页面时參考。
(3) 改动位M:表示该页在调入内存后是否被改动过。因为内存中的每一页都在外存上保留一份副本,因此,若未被改动,在置换该页时就不需再将该页写回到外存上,以降低系统的开销和启动磁盘的次数;若已被改动,则必须将该页重写到外存上,以保证外存中所保留的始终是最新副本 。简言之,M位供置换页面时參考。
(4) 外存地址:用于指出该页在外存上的地址,一般是物理块号,供调入该页时參考。
缺页中断是因为当前执行的指令想要访问的目标页面未调入内存而产生的,因此缺页中断作为中断同样要经历,诸如保护CPU环境、分析中断原因、转入缺页中断处理程序、恢复CPU环境等几个步骤。但与一般的中断相比,它有以下两个明显的区别:
- 在指令执行期间产生和处理中断信号,而非一条指令执行完后,属于内中断。
一条指令在执行期间,可能产生多次缺页中断。(如:copyAtoB,即将逻辑地址A中的数据复制到逻辑地址B,而A、B属于不同的页面,则有可能产生两次中断)
请求分页存储管理与基本分页存储管理的主要区别:
在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存(操作系统要提供请求调页功能,将缺失页面从外存调入内存),然后继续执行程序。
若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存(操作系统要提供页面置换的功能,将暂时用不到的页面换出外存)。
相对于分页系统主要增加了关于状态位P的操作。
最佳置换算法(OPT,Optimal) :每次选择淘汰的页面将是以后永不使用,或者在最长时间内不再被访问的页面,这样可以保证最低的缺页率。
最佳置换算法可以保证最低的缺页率,但实际上,只有在进程执行的过程中才能知道接下来会访问到的是哪个页面。操作系统无法提前预判页面访问序列。因此,最佳置换算法是无法实现的
先进先出置换算法(FIFO) :每次选择淘汰的页面是最早进入内存的页面
实现方法:把调入内存的页面根据调入的先后顺序排成一个队列,需要换出页面时选择队头页面队列的最大长度取决于系统为进程分配了多少个内存块。
Belady异常—当为进程分配的物理块数增大时,缺页次数不减反增的异常现象。
只有FIFO算法会产生Belady异常,而LRU和OPT算法永远不会出现Belady异常。另外,FIFO算法虽然实现简单,但是该算法与进程实际运行时的规律不适应,因为先进入的页面也有可能最经常被访问。因此,算法性能差
FIFO的性能较差,因为较早调入的页往往是经常被访问的页,这些页在FIFO算法下被反复调入和调出,并且有Belady现象。所谓Belady现象是指:采用FIFO算法时,如果对—个进程未分配它所要求的全部页面,有时就会出现分配的页面数增多但缺页率反而提高的异常现象。
最近最久未使用置换算法(LRU,least recently used) :每次淘汰的页面是最近最久未使用的页面
实现方法:赋予每个页面对应的页表项中,用访问字段记录该页面自.上次被访问以来所经历的时间t(该算法的实现需要专门的硬件支持,虽然算法性能好,但是实现困难,开销大)。当需要淘汰一个页面时,选择现有页面中t值最大的,即最近最久未使用的页面。
LRU性能较好,但需要寄存器和栈的硬件支持。LRU是堆栈类算法,理论上可以证明,堆栈类算法不可能出现Belady异常。
在手动做题时,若需要淘汰页面,可以逆向检查此时在内存中的几个页面号。在逆向扫描过程中最后一个出现的页号就是要淘汰的页面。
最佳置换算法性OPT能最好,但无法实现;先进先出置换算法实现简单,但算法性能差;最近最久未使用置换算法性能好,是最接近OPT算法性能的,但是实现起来需要专门的硬件支持,算法开销大。
所以操作系统的设计者尝试了很多算法,试图用比较小的开销接近LRU的性能,这类算法都是CLOCK算法的变体,因为算法要循环扫描缓冲区像时钟一样转动。所以叫clock算法。
时钟置换算法是一种性能和开销较均衡的算法,又称CLOCK算法,或最近未用算法(NRU,Not Recently Used)
简单的CLOCK算法实现方法:为每个页面设置一个访问位,再将内存中的页面都通过链接指针链接成一个循环队列。当某页被访问时,其访问位置为1。当需要淘汰-一个页面时,只需检查页的访问位。如果是0,就选择该页换出;如果是1,则将它置为0,暂不换出,继续检查下一个页面,若第- - ~轮扫描中所有页面都是1,则将这些页面的访问位依次置为0后,再进行第二轮扫描(第二轮扫描中一定会有访问位为0的页面,因此简单的CLOCK算法选择–个淘汰页面最多会经过两轮扫描)
简单的时钟置换算法仅考虑到一个页面最近是否被访问过。事实上,如果被淘汰的页面没有被修改过,就不需要执行I/O操作写回外存。只有被淘汰的页面被修改过时,才需要写回外存。
因此,除了考虑一个页面最近有没有被访问过之外,操作系统还应考虑页面有没有被修改过。在其他条件都相同时,应优先淘汰没有修改过的页面,避免I/O操作。这就是改进型的时钟置换算法的思想。修改位=0,表示页面没有被修改过;修改位=1,表示页面被修改过。
为方便讨论,用(访问位,修改位)的形式表示各页面状态。如(1, 1)表示一个页面近期被访问过,且被修改过。
改进型的Clock算法需要综合考虑某一内存页面的访问位和修改位来判断是否置换该页面。在实际编写算法过程中,同样可以用一个等长的整型数组来标识每个内存块的修改状态。访问位A和修改位M可以组成一下四种类型的页面。
算法规则:将所有可能被置换的页面排成–个循环队列
第一轮:从当前位置开始扫描到第一个(A =0, M = 0)的帧用于替换。表示该页面最近既未被访问,又未被修改,是最佳淘汰页
第二轮:若第一轮扫描失败,则重新扫描,查找第一个(A =0, M = 1)的帧用于替换。本轮将所有扫描过的帧访问位设为0。表示该页面最近未被访问,但已被修改,并不是很好的淘汰页。
第三轮:若第二轮扫描失败,则重新扫描,查找第一个(A =1, M = 0)的帧用于替换。本轮扫描不修改任何标志位。表示该页面最近已被访问,但未被修改,该页有可能再被访问。
第四轮:若第三轮扫描失败,则重新扫描,查找第一个A =1, M = 1)的帧用于替换。表示该页最近已被访问且被修改,该页可能再被访问。
由于第二轮已将所有帧的访问位设为0,因此经过第三轮、第四轮扫描一定会有一个帧被选中,因此改进型CLOCK置换算法选择- -个淘汰页面最多会进行四轮扫描
算法规则:将所有可能被置换的页面排成一个循环队列
第一轮:从当前位置开始扫描到第-一个(0, 0)的帧用于替换。本轮扫描不修改任何标志位。(第一优先级:最近没访问,且没修改的页面)
第二轮:若第一轮扫描失败,则重新扫描,查找第一个(0, 1)的帧用于替换。本轮将所有扫描过的帧访问位设为0
(第二优先级: 最近没访问,但修改过的页面)
第三轮:若第二轮扫描失败,则重新扫描,查找第一个(0, 0)的帧用于替换。本轮扫描不修改任何标志位(第三优先级:最近访问过,但没修改的页面)
第四轮:若第三轮扫描失败,则重新扫描,查找第一个(0, 1)的帧用于替换。(第四优先级:最近访问过,且修改过的页面)
由于第二轮已将所有帧的访问位设为0,因此经过第三轮、第四轮扫描一定会有一个帧被选中,因此改进型CLOCK置换算法选择一个淘汰页面最多会进行四轮扫描
算法规则 | 优缺点 | |
---|---|---|
OPT | 优先淘汰最长时间内不会被访问的页面 | 缺页率最小,性能最好;但无法实现 |
FIFO | 优先淘汰最先进入内存的页面 | 实现简单;但性能很差,可能出现Belady异常 |
LRU | 优先淘汰最近最久没访问的页面 | 性能很好;但需要硬件支持,算法开销大 |
CLOCK (NRU) | 循环扫描各页面 第一轮淘汰访问位=0的,并将扫描过的页面访问位改为1。若第-轮没选中,则进行第二轮扫描。 |
实现简单,算法开销小;但未考虑页面是否被修改过。 |
改进型CLOCK (改进型NRU) | 若用(访问位,修改位)的形式表述,则 第一轮:淘汰(0,0) 第二轮:淘汰(O,1),并将扫描过的页面访问位都置为0 第三轮:淘汰(O, 0) 第四轮:淘汰(0, 1) |
算法开销较小,性能也不错 |
请求分页系统中外存分为两部分:用于存放文件的文件区和用于存放对换页面的对换区。对换区通常是采用连续分配方式,而文件区采用离散分配方式,故对换区的磁盘I/O速度比文件区的更快。
1.系统拥有足够的对换区空间:页面的调入、调出都是在内存与对换区之间进行,这样可以保证页面的调入、调出速度很快。在进程运行前,需将进程相关的数据从文件区复制到对换区。
2.系统缺少足够的对换区空间:凡是不会被修改的数据都直接从文件区调入,由于这些页面不会被修改,因此换出时不必写回磁盘,下次需要时再从文件区调入即可。对于可能被修改的部分,换出时需写回磁盘对换区,下次需要时再从对换区调入。
3.UNIX方式:运行之前进程有关的数据全部放在文件区,故未使用过的页面,都可从文件区调入。若被使用过的页面需要换出,则写回对换区,下次需要时从对换区调入。
刚刚换出的页面马上又要换入内存,刚刚换入的页面马上又要换出外存,这种频繁的页面调度行为称为抖动,或颠簸。产生抖动的主要原因是进程频繁访问的页面数目高于可用的物理块数(分配给进程的物理块不够)
为进程分配的物理块太少,会使进程发生抖动现象。为进程分配的物理块太多,又会降低系统整体的并发度,降低某些资源的利用率
为了研究为应该为每个进程分配多少个物理块,Denning 提出了进程工作集” 的概念
驻留集:指请求分页存储管理中给进程分配的内存块的集合。
工作集:指在某段时间间隔里,进程实际访问页面的集合。
原理:让操作系统跟踪每个进程的工作集,并为进程分配大于其工作集的物理块。如果还有空闲物理块,则可以再调一个进程到内存以增加多道程序数。如果所有工作集之和增加以至于超过了可用物理块的总数,那么操作系统会暂停一个进程,将其页面调出并且将其物理块分配给其他进程,防止出现抖动。
工作集大小可能小于窗口尺寸,实际应用中,操作系统可以统计进程的工作集大小,根据工作集大小给进程分配若干内存块。如:窗口尺寸为5,经过一段时间的监测发现某进程的工作集最大为3,那么说明该进程有很好的局部性,可以给这个进程分配3个以上的内存块即可满足进程的运行需要。
–般来说,驻留集大小不能小于工作集大小,否则进程运行过程中将频繁缺页。
拓展:基于局部性原理可知,进程在–段时间内访问的页面与不久之后会访问的页面是有相关性的。因此,可以根据进程近期访问的页面集合(工作集)来设计- -种页面置换算法- --选择-一个不在工作集中的页面进行淘汰。
- 虚拟存储只能基于非连续分配技术。
- 虚拟存储器容量既不受外存容量限制,也不受内存容量限制,而是由CPU的寻址范围决定的。
- 在请求分页存储器中,由于页面尺寸增大,存放程序需要的页数就会减少,因此缺页中断的次数也会减少。
- 进程在执行中发生了缺页中断,经操作系统处理后,应让其执行被中断的那一条指令,缺页中断是访存指令引起的,说明所要访问的页面不在内存中,在进行缺页中断处理后,调入所要访问的页面后,访存指令显然应该重新执行。
- 缺页中断调入新页面,肯定要修改页表项和分配页框,同时内存没有页面,需要从外存读入,会发生磁盘I/O。
- 虚拟存储技术是基于程序的局部性原理,局部性越好虚拟存储系统越能更好地发挥其作用。
- 无论采用什么算法,每种页面第一次访问时不可能在内存中,必然发生缺页,所以缺页次数大于程序所需要的页数。
- LRU算法需要对所有的页最近被访问的时间进行记录,查找时间最久的进行替换,这涉及排序,对置换算法而言,开销太大。
- 页表项中合法位信息显示着本页面是否在内存中,也即决定了是否会发生页面故障。
- 虚拟存储扩充内存的基本方法是将一些页或段从内存中调入,调出,而调入,调出的基本手段是覆盖与交换。
- 请求分页存储管理的主要特点是扩充了内存。
- 页式虚拟存储管理的特点是不要求将作业同时全部装入到连续区域,一般只装入10%~30%,不要求将作业装入主存连续区域是所有离散式存储管理(包括页式存储管理)的特点,页式虚拟存储管理需要进行中断处理和页面置换。
- 快表在计算机系统中是用于地址变换。
- 覆盖技术与虚拟存储技术最本质的不同在于覆盖程序段的最大长度要受内存容量大小的限制,而虚拟存储器中的程序最大长度不受内存容量的限制,只受计算机地址结构的限制。另外,覆盖技术中的覆盖段由程序设计,且要求覆盖段中的各个覆盖具有相对独立性,不存在直接联系或相互交叉访问,而虚拟存储技术对用户的程序段之间没有这种要求。
- 交换技术与虚存技术相同点是都要在内存与外存之间交换信息,交换技术与虚存中使用的调入/调出技术主要的区别是:交换技术调入/调出整个进程,因此一个进程大小要受内存容量大小的限制,而虚存中使用的调入/调出技术在内存和外存之间来回传递的是页面或分段,而不是整个进程,从而使得进程的地址映射具有了更大的灵活性,且允许进程的大小比可用的内存空间大。
- 已知系统为32位实地址,采用48位虚地址,页面大小为4KB,页表项大小为8B,假设系统使用纯页式存储,则采用(4)级页表,页内偏移地址(12)位。
页面大小为4KB,故页内偏移为12位,系统采用48位虚拟地址,故虚页号48-12=36位。采用多级页表时,最高级页表不能超出一页大小,每页能容纳页表项数位:4KB/8B=512=2^9,36/9=4,故采用4级页表。
分段管理方式的提出则是考虑了用户和程序员,以满足方便编程,信息保护和共享,动态增长及动态链接等多方面的需要。
段内要求连续,段间不要求连续
在段式系统中,段号和段内偏移量必须由用户显示提供,在高级程序设计语言中,这个工作由编译程序完成。
段表:每个进程都有一张逻辑空间与内存空间映射的段表,其中每一个段表项对应进程的一个段,段表项记录该段在内存中的起始地址和段的长度。
段页式存储管理方式:
页式存储管理能有效地提高内存利用率,而分段存储管理能反映程序的逻辑结构并有利于段的共享。
作业的地址空间首先被分成若干个逻辑段,每段都有自己的段号,然后再将每一段分成若干个大小固定的页。
逻辑地址有三部分构成:段号,页号,页内偏移量
段表表项:段号,页表长度,页表起始地址
页表表项:页号,块号
段表寄存器:指出段表起始地址和段表长度
1.虚拟内存的管理需要有相关硬件和软件的支持
有请求分页页表机制,缺页中断机制,地址变换机构等。
2.在使用交换技术时,如果一个进程正在进行I/O操作时,则不能交换出主存。否则它的I/O数据区将被新换入的进程占用,导致错误,不过可以在操作系统中开辟I/O缓冲区,将数据从外设或将数据输出到外设的I/O活动在系统缓冲区中进行,这时在系统缓冲区与外设I/O时,进程交换不受限制。
3.当程序要访问某个内存单元时,由硬件检查是否允许,如果允许则执行,否则产生地址越界中断。
4.段页式存储管理中,地址映射表是每个进程一张页表,每个段一张段表。
5.内存保护需要由操作系统和硬件机构合作完成,以保证进程空间不被非法访问,内存保护是内存管理的一部分,是操作系统的任务,但是处于安全性和效率考虑,必须由硬件实现,所以需要操作系统和硬件机构的合作来完成。
6.覆盖技术是早期在单一连续存储管理中使用的扩大存储容量的一种技术,它同样也可用于固定分区分配的存储管理者中。
7.分页式存储管理有内部碎片,分段式存储管理有外部碎片,固定分区存储管理方式有内部碎片,分页式存储管理方式有内部碎片。
8.页式存储管理中,页表的始地址存放在寄存器中(页表基址寄存器(PTBR)),这样才能满足在地址变换时,能够较快地完成逻辑地址和物理地址之间的转换。
9.对重定位存储管理方式,应在这个系统中设置一个重定位寄存器。因为系统处理器在通一个时刻只能执行一条指令或访问数据,所以为每道程序(数据)设置一个寄存器是没有必要的,而只需要在切换程序执行时重置寄存器内容即可。
10.采用可重用程序是通过减少对换数的方法来改善系统性能的。可重入程序通过共享来使用同一块存储空间,或者通过动态链接的方式将所需程序映射道相关进程中,其最大的优点是减少了对程序的调入/调出,因此减少了对换数量。
11.实现分页,分段式存储需要特定的数据结构,例如,页表,段表等,为了提高性能还需要提供快存和地址加法器,代价高。分区存储管理满足多道程序设计的最简单存储管理方案,特别适合嵌入式等微型设别。
12.引入覆盖和交换技术是时间换空间。
13.页式存储页面大小是等长的。
14.引入段式存储管理方式,主要是为了满足用户下列要求:方便编程,分段共享,分段保护,动态链接和动态增长
15.主存分配以块为单位,访问以字节为单位。
16.存储管理目的:1方便用户2提高内存利用率
17.分页是一维,分段是二维,因为分页定长。
18.在多个进程并发执行时,所有进程的页表大多数驻留在内存中,在系统中设置一个页表寄存器(PTR),在其中存放页表在内存的起始地址和页表长度,平时,进程未执行时,页表的起始地址和页表长度存放在本进程的PCB中,当调度到进程时,才将两个数据转入页表寄存器,每个进程都有一个单独的逻辑地址,有一张属于自己的页表。
19.段页式存储管理兼有页式管理和段式管理的优点,采用分段方法来分配和管理用户地址空间,用分页方法来管理物理存储空间,但它的开销比分段式和页式管理的开销都要大。
1.为什么要进行内存管理?
单道处理机系统阶段,一个系统一个时间只执行一个程序,内存分配简单。多道程序引入后,进程之间除了共享的不仅仅是处理机,还有主存储器。共享内存比较复杂,此时不对内存进行管理,容易导致数据混乱,以至于限制进程并发执行。
2.页式管理中每个页表项的大小下限如何确定?
首先用总的位数m-页内位数n,得到页号的位数x,然后取log2x,然后对结果向上取正,因为页表项以字节为单位。(也可以选择更大的页表项大小以至于让一个页面能够正好容下整数个页表项以方便存储(例如取成4B,那么一页正好可以装下1K个页表项)或者增加点其他什么信息)
3.多级页表解决了什么问题?又会带来什么问题?
多级页表解决了当逻辑地址空间过大时,页表长度会大大增加的问题。而采用多级页表时一次访盘需要多次访问内存升至磁盘,会大大增加一次方寸的时间。
题目
1.(2011考研)在虚拟内存管理中,地址变换机构将逻辑地址变换为物理地址,形成该逻辑地址的阶段是(C)
A.编辑 B.编译 C.链接 D.装载
编译后的程序需要经过链接才能装载,而链接后形成的目标程序中的地址是逻辑地址。以,C语言为例:C语言经过预处理(cpp)–>编译(ccl)–>汇编(as)–>链接(ld)产生了可执行文件。其链接的前一步,产生了可重定位的二进制的目标文件。C语言采用源文件独立编译的方法,如程序main.c,file.c,file1.h,file2.h,在链接的前一步生成了main.o,file1.o,file2.o,这些目标模块采用的逻辑地址都从0开始,但只是相对该模块的逻辑地址。但只是相对于该模块的逻辑地址,链接器将这三个文件,libc和其他库文件链接成一个可执行文件,链接阶段主要完成重定位,形成整个程序的完整逻辑地址空间。(完成该变换过程的是装载阶段)
2.(2010考研)
某计算机采用二级页表的分页存储管理方式,按字节编址,页大小为2^10字节,页表项大小为2字节,逻辑地址结构为
页目录号|页号|页内偏移量
逻辑地址空间大小为2^16,则表示整个逻辑地址空间的目录表中包含表项的个数至少是(128)