操作系统——内存分配管理

文章目录

  • 1. 连续分配
    • 1.1 单一连续分配
    • 1.2 固定分区分配
    • 1.3 动态分区分配
  • 2. 非连续分配
    • 2.1 基本分页存储管理方式
      • 2.1.1 基本地址变换机构
      • 2.1.2 具有快表的地址变换机构——解决地址变换效率问题
      • 2.1.3 二级页表——解决页表过大问题
    • 2.2 基本分段存储管理方式
    • 2.3 段页式存储管理方式

1. 连续分配

连续分配方式,是指为一个用户程序分配一个连续的内存空间。

分配策略 作业道数 内部碎片 外部碎片 硬件支持 解决碎片 解决空间不足 提高作业道数
单道连续分配 1 界地址寄存器、越界检查机构 覆盖 交换
多道固定连续分配 不超过用户空间分区数 上下界寄存器、越界检查机构、基地址寄存器、长度寄存器、动态地址转换机构 覆盖 交换
多道动态连续分配 可变 上下界寄存器、越界检查机构、基地址寄存器、长度寄存器、动态地址转换机构 紧凑 覆盖 交换

内部碎片是已经被分配出去的的内存空间大于请求所需的内存空间。

外部碎片是指还没有分配出去,但是由于大小太小而无法分配给申请空间的新进程的内存空间空闲块。

固定分区分配存在内部碎片,动态分区分配会存在外部碎片;

页式虚拟存储系统存在内部碎片,段式虚拟存储系统存在外部碎片。

1.1 单一连续分配

内存在此方式下分为系统区用户区,系统区仅提供给操作系统使用,通常在低地址部分;用户区是为用户提供的、除系统区之外的内存空间。这种方式无需进行内存保护,因为内存中永远只有一道程序,不会因为访问越界而干扰其他程序。

优点:简单、无外部碎片,可以采用覆盖技术,不需要额外的技术支持。

缺点:只能用于单用户、单任务的操作系统中,有内部碎片,存储器的利用率极低。

1.2 固定分区分配

固定分区与页式分区思想类似,都是预先分配内存,但是页式分区有页表。

固定分区分配是最简单的一种多道程序存储管理方式,它将用户内存空间划分为若干个固定大小的区域,每个分区只装入一道作业。当有空闲分区时,便可以再从外存的后备作业队列中,选择适当大小的作业装入该分区,如此循环。

固定分区分配在划分分区时,有两种不同的方法:

  • 分区大小相等:用于利用一台计算机去控制多个相同对象的场合,缺乏灵活性;
  • 分区大小不等:划分为含有多个较小的分区、适量的中等分区及少量的大分区。

为便于内存分配,通常将分区按大小排队,并为之建立一张分区说明表,其中各表项包括每个分区的起始地址、大小及状态(是否已分配)。当有用户程序要装入时,便检索该表,以找到合适的分区给予分配并将其状态置为已分配;未找到合适分区则拒绝为该用户程序分配内存。

这种分区方式存在两个问题:一是程序可能太大而放不进任何一个分区中,这时用户不得不使用覆盖技术来使用内存空间;二是主存利用率低,当程序小于固定分区大小时,也占用了一个完整的内存分区空间,这样分区内部有空间浪费,这种现象称为内部碎片

固定分区是可用于多道程序设计最简单的存储分配,无外部碎片。固定分区分配很少用于现在通用的操作系统中,但在某些用于控制多个相同对象的控制系统中仍发挥着一定的作用。

1.3 动态分区分配

动态分区与段式分区思想类似,根据用户所需内存分配资源,段式分区有段表,且多为段式分区与页式分区结合使用,先为进程进行段式分配,然后在每段中进行页式分配。

动态分区分配又称为可变分区分配,是一种动态划分内存的分区方法。这种分区方法不预先将内存划分,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统中分区的大小和数目是可变的。

动态分区在开始分配时是很好的,但是之后会导致内存中出现许多小的内存块。随着时间的推移,进程不断地换入/换出,内存中会产生越来越多的碎片,内存的利用率随之下降。这些小的内存块称为外部碎片,指在所有分区外的存储空间会变成越来越多的碎片,这与固定分区中的内部碎片正好相对。克服外部碎片可以通过紧凑技术来解决,就是操作系统不时地对进程进行移动和整理。但是这需要动态重定位寄存器的支持,且相对费时。

在进程装入或换入主存时,如果内存中有多个足够大的空闲块,操作系统必须确定分配哪个内存块给进程使用,这就是动态分区分配策略,考虑以下几种算法:

  • 首次适应算法:空闲分区以地址递增的次序链接。分配内存时顺序查找,找到大小能满足要求的第一个空闲分区;
  • 最佳适应算法:空闲分区按容量递增形成分区链,分配时找到第一个能满足要求的空闲分区;
  • 最坏适应算法:又称最大适应算法,空闲分区以容量递减的次序链接。找到第一个能满足要求的空闲分区,也就是挑选出最大的分区。
  • 邻近适应算法:又称循环首次适应算法,由首次适应算法演变而成。不同之处是分配内存时从上次查找结束的位置开始继续查找。

首次适应算法不仅是最简单的,而且通常也是最好和最快的。UNIX 系统的最初版本,就是使用首次适应算法为进程分配内存空间,并且使用数组 (而非链表)来实现。首次适应算法会使得内存的低地址部分出现很多小的空闲分区,每次分配查找时,都要经过这些分区,增加查找的开销。

邻近适应算法试图解决这个问题,但实际上,它常常会导致在内存的末尾分配空间分裂成小碎片(因为在一遍扫描中,内存前面部分使用后再释放时,不会参与分配)。它通常比首次适应算法的结果要差。

最佳适应算法性能通常很差,因为每次最佳的分配会留下很小的难以利用的内存块,它会产生最多的外部碎片。

最坏适应算法与最佳适应算法相反,选择最大的可用块,这看起来最不容易产生碎片,但是却把最大的连续内存划分开,会很快导致没有可用的大的内存块,因此性能也非常差。

在算法实现时,最佳适应法和最大适应法需要对可用块进行排序或遍历查找,而首次适应法和邻近适应法只需要简单查找;回收操作中,当回收的块与原来的空闲块相邻时(有三种相邻的情况,比较复杂),需要将这些块合并。

2. 非连续分配

非连续分配允许一个程序分散地装入到不相邻的内存分区中,解决因连续空闲空间不足,导致程序无法装入的问题。由于需要额外的空间存储分散内存的索引,非连续分配方式的存储密度低于连续分配方式。

根据分区的大小是否固定分为分页存储管理方式和分段存储管理方式;根据运行作业时是否要把作业的所有页面都装入内存才能运行分为基本分页存储管理方式和请求分页存储管理方式。

分配策略 逻辑地址结构 页表 段表 设计目的 硬件支持
页式存储管理 [页号]:[页内偏移量] [页号]:[块号] - 提高内存的利用率 页表寄存器
段式存储管理 [段号]:[段内偏移量] - [段号]:[段长]:[起始地址] 信息保护和共享 段表寄存器
段页式存储管理 [段号]:[页号]:[页内偏移量] [页号]:[块号] [段号]:[页表长度]:[页表起始地址] 兼顾二者 段表寄存器

透明性:分页对程序员透明,分段需要显式划分每个段(一般由编译器完成);
地址空间:分页是一维地址空间,分段是二维地址空间;
大小是否可变:页的大小不可变,段的大小可以动态改变;
出现原因:分页主要用于提高内存利用率,实现虚拟内存,获得更大的地址空间;分段主要是为了使程序和数据可以被划分为逻辑上独立的地址空间,有助于共享和保护。

2.1 基本分页存储管理方式

固定分区会产生内部碎片,动态分区会产生外部碎片,这两种技术对内存的利用率都比较低。

把主存空间划分为大小相等且固定的块,块相对较小,作为主存的基本单位。每个进程也以块为单位进行划分,进程在执行时,以块为单位逐个申请主存中的块空间。

块的大小相对分区要小很多,而且进程也按照块进行划分,进程运行时按块申请主存可用空间并执行。这样,进程只会在为最后一个不完整的块申请主存空间时,才产生主存碎片,所以尽管会产生内部碎片,但是这种碎片相对较小,每个进程平均只产生半个块大小的内部碎片(也称页内碎片)。

1. 页面/页框

进程中的块称为页面(Page),内存中的块称为页框或页帧(Page Frame)。外存也以同样的单位进行划分,直接称为块(Block)。进程在执行时需要申请主存空间,为每个页分配主存中的可用页框,产生页和页框的一一对应关系。

为方便地址转换,页面大小应是2的整数幂。同时,页面大小应该适中,如果页面太小,会使进程的页面数过多,页表过长,占用大量内存,也会增加硬件地址转换的开销,降低页面换入/换出的效率;页面过大会使页内碎片增大,降低内存的利用率。

2. 逻辑地址结构

逻辑地址结构包含两部分:前一部分为页号,后一部分为页内偏移量。对于32位操作系统,逻辑地址长度为32 位,其中0-11位为页内地址,每页大小为4KB;12-31位为页号,最多允许有 2 20 2^{20} 220页。逻辑地址长度决定虚拟内存的寻址空间大小

3. 页表

为了便于在内存中找到进程的每个页面所对应的物理块,系统为每个进程建立一张页表,记录页面在内存中对应的物理块号,页表一般存放在内存中。页表的作用是实现从页号到物理块号的地址映射。

逻辑地址 [页号]:[页内偏移量]

页表结构 [页号]:[物理内存块号]

物理地址 [物理内存块号]:[页内偏移量]

操作系统——内存分配管理_第1张图片

这种分区方式存在两个问题:一是每次访存操作都需要进行逻辑地址到物理地址的转换,地址转换过程必须足够快,否则访存速度会降低;二是为每个进程引入页表,用于存储映射机制,页表不能太大,否则内存利用率会降低。

2.1.1 基本地址变换机构

基本地址变换机构的任务是将逻辑地址转换为物理地址,地址变换是借助于页表实现的,整个过程由硬件自动完成。通常设置一个页表寄存器(PTR),存放页表在内存的起始地址 F 和页表长度 M。进程未执行时,页表的起始地址和长度存放在进程控制块中,进程执行时,才将二者存入页表寄存器。

页面大小为 L,逻辑地址 A 到物理地址 E 的转换过程如下:

  1. 计算页号 P=A/L 和页内偏移量 W=A%L
  2. 比较页号和页表长度,若页号大于等于页表长度则产生越界中断,否则继续执行;
  3. 页表中页号对应的页表项地址 = 页表起始地址 + 页号 * 页表项长度,该页表项内容 b,即为物理块号;
  4. 计算物理地址 E=b*L+W

操作系统——内存分配管理_第2张图片

2.1.2 具有快表的地址变换机构——解决地址变换效率问题

在基本地址变换机构中,页表全部放在内存中,存取一个数据或一条指令至少要访问两次内存:第一次是访问页表,确定所存取的数据或指令的物理地址,第二次才是根据该地址存取数据或指令。这种方法比通常执行指令的速度慢了一半。

在地址变换机构中增设一个具有并行查找能力的高速缓冲存储器——快表,又称联想寄存器(TLB),存储当前访问的若干页表项,以加速地址变换的过程。与此对应,主存中的页表也常称为慢表。

具有快表的地址转换过程如下:

  1. CPU 给出逻辑地址后,由硬件计算出页号,并将其送入高速缓存寄存器,将此页号与快表中的所有页号进行比较;
  2. 如果找到匹配的页号,则直接从中取出该页对应的页框号,与页内偏移量拼接形成物理地址。存取数据仅一次访存便可实现;
  3. 如果没有匹配成功,则需要访问主存中的页表,读出页表项后,应将其存入快表,以便可能的再次访问。若快表已满,则按照一定的算法对旧的页表项进行替换。

操作系统——内存分配管理_第3张图片

有些处理机设计为快表和慢表同时查找,如果在快表中查找成功则终止慢表的查找。

一般快表的命中率可以达到90%以上,分页带来的速度损失就降低到10%以下。快表的有效性是基于著名的局部性原理

2.1.3 二级页表——解决页表过大问题

大多数情况下,映射所需要的页表项都在页表的同一个页面中。为了查询的方便,顶级页表最多只能有1个页面,容纳1K个页表项,需要10位编址

在32位操作系统中,全部32位逻辑地址空间4GB,页面大小4KB,最大页面数1M。若采用一级页表,至少需要20位对页号编址,页表项长度至少为3B(一般取4B),页表总大小4MB,需要占用1024个页面。若采用二级页表,对1K个页面建立顶级页表,1K个页表项正好是一页的大小,即顶级页表占用1页。32位逻辑地址结构为:顶级页表10位,二级页表10位,页内偏移量12位

在64位操作系统中,全部64位逻辑地址空间16EB(K、M、G、T、P、E、Z、Y、D、N),页面大小4KB,最大页面数4PB,至少需要20位对页号编址,页面项长度至少为7B(一般取8B)。对上一级分页时,每个页面只能存储512个页表项,页面号9位,以此类推。64位逻辑地址结构为:7+9+9+9+9+9+12,需要六级分页

使用层次结构的页表:将页表的10页空间进行地址映射,建立上一级页表,用于存储页表的映射关系。对页表的10个页面进行映射只需要10个页表项,上一级页表只需要1页就足够(1页最大可存储1024个页表项)。进程执行时,只需要将这1页的上一级页表调入内存,进程的页表和进程本身的页面,可以在后面的执行中再调入内存。

建立多级页表的目的在于建立索引,这样不用浪费主存空间去存储无用的页表项,也不用盲目地顺序式查找页表项,建立索引的要求是最高一级页表项不超过一页的大小

操作系统——内存分配管理_第4张图片

2.2 基本分段存储管理方式

分页管理方式是从计算机的角度考虑设计的,以提高内存的利用率,提升计算机的性能, 且分页通过硬件机制实现,对用户完全透明;分段管理方式的提出则是考虑了用户和程序员,以满足方便编程、信息保护和共享、动态增长及动态链接等多方面的需要。

段式管理方式按照用户进程中的自然段划分逻辑空间。例如,用户进程由主程序、两个子程序、栈和一段数据组成,于是可以把这个用户进程划分为5个段,每段从0开始编址,并分配一段连续的地址空间(段内要求连续,段间不要求连续,因此整个作业的地址空间是二维的),逻辑地址由段号 S 与段内偏移量 W 两部分组成。

在页式系统中,逻辑地址的页号和页内偏移量对用户是透明的,但在段式系统中,段号和段内偏移量必须由用户显式提供,在髙级程序设计语言中,这个工作由编译程序完成。

每个进程都有一张逻辑空间与内存空间映射的段表,每一个段表项对应进程的一个段,段表项由段号、段长和该段在内存中的起始地址组成。段表用于实现从逻辑段到物理内存的映射。

操作系统——内存分配管理_第5张图片

为了实现进程从逻辑地址到物理地址的变换功能,在系统中设置了段表寄存器,用于存放段表在内存的起始地址 F 和段表长度 M。

逻辑地址 A 到物理地址 E 的转换过程如下:

  1. 从逻辑地址中取出前几位为段号,后几位为段内偏移量;
  2. 比较段号和段表长度,若段号大于等于段表长度,则产生越界中断,否则继续执行;
  3. 段表中段号对应的段表项地址 = 段表起始地址 + 段号 * 段表项长度,取出该段表项的前几位得到段长。若段内偏移量大于等于段长,则产生越界中断,否则继续执行;
  4. 取出段表项中该段的起始地址b,计算物理地址 E = b+W

操作系统——内存分配管理_第6张图片

段的共享是通过两个作业的段表中相应表项指向被共享的段的同一个物理副本来实现的。当一个作业正从共享段中读取数据时,必须防止另一个作业修改此共享段中的数据。不能修改的代码称为纯代码或可重入代码(它不属于临界资源),这样的代码和不能修改的数据是可以共享的,而可修改的代码和数据则不能共享。

分段管理的保护方法主要有两种:一种是存取控制保护,另一种是地址越界保护。地址越界保护是利用段表寄存器中的段表长度与逻辑地址中的段号比较,若段号大于段表长度则产生越界中断;再利用段表项中的段长和逻辑地址中的段内位移进行比较,若段内位移大于段长,也会产生越界中断。

2.3 段页式存储管理方式

在段页式系统中,作业的地址空间首先被分成若干个逻辑段,每段都有自己的段号,然后再将每一段分成若干个大小固定的页。对内存空间的管理仍然和分页存储管理一样,将其分成若干个和页面大小相同的存储块,对内存的分配以存储块为单位。

在段页式系统中,作业的逻辑地址分为三部分:段号、页号和页内偏移量。

为了实现地址变换,系统为每个进程建立一张段表,而每个分段有一张页表。段表项中至少包括段号、页表长度和页表起始地址,页表表项中至少包括页号和块号。此外,系统中还应有一个段表寄存器,指出作业的段表起始地址和段表长度。在一个进程中,段表只有一个,而页表可能有多个

操作系统——内存分配管理_第7张图片

在进行地址变换时,首先通过段表查到页表起始地址,然后通过页表找到页帧号,最后形成物理地址。进行一次访问实际需要三次访问主存,同样可以使用快表以加快查找速度,其关键字由段号、页号组成,值是对应的页帧号和保护码。

操作系统——内存分配管理_第8张图片

你可能感兴趣的:(操作系统,操作系统,内存管理)