内存是用于存放数据的硬件,程序执行前要先放到内存中才能被CPU处理。
给内存的存储单元编地址,内存地址从0开始,每一个内存地址对应一个存储单元。如果计算机是按字节编址,则一个存储单元的大小为1字节,即8个二进制位。如果按字编址,字长为16位,那么一个存储单元的大小位2字节(Byte)。
1KB = 210B
1MB = 220B
1GB = 230B
一个手机有4GB的内存,是指在内存种可以存放232个字节,需要232个地址一对一表示,所以需要32位作为地址长度
高级语言编译后形成了机器语言,就是很多指令的集合。
每个进程在逻辑上由三部分组成:程序段,数据段,PCB(进程控制块)
变量存放在数据段里,指令存放在程序段里
CPU会根据程序段里的指令依次进行操作
变量在内存中存放的实际存放地址是物理地址(绝对地址),但实际在生成机器指令的时候并不知道该进程的数据会被放到什么位置,所以编译生成的指令中一般是使用逻辑地址(相对地址)
Eg:编译时只需要知道变量x存放的相对地址为100(也就是说相对于进程在内层中起始地址而言的地址)。Cpu想找到x在内存中的实际存放位置,只需要用进程的 起始地址+100 即可
(1) 编译阶段:将许多源代码文件(.C)编译成为相应的目标模块(.O),就是把高级语言翻译成机器语言,每个目标模块都有自己从0开始的逻辑地址
(2) 链接阶段:由链接程序将编译后形成的一组目标模块,以及所需的函数库链接在一起,形成一个完整的装入模块(.exe),并且形成完整的逻辑地址空间。
(3)装入阶段:由装入程序将装入模块装入内存中运行(进行逻辑地址和物理地址的转换)
(用三种不同的方法实现逻辑地址到物理地址的转换)
(1) 绝对装入:在编译时,就知道程序将放在内存的哪个位置,编译程序将产生绝对地址的目标代码,装入程序按照装入模块中的地址将程序和数据装入内存。(只适用用于单道程序环境) 单道程序阶段,还没OS,由编译器完成
(2) 静态重定位:又称可重定位装入。在装入时对地址进行重定位。将逻辑地址变为物理地址。(地址变换是在装入时一次性完成的)。
特点:在一个作业装入内存时,必须分配其要求的全部内存空间。 如果没有足够的内存,就不能装入。作业一旦进入内存后,在运行期间就 不能再移动,也不能再申请内存空间 用于早期的多道批处理操作系统
(3) 动态重定位:又称动态运行时装入。编译,链接后的装入模块逻辑地址是从0开始的。装入后不转化成逻辑地址。把地址转换推迟到程序真正要执行的时候。用重定位寄存器存放装入模块在内存中的起始地址,然后访存时,用逻辑地址+重定位寄存器中的气质地址就得到了物理地址。
特点:允许程序在内存中发生移动,只需要改变重定位寄存器中的起始地址即可。十分灵活。可将程序分配到不连续的存储区中。在程序运行前只需要装入部分代码即可投入运行。在运行期间,可以根据需要动态申请和分配内存。现代操作系统采用的方式
(1) 静态链接:在程序运行之前,先将各个目标模块以及他们所需要的库函数链接成一个完整的可执行文件(装入模块),之后不再拆开。
(2) 装入时动态链接:将各个目标模块装入内存时,边装入边链接的链接方式。
(3) 运行时动态链接:在程序执行中,需要该目标模块时,才对它进行链接。其优点是便于修改和更新,便于实现对目标模块的共享。
(1). 内存空间的分配与回收
(2). 内存空间的扩充(虚拟内存)
内部碎片:分配给某进程的内部区域中,如果某些部分没有用上,就是内部碎片。
外部碎片:内存中某些空闲分区由于太小而难以利用,就是外部碎片(解决 :紧凑技术)
为用户进程分配的必须是连续的内存空间
分区号 | 大小 | 起始地址 | 状态 |
---|---|---|---|
1 | 2 | 8 | 未分配 |
2 | 2 | 10 | 未分配 |
3 | 4 | 12 | 已分配 |
… | … | … | … |
可用数组或链表维护。
优点:实现简单,无外部碎片。
缺点:a. 当程序太大时,可能所有分区都不能满足要求,此时不得不采用覆盖技术解决,会减低性能。b. 会产生内部碎片,内存利用率低。
分区号 | 分区大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 20 | 8 | 空闲 |
2 | 10 | 32 | 空闲 |
3 | 4 | 60 | 空闲 |
空闲分区链:每个分区的起使部分和末尾部分分别设置前向和后向指针。起使部分出还可以记录分区大小的信息。
当一个新作业装入内存时,须按照一定的动态分区分配算法,从空闲区表(或者空闲区链)中选出一个分区分配给该作业。
(1) 首次适应算法(First Fit)
空闲分区以地址递增的次序排列。每次分配内存时,顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
(2) 最佳适应算法(Best Fit)
空闲分区按容量递增的次序链接。每次分配内存时,顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
缺点:会产生很多的外部碎片。
(3) 最坏适应算法(Worst Fit)
又称最大适应算法。为了解决最佳适应算法的问题——留下太多难以利用的小碎片。在每次分配时优先使用最大的连续空闲区。把空闲分区按照容量递减的次序链接。每次分配内存时顺序查找空闲分区链或表,找到大小能满足要求的第一个空闲分区。只判断第一个空闲分区放不放的下即可。
(4) 邻近适应算法(Next Fit)
为了解决首次适应算法低地址部分很多小的空闲区,每次从头开始查开销大的问题。以地址递增的顺序排列(可排成一个循环链表)。每次分配时,从上次查找结束的位置开始查找空闲分区链或表,找到大小能满足要求的第一个空闲分区。
高、低地址的空闲分区有相同的概率被使用,导致了高地址部分的大分区更有可能被划分为小分区,最后导致无大分区可用。(也是最佳适应算法的缺点)
算法 | 算法思想 | 分区排列顺序 | 优点 | 缺点 |
---|---|---|---|---|
首次适应 | 从头到尾找合适的分区 | 空闲分区以地址递增的次序排列 | 综合性能最好。算法开销小,回收分区后一般不需要对空闲分区队列进行重新排列 | |
最佳适应 | 优先使用较小的分区,以保留更多的大分区 | 空闲分区以容量递增的次序排列 | 会有更多的大分区被保留下来,更能满足大进程需求 | 会产生很多太小的,难以利用的碎片。算法开销大,回收分区后可能需要对空闲分区队列进行重新排列。 |
最坏适应 | 优先使用更大的分区,以防止产生太小的不可用的碎片 | 空闲分区以容量递减方式排列 | 可以减少难以利用的小碎片 | 大分区容易被用完,不利于大进程。算法开销大(原因同上) |
邻近适应 | 由首次适应算法演变而来,每次查找从上次查找的结束位置开始查找 | 空闲分区以地址递增次序排列(可以排列称循环链表) | 不用每次都从低地址小分区开始检索,算法开销少(原因同首次适应算法) | 会使高地址大分区也被用完 |
连续分配方式的缺点
为用户进程分配的不一定是连续的内存空间,可以是一些分散的地址空间。
页号 = 逻辑地址 / 页面长度 (向下取整)
页内偏移量 = 逻辑地址 % 页面长度
为了方便计算页号、页内偏移量,页面大小一般设为2的整数幂。
如果系统页面大小为210B,用32个二进制位表示逻辑地址。那么逻辑地址的前22位表示的是页号,后10位表示的是页内偏移量。
如果有K位表示“页内偏移量”,则说明系统中一个页面的大小为2KB
如果用M位表示页号,则说明系统中最多允许有2M个页面。
物理地址 = 页面始址+页内偏移量
为了知道进程的每个页面在内存中存放的位置,操作系统要为每一个进程创建一张页表。
定义:用于实现从逻辑地址到物理地址转换的一组硬件机构
基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。
通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的始址和页表长度放在进程控制块PCB中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。
页面大小是2的整数幂。
内存分为系统区和用户区。进程控制块PCB存放在系统区中。进程的运行环境保存在PCB中。在调度该进程的时候,要恢复进程的运行环境,包括从PCB中读出页表起始地址F和页表长度M存入页表寄存器中,恢复程序计数器PC(指向下一条指令的逻辑地址A)。
采用分页存储管理方式的系统,逻辑地址的格式是固定不变的(前几位是页面号P,后几位是页内偏移量W)。
页表长度:页表中总共有几个页表项,即总共有几个页。
页表项长度:每个页表项占多大的存储空间。
页面大小(页内偏移量): 一个页面占多大的存储空间
在基本地址变换机构中,每次访问一个逻辑地址,都需要查询内存中的页表。由于局部性原理,可能连续很多次查到的都是同一个页表项,能否利用这个特性减少访问页表的次数呢? =>引入快表
2.快表
快表又称为联想寄存器(TLB),是一种访问速度比内存快得多的告诉缓冲存储器,用来存放房前访问的若干页表项,以加速地址变换的过程。于此对应,内存中的页表常称为慢表
由于查询快表的速度比查询页表的速度快得多,因此只要块表命中,就可以节省很多时间。因为局部性原理,一般来说快表的命中率可以达到90%以上。
某系统使用基本分页存储管理,并采用了具有快表的地址变换机构。访问一次快表耗时1μs,访问一次内存耗时100μs。若快表命中率为90%,那么访问一个逻辑地址的平均耗时是多少? 如果快表和页表同时查询呢?
(默认先查询块表,查不到再查慢表)
(1+100)*0.9+(1+100+100)*0.1 = 111μs
(1+100)*0.9+(100+100)*0.1 = 110.9μs
地址变换过程 | 访问一个逻辑地址的访存次数 | |
---|---|---|
基本地址变换机构 | (1) 计算页号,页内偏移量 (2) 检查页号的合法性 (3) 查页表,找到页面存放的内存块号 (4) 根据内存块号和页面偏移量得到物理地址 (5) 访问目标内存单元 | 两次访存 |
具有快表的地址变换机构 | (1) 计算页号,页内偏移量 (2) 检查页号的合法性 (3) 查快表,若命中,即可知道页面存放的内存块号,可直接进行(5);若未命中则进行(4)。 (4) 查页表,找到页面存放的内存块号,并且将页表复制到快表中 (5)根据内存块号与页面偏移量得到物理地址 (6) 访问目标内存单元 | 若快表命中,只需一次访存。 若快表未命中,则需要两次访存。 |
建立页目录表,或称外部页表,或称顶层页表
某计算机系统按字节寻址,支持32位的逻辑地址,采用分页存储管理,页面大小为4KB,页表项长度为4B。
4KB = 212B,因此,页内地址要用12位表示,那么剩余20位表示页号。
因此,该系统中,一个用户进程最多有220页,相应地,在一个进程的页表中,最多有220 = 1M = 1048576个页表项。 一个页表最大需要占的内存为:220 * 4B = 222B,页框大小=页面大小=4KB=212B, 那么需要222/212 = 210个页框存储该页表。
根据页号查询页表的方法:K号页对应的在页表中的存储位置为 = 页表始址+K*4(页表项长度),要在所有页表项都连续存放的基础上才能用这种方法找到页表项。
需要为一个进程分配连续的1024个页框(内存块)来存放它的页表,内存分配有点吃力,丧失了离散分配管理最大的优点。
根据局部性原理可知,很多时候,进程在一段时间内只需要访问某几个页面就可以正常运行了,因此没有必要让整个页表都常驻内存。
段号,段内地址 => 短号,页表长度,页表存放地址