内存可存放数据。程序执行前需要先放到内存中才能被CPU处理一一缓和CPU与硬盘之间的速度矛盾
思考:在多道程序环境下,系统中会有多个程序并发执行,也就是说会有多个程序的数据需要同时放到内存中。那么,如何区分各个程序的数据是放在什么地方的呢?
方案:给内存的存储单元编地址
内存地址相当于酒店旅馆中的小房间,酒店管理者为了便于管理每个房间,采取给每个房间编号
内存中也有一个一个的“小房间”,每个小房间就是一 个“存储单元”
如果计算机“按字节编址”, 则每个存储单元大小为1字节,即1B
,即8个二进制位
如果字长为16位的计算机 “按字编址”,则每个存储单元大小为1个字;每个字的大小为16个二进制位
存储单元大小由计算机按字编址还是按字节编址来确定
一台手机/电脑有4GB
内存,是指该内存中可以存放4X2 30个字节。
如果是按字节编址的 话,也就是有4X2 30=232个“小房间”
这么多“小房间”,需要232个地址才能一一标识,所以地址需要用32个二进制位来表示(0~232-1)
210=1K (千)
220=1M (兆,百万)
230=1G (十亿,千兆)
可以通过内存的大小,让我们确定地址长度应该是多少(即要多少个二进制位才能表示相应数目的存储单元)
实际生活中的例子:
宿舍四个人一起出去旅行,四个人的学号尾号分别是0、1、2、3。
住酒店时酒店给你们安排了4个房号相连的房间。四个人按学号递增次序入住房间。比如0、1、2、3号同学分别入住了5、6、7、8号房间。
四个人的编号0、1、2、3其实是一个“相对位置”,而各自入住的房间号是一个“绝对位置”。
只要知道0号同学住的是房号为N的房间,那么M号同学的房号一定是
N+M
。
指令中的地址也可以采用这种思想。编译时产生的指令只关心“相对地址”,实际放入内存中时再想办法根据起始位置得到“绝对地址”。
相对地址又称逻辑地址,绝对地址又称物理地址。
- 编译:由编译程序将用户源代码编译成若干个目标模块(编译就是把高级语言翻译为机器语言)
- 链接:由链接程序将编译后形成的一组目标模块,以及所需库函数链接在一起,形成一个完整的装入模块
- 装入(装载):由装入程序将装入模块装入内存运行
程序经过编译、链接后生成的指令中指明的是逻辑地址(相对地址),即:相对于进程的起始地址而言的地址
如何将指令中的逻辑地址转换为物理地址?
策略:三种装入方式
- 绝对装入
- 可重定位装入(静态重定位)
- 动态运行时装入(动态重定位)
绝对装入:在编译时,如果知道程序将放到内存中的哪个位置,编译程序将产生绝对地址的目标代码。 装入程序按照装入模块中的地址,将程序和数据装入内存。
编译、链接后得到的装入模块的指令直接就使用了绝对地址。
绝对装入只适用于单道程序环境。 程序中使用的绝对地址,可在编译或汇编时给出,也可由程序 员直接赋予。通常情况下都是编译或汇编时再转换为绝对地址。
静态重定位:又称可重定位装入。编译、链接后的装入模块的地址都是从0开始的,指令中使用的地址、数据存放的地址都是相对于起始地址而言的逻辑地址。可根据内存的当前情况,将装入模块装入到内存的适当位置。装入时对地址进行“重定位”,将逻辑地址变换为物理地址(地址变换是在装入时一次完成的)。
静态重定位的特点是在一个作业装入内存时,必须分配其要求的全部内存空间,如果没有足够的内存,就不能装入该作业。 作业一旦进入内存后,在运行期间就不能再移动,也不能再申请内存空间。
动态重定位:又称动态运行时装入。编译、链接后的装入模块的地址都是从0开始的。装入程序把装 入模块装入内存后,并不会立即把逻辑地址转换为物理地址,而是把地址转换推迟到程序真正要执行 时才进行。因此装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器的支持。
- 运行时动态链接:在程序执行中需要该目标模块时,才对它进行链接。其优点是便于修改和更新,便于实现对目标模块的共享。
操作系统作为系统资源的管理者,当然也需要对内存进行管理,要管些什么呢?
- 操作系统需要提供某种技术从逻辑上对内存空间进行扩充
游戏GTA
的大小超过60GB
,按理来说这个游戏程序运行之前需要把60GB
数据全部放入内存。然而,实际我的电脑内存才12GB
,但为什么这个游戏可以顺利运行呢?
——虚拟技术(操作系统的虚拟性)
方法二:采用重定位寄存器(又称基址寄存器)和界地址寄存器(又称限长寄存器)进行越界检查。
重定位寄存器中存放的是进程的起始物理地址。界地址寄存器中存放的是进程的最大逻辑地址。
引入覆盖技术,用来解决“程序大小超过物理内存总和”的问题
覆盖技术的思想:
将程序分为多个段(多个模块)。 常用的段常驻内存,不常用的段在需要时调入内存。
内存中分为一个“固定区”和若干个“覆盖区”。
需要常驻内存的段放在“固定区”中,调入后就不再调出(除非运行结束)
不常用的段放在“覆盖区”,需要用到时调入内存, 用不到时调出内存
由图可见,未使用覆盖技术时,程序执行需要使用
8K+8K+10K+12K+4K+10K=52K
的内存空间
采用覆盖技术后,需要8K+10K+12K=30K
的内存空间
必须由程序员声明覆盖结构,操作系统完成自动覆盖。
缺点:对用户不透明,增加了用户编程负担。 覆盖技术只用于早期的操作系统中,现在已成为历史。
交换(对换)技术的设计思想:内存空间紧张时,系统将内存中某些进程暂时换出外存,把外存中某些已具备运行条件的进程换入内存(进程在内存与磁盘间动态调度)
暂时换出外存等待的进程状态为挂起状态(挂起态,suspend
)
挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态
.
中级调度(内存调度),就是要决定将哪个处于挂起状态的进程重新调入内存。
交换技术面临的问题:
- 交换通常在许多进程运行且内存吃紧时进行,而系统负荷降低就暂停。
例如:在发现许多进程运行时经常发生缺页,就说明内存紧张,此时可以换出一些进程; 如果缺页率明显下降,就可以暂停换出。
- 可优先换出阻塞进程;可换出优先级低的进程;为了防止优先级低的进程在被调 入内存后很快又被换出,有的系统还会考虑进程在内存的驻留时间…
注意:虽然交换技术会将内存中某些进程暂时换出外存,但进程的PCB会常驻内存,不会被换出外存
内存空间分配可分为连续分配管理方式和非连续分配管理方式
连续分配:指为用户进程分配的必须是一个连续的内存空间
在单一连续分配方式中,内存被分为系统区和用户区。
系统区通常位于内存的低地址部分,用于存放操作系统相关数据;用户区用于存放用户进程相关数据。
单一连续分配 内存中只能有一道用户程序,用户程序独占整个用户区空间。
优点:实现简单;无外部碎片;可以采用覆盖技术扩充 内存;不一定需要采取内存保护(eg:早期的PC操作系统MS-DOS)。
缺点:只能用于单用户、单任务的操作系统中;有内部碎片;存储器利用率极低。
20世纪60年代出现了支持多道程序的系统,为了能在内存中装入多道程序,且这些程序之间又不会相互干扰,于是将整个用户空间划分为若干个固定大小的分区,在 每个分区中只装入一道作业,这样就形成了最早的、最 简单的一种可运行多道程序的内存管理方式。
分区大小相等:缺乏灵活性,但是很适合用于用一台计 算机控制多个相同对象的场合(比如:钢铁厂有n个相 同的炼钢炉,就可把内存分为n个大小相等的区域存放 n个炼钢炉控制程序)
分区大小不等:增加了灵活性,可以满足不同大小的进 程需求。根据常在系统中运行的作业大小情况进行划分 (比如:划分多个小分区、适量中等分区、少量大分区)
操作系统需要建立一个数据结构——分区说明表,来实现各个分区的分配与回收。每个表项对应一个分区,通常按分区大小排列。每个表项包括对应分区的 大小、起始地址、状态(是否已分配)。
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 2 | 8 | 未分配 |
2 | 2 | 10 | 未分配 |
3 | 4 | 12 | 已分配 |
······· | ······· | ······· | ······· |
优点:实现简单,无外部碎片。
缺点:a.当用户程序太大时,可能所有的分区都不能满足需求,此时不得不采用覆盖技术来解决,但这又会降低性能; b.会产生内部碎片,内存利用率低。
动态分区分配又称为可变分区分配。这种分配方式不会预先划分内存分区,而是在进程装入内存时, 根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。
动态分区分配核心问题:
1.系统要用什么样的数据结构记录内存的使用情况?
2.当很多个空闲分区都能满足需求时,应该选择哪个分区进行分配?
3.如何进行分区的分配与回收操作?
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 20 | 8 | 空闲 |
2 | 10 | 32 | 空闲 |
3 | 4 | 60 | 空闲 |
空闲分区链:
空闲分区链:每个分区的起始部分和末尾部分分别设置前向指 针和后向指针。起始部分处还可记录分区大小等信息
现有进程5(4MB)调入内存,应该用最大的分区进行分配?还是用最小的分区进行分配?又或是用地址最低的部分进行分配?
把一个新作业装入内存时,须按照一定的动态分区分配算法,从空闲分区表(或空闲分区链)中选出一个分区分配给该作业。
此时分区表是
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 10 | 32 | 空闲 |
2 | 4 | 60 | 空闲 |
假设此时进程4运行结束,将进程4占用的4M内存空间回收,而后面有一块10M的相邻空闲区
此时空闲分区表:
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 14 | 28 | 空闲 |
2 | 4 | 60 | 空闲 |
两个相邻的空闲分区合并为一个
此时空闲分区表:
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 20 | 8 | 空闲 |
2 | 10 | 32 | 空闲 |
假设此时进程3运行结束,将进程3占用的18M内存空间回收,而前面有一块10M的相邻空闲区
此时空闲分区表:
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 20 | 8 | 空闲 |
2 | 28 | 32 | 空闲 |
两个相邻的空闲分区合并为一个
情况三:回收区的前、后各有一个相邻的空闲分区
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 20 | 8 | 空闲 |
2 | 10 | 32 | 空闲 |
3 | 4 | 60 | 空闲 |
假设此时进程4运行结束,将进程4占用的4M内存空间回收,而后面有一块10M的相邻空闲区,前面有一块20M的内存空间
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 34 | 8 | 空闲 |
2 | 4 | 60 | 空闲 |
三个相邻的空闲分区合并为一个
情况四:回收区的前、后都没有相邻的空闲分区
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 4 | 60 | 空闲 |
假设此时进程2运行结束,将进程2占用的14M内存空间回收,而后面有一块4M的不相邻空闲区
此时空闲分区表:
分区号 | 大小(MB) | 起始地址(M) | 状态 |
---|---|---|---|
1 | 14 | 28 | 空闲 |
2 | 4 | 60 | 空闲 |
注:各表项的顺序不一定按照地址递增顺序排列,具体的排列方式需要依据动态分区分配算法来确定。
动态分区分配又称为可变分区分配。这种分配方式不会预先划分内存分区,而是在进程装入内存时, 根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。
动态分区分配没有内部碎片,但是有外部碎片。
内部碎片,分配给某进程的内存区域中,如果有些部分没有用上。 外部碎片,是指内存中的某些空闲分区由于太小而难以利用。
如果内存中空闲空间的总和本来可以满足某进程的要求, 但由于进程需要的是一整块连续的内存空间,因此这些 “碎片”不能满足进程的需求。 可以通过紧凑(拼凑,Compaction)技术来解决外部碎片。
算法思想:每次都从低地址开始查找,找到第一个能满足大小的空闲分区。
如何实现:空闲分区以地址递增的次序排列。每次分配内存时顺序查找空闲分区链(或空闲分区 表),找到大小能满足要求的第一个空闲分区。
算法思想:由于动态分区分配是一种连续分配方式,为各进程分配的空间必须是连续的一整片区域。因此为了保证当“大进程”到来时能有连续的大片空间,可以尽可能多地留下大片的空闲区, 即,优先使用更小的空闲区。
如何实现:空闲分区按容量递增次序链接。每次分配内存时顺序查找空闲分区链(或空闲分区 表),找到大小能满足要求的第一个空闲分区。
缺点:每次都选最小的分区进行分配,会留下越来越多的、很小的、难以利用的内存块。因此这种方法会产生很多的外部碎片
算法思想:为了解决最佳适应算法的问题——即留下太多难以利用的小碎片,可以在每次分配时优先使用最大的连续空闲区,这样分配后剩余的空闲区就不会太小,更方便使用。
如何实现:空闲分区=按容量递减次序链接。每次分配内存时顺序查找空闲分区链(或空闲分区 表),找到大小能满足要求的第一个空闲分区。
缺点:每次都选最大的分区进行分配,虽然可以让分配后留下的 空闲区更大,更可用,但是这种方式会导致较大的连续空闲区被 迅速用完。如果之后有“大进程”到达,就没有内存分区可用了。
算法思想:首次适应算法每次都从链头开始查找的。这可能会导致低地址部分出现很多小的空闲分区,而每次分配查找时,都要经过这些分区,因此也增加了查找的开销。如果每次都从上次查找结束的位置开始检索,就能解决上述问题。
如何实现:空闲分区以地址递增的顺序排列(可排成一个循环链表)。每次分配内存时从上次查找结束的位置开始查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
首次适应算法每次都要从头查找,每次都需要检索低地址的小分区。 但是这种规则也决定了当低地址部分有更小的分区可以满足需求时, 会更有可能用到低地址部分的小分区,也会更有可能把高地址部分的大分区保留下来(最佳适应算法的优点)
邻近适应算法的规则可能会导致无论低地址、高地址部分的空闲分区都有相同的概率被使用,也就导致了高地址部分的大分区更可能被使用,划分为小分区,最后导致无大分区可用(最大适应算法的缺点)
综合来看,四种算法中,首次适应算法的效果反而更好