操作系统知识点整理笔记(三)

  • 内存是用于存放数据的硬件。程序执行前需要先放到内存中才能被CPU处理。
  • 若计算机按字节编址,则每个存储单元大小为1字节,即1B(8个二进制位)。若字长位16位的计算机按字编址,则每个存储单元大小为1个字,每个字的大小为16个二进制位。
  • 。一台电脑有4GB内存指该内存中可以存放 个字节,若是按字节编址,则有个存储单元,且需要用32个二进制位来标识这些地址:。
进程运行原理-指令
  • 相对地址又称为逻辑地址绝对地址又称为物理地址
进程运行得基本原理
  • 装入模块装入内存,有3种方式完成逻辑地址到物理地址的转换:
    • 绝对装入:在编译时,若知道程序将放到内存中的哪个位置,编译程序将产生绝对地址的目标代码。装入程序按照装入模块中的地址,将程序和数据装入内存。缺点:只适用于单道程序环境。程序中使用的绝对地址,可在编译或汇编时给出,也可由程序员直接赋予。通常情况下都是在编译或汇编时转换为绝对地址。
    • 静态重定位(又称为可重定位装入):编译、链接后的装入模块的地址都是从0开始的,指令中使用的地址,数据存放的地址都是相对于起始地址而言的逻辑地址。可根据内存的当前情况,将装入模块装入到内存的适当位置。装入时对地址进行重定位,将逻辑地址变换为物理地址(地址变换时在装入时一次完成的)。
      • 特点:在一个作业装入内存时,必须分配其要求的全部内存空间,若没有足够的内存,就不能装入该作业。作业一旦进入内存后,在运行期间就不能再移动,也不能申请内存空间。用于早期的多道批处理操作系统。
    • 动态重定位(动态运行时装入):编译、链接后的装入模块的地址都是从0开始的。装入程序把装入模块装入内存后,并不会立即把逻辑地址转换为物理地址,而是把地址转换推迟到程序真正要执行时才执行。因此,装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器(存放装入模块存放的起始位置)的支持。
      • 特点:允许程序在内存中发生移动,并且可将程序分配到不连续的存储区中;在程序运行前只需装入它的部分代码即可投入运行,然后在程序运行期间,根据需要动态申请分配内存;便于程序段的共享,可以向用户提供一个比存储空间大得多得地址空间。
程序链接的三种方式
  • 内存保护可采取2种方法:
    • 在CPU中设置一对上、下线寄存器,存放进程的上、下限地址。进程的指令要访问某个地址时,CPU检查是否越界。
    • 采用重定位寄存器(又称基址寄存器)界地址寄存器(又称限长寄存器)进行越界检查。重定位寄存器中存放的是进程的起始物理地址。界地址寄存器中存放的是进程的最大逻辑地址
  • 覆盖技术:将程序分为多个段(多个模块)。内存中分为一个固定区若干个覆盖区。常用的段(放在固定区,调入后就不再调出,除非运行结束)驻内存,不常用的段(放在覆盖区)需要时调入内存,用不到时调出内存。
    • 缺点:必须由程序员声明覆盖结构,操作系统完成自动覆盖。对用户不透明,增加了用户编程的负担。只用于早期的操作系统当中。
覆盖技术
  • 交换技术:内存空间紧张时,系统将内存中某些进程暂时换出外存,把外存中某些已具备运行条件的进程换入内存(进程在内存于磁盘间动态调度)。
    • 具有对换功能的操作系统中,通常把磁盘空间分为文件区对换区两部分。
      • 文件区主要用于存放文件,主要追求存储空间的利用率,因此对文件区空间的管理采用离散分配的方式;
      • 对换区的空间只占磁盘空间的小部分,被换出的进程数据就存放在对换区。由于对换的速度直接影响到系统的整体速度,因此对换区空间的管理主要追求换入换出的速度,通常对换区采用连续分配的方式。总之,对换区的I/O速度比文件区更快
    • 交换通常在许多进程运行且内存吃紧时进行,而系统负荷降低就暂停。例如:发现许多进程运行时经常发生缺页,就说明内存紧张,此时可以换出一些进程;若缺页率明显下降,就可以暂停换出。
    • 可优先换出阻塞进程;可换出优先级低的进程;为了防止优先级低的进程在被调入内存后很快又被调出,有得系统还会考虑进程在内存的驻留时间等。注意:PCB会常驻内存,不会被换出外存。
覆盖与交换
  • 连续分配:指为用户进程分配的必须是一个连续的内存空间
  • 单一连续分配方式中,内存被分为系统区用户区。内存中只能有一道用户程序,用户程序独占整个用户区空间。
    • 系统区通常位于内存的低地址部分,用于存放操作系统相关数据;
    • 用户区用于存放用户进程相关数据。
    • 优点:实现简单;无外部碎片;可以采用覆盖技术扩充内存;不一定需要采取内存保护(eg:早期的PC操作系统MS-DOS)
    • 缺点:只能用于单用户、单任务的操作系统中;有内部碎片;存储器利用率极低。
单一连续分配
  • 固定分区分配:将整个用户空间划分为若干个固定大小的分区,在每个分区中只装入一道作业,这就形成了最早的、最简单的一种可运行多道程序的内存管理方式。
    • 分区大小相等:缺乏灵活性,但是很适合用于用一台计算机控制多个相同对象的场合(比如:钢铁厂有n个相同的炼钢炉,就可把内存分为n个大小相等的区域存放n个炼钢炉控制程序)
    • 分区大小不相等:增加了灵活性,可以满足不同大小的进程需求。根据常在系统中运行的作业大小情况进行划分(比如:划分多个小分区、适量中等分区、少量大分区)
    • 操作系统需要建议一个数据结构:分区说明表,来实现各个分区的分配与回收。每个表项对应一个分区,通常按分区大小排列。每个表项包括对应分区的大小起始地址状态(是否已分配)。当某用户程序要装入内存时,由操作系统内核程序根据用户程序大小检索该表,从中找到一个能满足大小的、未分配的分区,将之分配给该程序,然后修改状态为“已分配”。
    • 优点:实现简单,无外部碎片
    • 缺点:①当用户程序太大时,可能所有的分区都不能满足需求,此时不得不采用覆盖技术来解决,但这又会降低性能;②会产生内存碎片,内存利用率低。
固定分区分配
分区说明表
  • 动态分区分配又称为可变分区分配。这种分配方式不会预先划分内存分区,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此,系统分区的大小和数目是可变的。
    • 系统用2种常用的数据结构来记录内存的使用情况:
      • 空闲分区表:每个空闲分区对应一个表项;表项中包含分区号、分区大小、分区起始地址等信息。
      • 空闲分区链:每个分区的起始部分和末尾部分分别设置前向指针和后向指针,起始部分处还可记录分区大小等信息。
    • 动态分区分配没有内部碎片,但是有外部碎片。可以通过紧凑(拼接,Compaction)技术来解决外部碎片。
      • 内部碎片:分配给某进程的内存区域中,有些部分没有用上。
      • 外部碎片:内存中的某些空闲分区由于太小而难以利用。
动态分区分配的2种数据结构
动态分区进行分区的分配
动态分区进行分区的回收
  • 动态分区分配有4种算法:
    • 首次适应算法(First Fit):将空闲分区以地址递增的次序排列,每次都从低地址开始查找,找到第一个能满足大小的空闲分区。
    • 最佳适应算法(Best Fit):将空闲分区以容量递增的次序链接,每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
      • 缺点:每次都选最小的分区进行分配,会留下越来越多的、很小的、难以利用的内存块,因此,这种方法会产生很多外部碎片
    • 最坏适应算法(Worst Fit):将空闲分区以容量递减的次序链接,每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
      • 缺点:每次都选最大的分区进行分配,虽然可以让分配后留下的空闲区更大,更可用,但是这种方法会导致较大的连续空闲区被迅速用完。若之后有“大进程”到达,则没有可用的内存分区了。
    • 邻近适应算法(Next Fit):将空闲分区以地址递增的次序排列(可排成一个循环链表),每次分配内存时从上次查找结束的位置开始查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
      • 优点:首次适应算法每次都要从头查找,每次都需要检索低地址的小分区。但这种规则也决定了当低地址部分有更小的分区可以满足需求时,会更有可能用到低地址部分的小分区,也会更有可能把高地址部分的大分区保留下来(最佳适应算法的优点)。
      • 缺点:这种算法规则可能会导致无论低地址、高地址部分的空闲分区都有相同概率被使用,也就导致了高地址部分的大分区更可能被使用,划分为小分区,最后导致无大分区可用(最大适应算法的缺点)。
    • 综上所述,首次适应算法的效果反而更好。
分区分配的4种算法区别
  • 基本的分页存储管理:把内存分为一个个相等的小分区,再按照分区大小把进程拆分成一个个小部分。将内存空间分为一个个大小相等的分区(比如:每个分区4KB),每个分区就是一个页框(或称为页帧内存块物理块)。每个页框有一个编号,即页框号,页框号从0开始
  • 将用户进程的地址空间也分为与页框大小相等的一个个区域,称为页面。每个页面也有一个编号,即页号,页号也是从0开始。注意:进程的最后一个页面可能没有一个页框那么大。因此,页框不能太大,否则可能产生过大的内存碎片
  • 操作系统以页框为单位为各个进程分配内存空间。进程的每个页面分别放入一个页框中,即进程的页面与内存的页框有一一对应的关系。各个页面不必连续存放,也不必按先后顺序来,可以放到不相邻的各个页框中。
  • 若每个页面的大小为,用二进制数表示逻辑地址,则末尾K位即为页内偏移量,其余部分就是页号。若有K位表示页内偏移量,则说明该系统中一个页面的大小是个内存单元。若有M位表示页号,则说明在该系统中,一个进程最多允许有个页面。
页面与页框
地址转换
计算技巧
  • 操作系统建立了一张页表来获得一个进程的每个页面在内存中的位置。
页表
  • 基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址,通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F页表长度M。进程未执行时,页表的始址和页表长度放在进程控制块(PCB)中,当进程被调度时,操作系统内核会把它们放在页表寄存器中。
基本地址变换机构
  • 时间局部性:若执行了程序中的某条指令,则不久后这条指令有可能再次被执行;若某个数据被访问过,不久之后该数据很可能再次被访问(因为程序中存在大量的循环)。
  • 空间局部性:一旦程序访问了某个存储单元,不久之后,其附近的存储单元也很有可能被访问(因为很多数据在内存中都是连续存放的)。
  • 快表,又称为联想寄存器(TLB):是一种访问速度比内存快很多的高速缓冲存储器,用来存放当前访问的若干页表项,以加速地址变换的过程。与此对应,内存中的页表常称为慢表
快表查询
引入快表后,地址的变换过程
使用与未使用快表的区别
  • 单级页表的问题:
    • 页表必须连续存放,因此当页表很大时,需要占用很多个连续的页框;
    • 没有必要让整个页表常驻内存,因为进程在一段时间内可能只需要访问某几个特定的页面。
    • 解决方案:可将长长的页表进行分组,使每个内存块刚好可以放入一个分组(比如上个例子中,页面大小为4KB,每个页表项为4B,每个页面可存放1K个页表项,因此每1K个连续的页表项为1组,每组刚好占一个内存块,再将各组离散地放到各个内存块中),另外,要为离散分配地页表再建立一张页表,称为页目录表,或称外层页表顶层页表
两级页表的原理、地址结构
  • 进程的地址空间:按照程序自身的逻辑关系划分为若干个段,每个段都有一个段名(在低级语言中,程序员使用段名来编程),每段从0开始编址
  • 内存分配规则:以段为单位进行分配,每个段在内存中占据连续空间,但各段之间可以不相邻
  • 分段系统的逻辑地址结构由段号(段名)段内地址(段内偏移量)所组成。
    • 段号的位数决定了每个进程最多可以分几个段;
    • 段内地址位数决定了每个段的最大长度是多少。
  • 程序分为多个段,各段离散地装入内存,为了保证程序能正常运行,就必须能从物理内存中找到各个逻辑段的存放位置。为此,需为每个进程建立一张段映射表,简称段表
段表
分段地址转换过程
  • 信息的物理单位。分页主要为了实现离散分配,提高内存利用率。分页仅仅是系统上的需要,完全是系统行为,对用户是不可见的
  • 信息的逻辑单位。分段主要为了更好地满足用户需求。一个段通常包含着一组属于一个逻辑模块的信息。分段对用户是可见的,用户编程时需要显示地给出段名。
  • 页的大小是固定且由系统决定。段的长度却不固定,决定于用户编写的程序。
  • 分页的用户进程的地址空间是一维的,程序员只需要给出一个记忆符即可表示一个地址。分段的用户进程的地址空间是二维的,程序员在标识一个地址时,既要给出段名,又要给出段内地址。
  • 分段比分页更容易实现信息的共享与保护。
  • 分页(单级页表):第一次访存--查内存中的页表,第二次访存--访问目标内存单元。总共两次访存。分段:第一次访存--查内存中的段表,第二次访存--访问目标内存单元。总共两次访存。与分页系统类似,分段系统中也可以引入快表机构,将近期访问过的段表项放到快表中,这样可以少一次访问,加快地址变换速度。
段页式管理
段页式管理的逻辑结构
段表和页表
段页式管理的地址转换过程
  • 传统存储管理方式的特点:
    • 一次性:作业必须一次性全部装入内存后才能开始运行。这会造成2个问题:①作业很大时,不能全部装入内存,导致大作业无法运行;②当大量作业要求运行时,由于内存无法容纳所有作业,因此只有少量作业能运行,导致多道程序并发度下降
    • 驻留性:一旦作业被装入内存,就会一直驻留在内存中,直到作业运行结束。事实上,在一个时间段内,只需要访问作业的一小部分数据即可正常运行,这就导致了内存中会驻留大量的、暂时用不到的数据,浪费了宝贵的内存资源。
  • 高速缓冲技术:将近期会频繁访问到的数据放到更高速的存储器中,暂时用不到的数据放在更低速存储器中。基于局部性原理,在程序装入时,可以将程序中很快会用到的部分装入内存,暂时用不到的部分留在外存,就可以让程序开始执行。
  • 在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,然后继续执行程序。若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出外存。虚拟内存的实现建立在离散分配的内存管理方式基础上。
  • 虚拟内存的最大容量是由计算机的地址结构(CPU寻址范围)确定的,虚拟内存的实际容量=min(内存和外存容量之和,CPU寻址范围)。如:某计算机的地址结构为32位,按字节编址,内存大小位512MB,外存大小为2GB,则虚拟内存的最大容量为,实际容量为 。
  • 虚拟内存有3个主要特征:
    • 多次性:无需在作业运行时一次性全部装入内存,而是允许被分成多次调入内存。
    • 对换性:在作业运行时无需一直常驻内存,而是允许在作业运行过程中,将作业换入、换出。
    • 虚拟性:从逻辑上扩充了内存的容量,使用户看到的内存容量远大于实际的容量。
  • 请求分页存储管理与基本分页存储管理的主要区别:操作系统不仅要提供请求调页功能,将缺失页面从外存调入内存,也要提供页面置换的功能,将暂时用不到的页面换出外存。
  • 请求分页管理方式:①页表机制;②缺页中断机构;③地址变换机构
页表机制
缺页中断机构
  • 缺页中断是因为当前执行的指令想要访问的目标页面未调入内存而产生的,因此属于内中断。一条指令在执行期间,可能产生多次缺页中断。(如:copy A to B,即将逻辑地址A中的数据复制到逻辑地址B,而A、B属于不同的页面,则有可能产生两次中断)
  • 在具有快表机构的请求分页系统中,访问一个逻辑地址时,若发生缺页,则地址变换步骤是:查快表(未命中)--查慢表(发现未调入内存)--调页(调入的页面对应的表项会直接加入快表)--查快表(命中)--访问目标内存单元。
  • 页面的换入、换出需要磁盘I/O,会有较大的开销,因此好的页面置换算法应该追求更少的缺页率。
  • 页面置换算法有5种:
    • 最佳置换算法(OPT,Optimal):每次选择淘汰的页面将是以后永不使用,或者在最长时间内不再被访问的页面,这样可以保证最低的缺页率。但实际上,只有在进程执行的过程中才能知道接下来会访问到的是哪几个页面。操作系统无法提前预判页面的访问序列,因此,该算法是无法实现的。
    • 先进先出置换算法(FIFO):每次选择淘汰的页面是最早进入内存的页面。实现方法:把调入内存的页面根绝调入的先后顺序排成一个队列,需要换出页面时选择队头页面即可。队列的最大长度取决于系统为进程分配了多少个内存块。
    • 最近最久未使用置换算法(LRU,least recently used):每次淘汰的页面是最近最久未使用的页面。实现方法:赋予每个页面对应的页表项中,用访问字段记录该页面自上次被访问以来所经历的时间t。当需要淘汰一个页面时,选择现有页面中t值最大的,即最近最久未使用的页面。
    • 时钟置换算法(CLOCK)或称最近未用算法(NRU,Not Recently Used):是一种性能和开销比较均衡的算法。 实现方法:为每个页面设置一个访问位,再将内存中的页面都通过链接指针链接成一个循环队列。当某页被访问时,其访问位置为1。当需要淘汰一个页面时,只需检查页的访问位。若是0,则选择该页换出;若是1,则将它置为0,暂不换出,继续检查下一个页面。若第一轮扫描中所有页面都是1,则将这些页面的访问位依次置为0后,再进行第二轮扫描(第二轮扫描中一定会有访问位为0的页面,因此简单的CLOCK算法选择一个淘汰页面最多会经过两轮扫描
    • 改进型的时钟置换算法:简单的时钟置换算法仅考虑到一个页面最近是否被访问过。事实上,若被淘汰的页面没有被修改过,就不需要执行I/O操作写回外存。只有被淘汰的页面被修改过时,才需要写回外存。在其他条件都相同时,应优先淘汰没有修改过的页面,避免I/O操作。修改位=0:页面没有被修改过;修改位=1:页面被修改过。用(访问位,修改位)的形式表示各页面状态。如:(1,1)表示一个页面近期被访问过,且被修改过。
最佳置换算法
先进先出置换算法
最近最久未使用置换算法
时钟置换算法
改进的时钟置换算法
  • 驻留集:指请求分页存储管理中给进程分配的物理块的集合。在采用了虚拟存储技术的系统中,驻留集大小一般小于进程的总大小。若驻留集太小,则会导致缺页频繁,系统要花大量的时间来处理缺页,实际用于进程推进的时间很少;若驻留集太大,则会导致多道程序并发度下降,资源利用率降低。
  • 固定分配:操作系统为每个进程分配一组固定数目的物理块,在进程运行期间不再改变,即驻留集大小不变。
  • 可变分配:先为每个进程分配一定数目的物理块,在进程运行期间,可根据情况做适当的增加或减少,即驻留集大小可变
  • 局部置换:发生缺页时只能选进程自己的物理块进行置换。
  • 全局置换:可以将操作系统保留的空闲物理块分配给缺页进程,也可将别的进程持有的物理块置换到外存,再分配给缺页进程。
  • 固定分配局部置换:系统为每个进程分配一定数量的物理块,在整个运行期间都不改变。若进程在运行中发生缺页,则只能从该进程在内存中的页面中选出一页换出,然后再调入需要的页面。缺点:很难在刚开始就确定应为每个进程分配多少个物理块才算合理。采用这种策略的系统可以根据进程的大小、优先级、或者根据程序员给出的参数来确定为一个进程分配的内存块数。
  • 可变分配全局置换:刚开始会为每个进程分配一定数量的物理块。操作系统会保持一个空闲物理块队列。当某进程发生缺页时,从空闲物理块中取出一块分配给该进程;若已无空闲物理块,则可选择一个未锁定的页面换出外存,再将该物理块分配给缺页的进程。采用这种策略时,只要某进程发生缺页,都将获得新的物理块,仅当空闲物理块用完时,系统才选择一个未锁定的页面调出。被选择调出的页可能是系统中任何一个进程中的页,因此这个被选中的进程拥有的物理块会减少,缺页率会增加
  • 可变分配局部置换:刚开始会为每个进程分配一定数量的物理块。当某进程发生缺页时,只允许从该进程自己的物理块中选出一个进行换出外存。若进程在运行中频繁地缺页,系统会为该进程多分配几个物理块,直至该进程缺页率趋势适当程度;反之,若进程在运行中缺页率特别低,则可适当减少分配给该进程地物理块。
  • 何时调入页面:
    • 预调页策略:根据局部性原理,一次调入若干个相邻的页面可能比一次调入一个页面更高效。但若提前调入的页面中大多数都没被访问过,则又是低效的。因此,可以预测不久之后可能访问到的页面,将它们预先调入内存,但目前预测成功率只有50%,故这种策略主要用于进程的首次调入(运行前调入),由程序员指出应该先调入哪些部分。
    • 请求调页策略:进程在运行期间发现缺页时才将所缺页面调入内存(运行时调入)。这种策略调入的页面一定会被访问到,但由于每次只能调入一页,而每次调页都要磁盘I/O操作,因此I/O开销较大。
从何处调入页面
  • 抖动(颠簸)现象:刚刚换出的页面马上又要换入内存,刚刚换入的页面马上又要换出外存。主要原因:进程频繁访问的页面数目高于可用的物理块数(分配给进程的物理块不够
  • 工作集:在某段时间间隔里,进程实际访问页面的集合。

你可能感兴趣的:(操作系统知识点整理笔记(三))