页表工作原理详解

文章目录

  • Ⅰ. 前言
  • Ⅱ. 页表的工作方式
      • 在讲解页表工作原理之前,我们先来完善一些知识:
      • 页表的知识铺垫:
      • 页表其实是这样子工作的:
  • Ⅲ. CR3寄存器

Ⅰ. 前言

​ 进入了线程这部分内容,我们需要了解更多的知识,大体就是线程概念,线程与进程的区别和联系、线程控制、线程创建、线程终止、线程等待、线程分离、线程安全、线程同步,除此之外我们还得学习互斥量、条件变量、POSIX信号量以及读写锁,最后我们还会介绍一些关于多进程的设计模式比如单例模式等,然后还会了解一下线程池的概念!

​ 首先我们不会马上来讲线程的概念,因为不太好理解,我们先引入一个知识点,就是我们之前一直在谈论的页表,它的工作方式大概是怎么样的呢,我们一起来了解一下!

Ⅱ. 页表的工作方式

Linux从头学15:【页目录和页表】-理论 + 实例 + 图文的最完全、最接地气详解

地址的简单解释:

物理地址: 物理地址就是内存单元的绝对地址,比如一个 128MB 的 DRAM 内存条插在计算机上,物理地址 0x0000 就表示内存条的第 1 个存储单元,0x0010 就表示内存条的第 17 个存储单元,不管 CPU 内部怎么处理内存地址,最终访问的都是内存单元的物理地址。

虚拟地址:虚拟地址是操作系统给运行在用户态的应用程序看到的地址,每一个虚拟地址,如果有一个对应的物理地址,那么就是一个合法的虚拟地址,应用程序实际访问的是其对应的物理地址;否则就是一个非法的虚拟地址。一旦应用程序访问非法的虚拟地址,CPU 当然就会产生异常了。一旦出现这样的异常,操作系统就会及时进行处理,甚至是杀死掉这个应用程序。虚拟地址物理地址的对应关系,一般是通过页表来实现。


​ 简单的说,页表就是一个存储物理页地址的表,我们知道,现在的程序使用的都是虚拟内存CPU 在取指令或者取数据的时候使用的是虚拟地址,为了能够从内存中取得数据,需要将虚拟地址转换为物理地址,虚拟地址和物理地址之间的映射关系就保存在页表中。每个进程都有自己的 页目录页表

如何看待页表:

  • 地址空间是进程能看到的资源窗口。
  • 页表决定进程真正拥有资源的情况。
  • 合理的对地址空间+页表进行资源划分,我们就可以对一个进程所有的资源进行分类。

​ 仔细思考一下,我们的虚拟内存一共有多大,假设这是一台 32 位机器,那么就有 2 32 2^{32} 232 这么多大的寻址范围,如果我们的页表是通过记录每个虚拟内存对应的物理内存的转化地址的话,那么我们一共得有 2 32 2^{32} 232 这么多个地址,一共算下来就是 4GB,除此之外还得加上一些属性比如是否命中、RWX权限、U/K权限等等假设一共 6 个字节,那么一共就是 24GB,光光一个页表就得 24GB,我们多开几个进程,那么不会直接崩了❓❓❓

在讲解页表工作原理之前,我们先来完善一些知识:

  • 物理内存其实也是需要被管理的,而它肯定也是一种数据结构,被操作系统维护的,通常来说物理内存被划分为一页一页,每页大小是 4KB,最后通过 mem 数组就能来维护这些页,而这些页我们称之为页框!如下:

    struct Page {
        // 物理内存的属性 -- 一般为4KB
    }
    struct Page mem[size]; // 通过mem数组来维护被划分出来的每一页
    
  • 磁盘上的文件其实也是被划分为每一页每一页来进行管理,比如说一个可执行文件,其实不是简简单单的从文本文件编译成二进制文件的,首先,这个可执行文件里面所采用的地址其实都是虚拟地址,其次,我们编译好的程序其实都得按 4KB 为一个单位进行划分,一般这个 4KB 的区域我们叫做页帧

  • 这也就是为什么我们之前在讲 IO 的时候谈到 磁盘与物理内存的交互单位为 4KB,其实就是因为它们都是通过页框和页帧来交互的!

    页表工作原理详解_第1张图片

  • 除此之外,因为有了管理物理内存的数据结构,所以因此有了对应的管理物理内存的算法,比如说伙伴系统,这里了解即可!【全网首发】深度剖析 Linux 伙伴系统的设计与实现

页表的知识铺垫:

  • 操作系统在加载用户程序的时候,不仅仅需要分配物理内存,来存放程序的内容;而且还需要分配物理内存,用来保存程序的页目录和页表。
  • 其实页表不是单一的,而是以 多级页表的方式存在的。第一层就是一个页目录,而页目录的每一个表项指向对应的页表,叫做 二级页表。也就是说每个表项中存放着每个页表的起始地址!
  • 一个页表中一共有 1024 个表项,每一个页表项占用 4 个字节,所以一个页表就占用 4KB 的物理内存空间,正好是一个物理页的大小。所以一个 页表/页目录 可以覆盖 4MB 的物理内存空间(1024 * 4 KB)
  • 一个应用程序是不可能完全使用全部的 4GB 空间的,也许只要几十个页表就可以了。例如:一个用户程序的代码段、数据段、栈段,一共就需要 10MB 的空间,那么使用 3 个页表就足够了,加上页目录,一共需要 16KB 的空间。
  • 虚拟存储的实现需要依靠硬件的支持,对于不同的 CPU 来说是不同的,但是几乎所有的硬件都采用一个加 MMU(Memory Management Unit) 的部件来进行页映射!页表工作原理详解_第2张图片

页表其实是这样子工作的:

​ 假设这是一个 32 位机器,那么我们的虚拟内存中每个虚拟地址就是 32 个比特位也就是 4 个字节,但是这 4 个字节不是简简单单的存放地址的,而是==①将高位的 10 个比特位作为一部分==,这部分的数据大小范围就是 2 10 2^{10} 210 字节也就是 1KB ,称为 页目录索引,首先这个索引会根据去页目录中索引到对应的位置,因为在页目录中,它有1024 个页表项,每一个表项指向一个页表的起始地址也就是物理地址。

​ 通过页目录和高位的十个比特位找到对应的页表,可以索引到对应的二级页表,每个二级页表中又有 1024 个页表项,其中每个页表项中存放的是对应的物理内存中某个页框的物理起始地址。这个时候就轮到 ②虚拟地址从高位第 11~20 位一共 10 个比特位作为一部分,这一部分称为 页表索引指向当前二级页表中的某个页表项的具体位置!

​ 通过二级页表和第二部分比特位,可以索引到物理内存某一页框的起始地址,这个时候第三部分就要登场了,③虚拟地址低位的 12 个比特位作为一部分,这一部分称为 页内偏移,起始也就是在这个页框中的 偏移量,因为我们定位的目的是 寻找物理地址也就是这 n 个字节(具体是多少字节得看使用的是什么类型的数据),所以肯定要具体到这个偏移量位置处。这就是页表的工作流程了!

​ 我们还可以发现,为什么我们对物理内存和磁盘都是按 4KB 作为单位划分呢 ❓❓❓

​ 其实就是因为这个页内偏移的大小范围是 12 个比特位,就是 4096 也就是 4KB,所以这都是为了结构而产生的!

​ 下面我们通过图片的形式来大概描述一下页表的工作方式:

页表工作原理详解_第3张图片

​ 但是其实页表页目录的关系更像是多叉树的关系:

页表工作原理详解_第4张图片

​ 上图中少画了一个寄存器的步骤,下面我们也可以稍微来了解一些关于页表的寄存器!

Ⅲ. CR3寄存器

​ 现在,所有页表的物理地址被页目录表项指向了,那么页目录的物理地址,处理器是怎么知道的呢❓❓❓

​ 答案就是通过 CR3 寄存器,也叫做: PDBR(Page Table Base Register)这个寄存器中,保存了当前正在执行的那个任务的页目录地址。

​ 每个任务(程序)都有自己的页目录和页表,页目录表的地址被记录在任务的 TSS 段中。

​ 当操作系统调度任务的时候,处理器就会找到即将执行的新任务的 TSS 段信息,然后把新任务的页目录开始地址更新到 CR3 寄存器中。当新任务的指令开始被执行时,处理器在获取指令、操作数据时,操作的是线性地址。

​ 页处理单元就会从 CR3 寄存器中保存的页目录表开始,把这个线性地址最终转换成物理地址。

当然,处理器中还有一个快表,用来加快从线性地址到物理地址的转换过程。

CR3寄存器的格式如下:

页表工作原理详解_第5张图片

你可能感兴趣的:(Linux,页表,操作系统)