谈一谈内存管理,虚拟内存,多级页表

在说虚拟内存之前,我们先搞清楚下啥是内存。

内存

内存是计算机中重要的部件之一,它是外存(硬盘等)与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。去淘宝上搜搜内存条,那就是计算机中的内存硬件。


内存

物理地址

内存上原始的地址就是物理地址,在x86的32位机子上,最大能支持的物理内存是4GB,它的物理地址就是从[00000000,ffffffff]。

虚拟地址

虚拟地址是物理内存的一个映射,可能虚拟地址00000000对应f0000000,也有可能对应00001000。这主要是为了让每一个进程都拥有相同的地址空间。相当于每个进程都独占CPU,都假设自己用来4GB的物理内存。这样的好处在于写代码时可以从繁琐的内存管理中抽身出来,不用在意当前地址是否被其他进程所占用,因为操作系统会自动将其映射到未使用的物理内存上。也让程序具有了移植性。


虚拟地址和物理地址之间的映射

有了虚拟地址,我们就可以对其映射方法进行设计,从而实现对物理内存的内存管理。

虚拟地址怎么对应到具体的物理地址上呢?

内存管理 + 分页!将物理内存分成一页一页(也可以说一块一块,但块是在文件系统的一个名词),每页的大小固定,通常是4KB一页。4GB的内存就会被分成1024*1024 = 1048576个页。

物理地址分页

怎么记录还有哪些页没被使用,怎么使用这些物理页?从物理内存中取一些内存用来做struct pageInfo数组的存放地址。一共1048576个页,那么就需要1048576个pageInfo。那怎么知道每个pageInfo对应哪个物理页呢?在内核程序中用pageInfo[i]的下标i就可以啦。这相当于物理页的代言人。

pageInfo对应物理页

怎么对这些页进行管理呢,比如标记被使用,权限等?4KB一页就意为着每个页的起始地址最后三位一定是000,4KB = 0x00001000。所以相当于空出了12位,所以可以利用这些位来做页内偏移。前22位就是用来寻找页面,这个由专门的页表进行管理。
虚拟地址的转换:通过查找页表找到页(找到页的代言人PageInfo),再使用页内偏移找到最终的物理地址,页表的结构有哪些呢?
一级页表:物理内存中一共有1048576个页,那么页表就需要总共就是1048576 * 4B = 4M。也就是说我需要4M连续的内存来存放这个页表,也就是一级页表。随着虚拟地址空间的增大,存放页表所需要的连续空间也会增大,在操作系统内存紧张或者内存碎片较多时,这无疑会带来额外的开销。

页表寻找物理页代言人

为什么会出现多级页表呢?
根据一级页表的缺点,多级页表的出现肯定是可以节约内存的。页表寻址是用cr3寄存器来确定一级页表地址的,所以一级页表的地址必须指向确定的物理页,否则就会出现错误,所以如果用一级页表的话,就必须把全部的页表都加载进去。而使用二级页表的话,只需要加载一个页目录表(一级页表),大小为4K,可以管理1024个二级页表。可能你会有疑问,这1024个二级页表也是需要内存空间的,这下反而需要4MB+4KB的内存,反而更多了。
其实二级页表并不是一定要存在内存中的,内存中只需要一个一级页表地址存在cr3寄存器即可,二级页表可以使用缺页中断从外存移入内存。

二级页表

二级页表寻址

你可能感兴趣的:(谈一谈内存管理,虚拟内存,多级页表)