内存管理讲解

内存管理子系统是操作系统中最重要的部分之一。

0_01291925244503.jpg

1、地址类型
物理地址：指出现在CPU外部地址总线上的寻址物理内存的地址信号，是地址变换的最终结果，是内存中实实在在存在的硬件地址。
逻辑地址：程序代码经过编译后在汇编程序中使用的地址,C/C++程序中取地址求出来的地址就是逻辑地址。
虚拟地址（线性地址）：在32位CPU架构下，可以表示4G的地址空间，用16进制表示就是0x00000000到0xffffffff。只有启动分页机制的时候才有线性地址，如果没有分页机制，那么线性地址就是物理地址。

2、地址转换
CPU要将一个逻辑地址转换为物理地址，需要两步：首先CPU利用段式内存管理单元，将逻辑地址转换成虚拟地址，再利用页式内存管理单元，把虚拟地址最终转换为物理地址。
即MMU（内存控制单元）通过分段单元把一个逻辑地址转为线性地址，接着通过分页单元把线性地址转为物理地址。

3、段式管理
（1）16位cpu的段式管理
16位CPU内部拥有20位的地址线，它的寻址范围就是2的20次方，也就是1M的内存空间。但是16位CPU用于存放地址的寄存器（IP，SP……）只有16位，因此只能访问65536个存储单元，64K。
为了能够访问1M的内存空间，CPU就采用了内存分段的管理模式，并在CPU内部加入了段寄存器。16位CPU把1M内存空间分为若干个逻辑段，每个逻辑段的要求如下：
a、逻辑段的起始地址(段地址)必须是16的倍数，即最后4个二进制位必须全为0。
b、逻辑段的最大容量为64K。

段寄存器---->
段寄存器是为了对内存进行分段管理而增加的，16位CPU有四个段寄存器，程序可同时访问四个不同含义的段。
1)CS+IP:用于代码段的访问，CS指向存放程序的段基址，IP指向下条要执行的指令在CS段的偏移量，用这两个寄存器就可以得到一个内存物理地址，该地址存放着一条要执行的指令。

2)SS+SP：用于堆栈段的访问，SS指向堆栈段的基地址，SP指向栈顶，可以通过SS和SP两个寄存器直接访问栈顶单元的内存物理位置。

3)DS+BX：用于数据段的访问。DS中的值左移四位得到数据段起始地址，再加上BX中的偏移量，得到一个存储单元的物理地址。

4)ES+BX：用于附加段的访问。ES中的值左移四位得到附加段起始地，再加上BX中的偏移量，得到一个存储单元的物理地址。

物理地址的形成方式--->
由于段地址必须是16的倍数，所以值的一般形式为XXXX0H，即前16位二进制位是变化的，后四位是固定的0，鉴于段地址的这种特性，可以只保存前16位二进制位来保存整个段基地址，所以每次使用时要用段寄存器左移补4个0（乘以16）来得到实际的段地址。
在确定了某个存储单元所属的段后，只是知道了该存储单元所属的范围（段地址->段地址+65536)，如果想确定该内存单元的具体位置，还必须知道该单元在段内的偏移。有了段地址和偏移量，就可以唯一的确定内存单元在存储器中的具体位置。
而，逻辑地址=段内偏移量
所以，由逻辑地址得到物理地址的公式为：PA=段寄存器的值*16+逻辑地址

（2）32位cpu的段式管理

段式内存管理（32位cpu）

32位pc的内存管理依然采用“分段”的管理模式，物理地址同样由段地址和偏移量组成。但既然分为32位和16位，就肯定有不同之处，32位pc采用了两种不同的工作方式：实模式和保护模式。
1）实模式
在实模式下，32位CPU的内存管理与16位CPU是一致的。最大寻址空间1MB，最大分段64KB。
2）保护模式
段基地址长达32位，每个段的最大容量可达4G，段寄存器的值是段地址的“选择器”(Selector)，用该“选择器”从内存中得到一个32位的段地址，存
储单元的物理地址就是该段地址加上段内偏移量。

3、分页管理
线性地址被分为固定长度的组，称为页。例如，32位的机器，线性地址最大可为4G，如果用4kb为一个页来划分，这样整个线性地址就被划分为2的20次方个页。
分页单元把所有的物理内存也划分为固定长度的管理单位，它的长度一般与线性地址页是相同的。

分页管理中的线性地址和物理地址

分页管理

如上图所示，每一个32位的线性地址被划分为3部分：页目录索引（10位）、页表索引（10位）、偏移（12位）。

分页管理的步骤---->
1）装入进程的页目录地址（操作系统在调度进程时，把这个地址装入CR3）
2)根据线性地址的前十位，在页目录中，找到对应的索引项，页目录中的项是一个页表的地址
3）根据线性地址的中间十位，在页表中找到页的起始地址
4）将页的起始地址与线性地址与线性地址的最后12位相加，得到物理地址

4、linux页式管理

linux页式管理

Linux操作系统采用虚拟内存管理技术，使得每个进程都有独立的进程地址空间，该空间是大小为3G，用户看到和接触的都是虚拟地址，无法看到实际的物理地址。利用这种虚拟地址不但能起到保护操作系统的作用，而且更重要的是用户程序可使用比实际物理内存更大的地址空间。
Linux将4G的虚拟地址空间划分为两个部分——用户空间与内核空间。用户进程通常情况下只能访问用户空间的虚拟地址，不能访问内核空间。例外情况是用户进程通过系统调用访问内核空间。

虚拟内存

如上图展示了一个Linux进程的地址空间的组织结构，对于32位进程来说，代码段从地址0x08048000开始；对于64位进程来说，代码段从0x00400000开始。
关于上图堆和栈的区别--->

stack:由系统自动分配，地址增长方向是从高到低。第一个进栈的是主函数中的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数（以从右往左的方式入栈），然后是函数中的局部变量
heap:需要程序员自己申请，并指明大小。以链表的形式进行管理，地址增长方向是从低到高。

  char *p1 = (char *)malloc(10);//c语言申请堆的方式
  char *p2 = new char(10);//在c++中申请堆的方式
  注：p1 p2本身在栈中，而分配的10字节则在堆区。

注：关于栈是向低地址增长，而堆向高地址增长，这样设计可以使得堆和栈可以充分地利用空闲的地址空间

程序执行时的内存分配情况 -->

 int a = 0; //a 在全局已初始化数据区 
 char *p1; //p1 在 BSS 区（未初始化全局变量） 
 main() 
 { 
      int b; //b 在栈区 
      char s[] = "abc"; 
      //s 为数组变量，存储在栈区， //“abc”为字符串常量，存储在.rodata常量字符串区
      char *p1，p2; //p1、p2 在栈区 
      char *p3 = "123456"; //123456\0  在.rodata常量字符串区，p3 在栈区 
      static int c =0； //c为局部静态数据，data数据区 
      p1 = (char *)malloc(10);   //分配得来的 10 个字节的区域在堆区 
      p2 = (char *)malloc(20); //分配得来的 20 个字节的区域在堆区 
      free(p1); 
      free(p2); 
 }

 ------end

ps:小小总结，望对在路上的你有所帮助。

内存管理讲解

你可能感兴趣的:(内存管理讲解)