Linux的分页管理机制

本文转自: Linux分页管理机制

 

  直接通过程序来分析:

#include 
voidtest(void){ 
    printf("%s\n","Hello"); 
} 
int main(int argc,char *argv[]) 
{ 
     test(); 
     return 0; 
}

  下面来看看地址的转移过程 ,gcc编译后对a.out 进行objdump反汇编结果如下(删除一部分汇编代码):

 00000000004004c4: 
  4004c4:  55                      push   %rbp 
  4004c5:  48 89 e5                mov    %rsp,%rbp 
  4004c8:  bf e8 05 40 00          mov    $0x4005e8,%edi 
  4004cd:  e8 e6 fe ff ff          callq  4003b8  
  4004d2:  c9                     leaveq  
  4004d3:  c3                      retq    
 
00000000004004d4
: 4004d4: 55 push %rbp 4004d5: 48 89 e5 mov %rsp,%rbp 4004d8: 48 83 ec 10 sub $0x10,%rsp 4004dc: 89 7d fc mov %edi,-0x4(%rbp) 4004df: 48 89 75 f0 mov %rsi,-0x10(%rbp) 4004e3: e8 dc ff ff ff callq 4004c4 4004e8: b8 00 00 00 00 mov $0x0,%eax 4004ed: c9 leaveq 4004ee: c3 retq 4004ef: 90 nop

  左边的地址是虚拟地址,这里涉及到几个概念:

1.物理内存空间:主板上的内存条所提供的内存空间就为物理地址空间

2.物理地址:每个内存单元的实际地址

3.虚拟地址空间:我们自己看到的内存空间(从汇编语言来看)

4.CR1:未定的控制寄存器

5.CR2:页故障线性地址寄存器

6:CR3:页目录基址寄存器,保存页目录的物理地址

 

继续上面的内容:

  分配给test()这个函数的起始地址为 :

00000000004004c4 

  Linux中最常见的可执行文件的格式为ELF(Executable andLinkable Format) .在ELF格式的可执行代码中,ld总是从地址0x8000000 开始安排程序的"代码段" 对每个程序都这样,至于程序执行时在物理内存中的实际地址,则在内核为其建立内存映射时临时分配, 具体地址取决于当时所分配的物理内存页面.

  假设CPU开始执行main()函数中的:

4004e3: e8 dc ffff ff          callq  4004c4  

  于是转移到虚拟地址4004c4 ,Linux内核设计的段式映射机制把这个地址原封不动的映射为线性地址,接着就进入页式映射过程.

每当调度程序选择一个进程来运行时,内核就要为即将运行的进程设置好控制寄存器CR3,而MMU的硬件总是从CR3中取得指向当前页目录的指针.

  当程序转移到地址4004c4的时候,进程正在运行中,CR3指向进程的页目录.根据线性地址4004c4最高10位,就可以找到相应的目录项,把4004c4按二进制展开:

0000 0000 001000000 0000 0100 1100 0100

  最高10位0000 0000 00即10进制0 ,于是以0为下标在页目录中找到其目录项,这个目录项中的高20位指向一个页表,CPU在这20位后填12个0后就得到该页表的物理地址. 

  找到页表后,CPU再来找线性地址的中间10位为1000000 000,10进制为512,从CPU以512为下标在页表中找到相应的页表项,取出其高20位,假如为0x356,然后与线性地址的最低12位0x4c4拼接起来就得到test()函数的入口物理地址0x3564c4,test()的执行代码就存储在这里.

你可能感兴趣的:(内核)