直接通过程序来分析,理论不说,网上一大堆:
下面来看看地址的转移过程 ,gcc编译后对a.out 进行objdump 反汇编结果如下(删除一部分汇编代码):1.物理内存空间:主板上的内存条所提供的内存空间就为物理地址空间
2.物理地址:每个内存单元的实际地址
3.虚拟地址空间:我们自己看到的内存空间(从汇编语言来看)
4.CR1:未定的控制寄存器
5.CR2:页故障线性地址寄存器
6:CR3:页目录基址寄存器,保存页目录的物理地址
..
继续上面的内容:
分配给test()这个函数的起始地址为
Linux中最常见的可执行文件的格式为ELF(Executable and Linkable Format) .在ELF格式的可执行代码中,ld总是从地址0x8000000 开始安排程序的"代码段" 对每个程序都这样,至于程序执行时在物理内存中的实际地址,则在内核为其建立内存映射时临时分配, 具体地址取决于当时所分配的物理内存页面.
假设CPU开始执行main()函数中的
于是转移到虚拟地址4004c4 ,Linux内核设计的段式映射机制把这个地址原封不动的映射为线性地址,接着就进入页式映射过程.
每当调度程序选择一个进程来运行时,内核就要为即将运行的进程设置好控制寄存器CR3,而MMU的硬件总是从CR3中取得指向当前页目录的指针.
当程序转移到地址4004c4 的时候,进程正在运行中,CR3指向进程的页目录.根据线性地址 4004c4 最高10位,就可以找到相应的目录项,把4004c4按二进制展开:
0000 0000 00100 0000 0000 0100 1100 0100
最高10位0000 0000 00即10进制0 ,于是以0为下标在页目录中找到其目录项,这个目录项中的高20位指向一个页表,CPU在这20位后填12个0后就得到该页表的物理地址.
找到页表后,CPU再来找线性地址的中间10位为100 0000 000,10进制为 512
从CPU以512为下标在页表中找到相应的页表项,取出其高20位,假如为0x356,然后与线性地址的最低12位0x4c4拼接起来
就得到test()函数的入口物理地址0x3564c4,test()的执行代码就存储在这里.