在下面我要讲述3.1中所遇到的问题和迷惑。主要以pmtest1.asm为例,从以下几方面进行分析和讲解。
1)[SECTION .XXX]为何物?
2)全局描述符表(GDT)、描述符(Descriptor)、全局描述符表寄存器(GDTR)、选择子(SelectorXXX) 是什么?用来做什么?
3)实模式下的寻址方式与保护模式下的寻址方式的区别?
4)描述符宏定义和初始化段描述符
5)为加载gdtr做准备工作
6)其他
1、[SECTION .XXX]为何物?
SECTION和SEGMENT的作用相类似,就是代表“段”的意思,从整个程序来看,该程序分为3个模块,分别是[SECTION .gdt]、[SECITON .s16]、[SECTION .s32]三部分。我们很容易就可以看出,其中的[SECTION .gdt]应该是数据段,其他的两个是代码段。通过[SECTION .XXX]将程序分成不同模块,完成不同的功能,使得程序看起来清晰明了。
2、描述符(Descriptor)、全局描述符表(GDT)、全局描述符表寄存器(GDTR)、选择子(SelectorXXX) 是什么?用来做什么?
段,在80X86中,分段机制将内存空间分成一个或者多个线性区域,我们把这些线性区域称为段。我们需要将这些段区分开来,于是分段机制为每个段赋予3个属性,分别是:1、段基址(Base address):指定段在线性地址空间中的开始地址。2、段界限(Limit):表示了段内最大可用偏移量,也就是说它定义了段的长度。3、段属性(Attribute):指定了段的特性,包括:可读,可写或者可执行,特权等级等特性。
段描述符(Descriptor),在程序中,我们需要定义一个数据结构来表示段,它同样包含三个元素,段基址(Base),段界限(Limit),段属性(Attribute),我们称它为段描述符(Descriptor)。段描述符和段就是同一个概念,每个段描述符要占用8个字节的空间。
段描述符表(Descriptor Table),在一个程序中,不只存在一个段(段描述符)。所以我们需要将这些段描述符组织起来,于是定义了一个存储段描述符的数组,称为段描述符表。
段选择子(SelectorXXX),把所有段描述符都存储在段描述符表中,当我们使用其中某一个段的时候,我们并不直接指向该段,而是通过该段描述符在段描述符表中的位置来访问的。故段选择子,就是一个16位的标识符,用来标识该段描述符在描述符表中的位置。
段描述符表可以分为两类,一类是全局描述符表GDT(Global Descriptor Table),一类是局部描述符表LDT(Local Descriptor Table)。系统中供所有的任务共享的是全局描述符表,而不同的任务却是使用自己的局部描述符表。
紧接着,如何让系统知道段描述符表在什么地方呢?处理器提供了内存管理寄存器,分别是全局描述符表寄存器(GDTR)、局部描述符表寄存器(LDTR)。GDTR寄存器中用于存放全局描述符表GDT的32位线性基地址和16位的表的长度值。LDTR寄存器中用于存放局部描述符表LDT的32位线性基地址和16位的表的长度值。通过系统指令,lgdt将GDT的线性基址和长度值加载到GDTR寄存器中,lldt将LDT的线性基址和长度值加载到LDTR寄存器中。
下面我们来分析程序中的代码:
- 11 [SECTION .gdt]
- 12 ; GDT
- 13 ; 段基址, 段界限 , 属性
- 14 LABEL_GDT: Descriptor 0, 0, 0 ; 空描述符
- 15 LABEL_DESC_CODE32: Descriptor 0, SegCode32Len - 1, DA_C + DA_32 ; 非一致代码段, 32
- 16 LABEL_DESC_VIDEO: Descriptor 0B8000h, 0ffffh, DA_DRW ; 显存首地址
- 17 ; GDT 结束
- 18
- 19 GdtLen equ $ - LABEL_GDT ; GDT长度
- 20 GdtPtr dw GdtLen - 1 ; GDT界限
- 21 dd 0 ; GDT基地址
- 22
- 23 ; GDT 选择子
- 24 SelectorCode32 equ LABEL_DESC_CODE32 - LABEL_GDT
- 25 SelectorVideo equ LABEL_DESC_VIDEO - LABEL_GDT
- 26 ; END of [SECTION .gdt]
在程序中,14、15、16行定义了3个段描述符,LABEL_GDT(空描述符),LABEL_DESC_CODE32(32位代码段描述符),LABEL_SESC_VIDEO(显示内存描述符)。每个描述符都包含了3个属性,段基址、段界限、段属性。
将三个描述符组织到一起构成一个全局段描述符表(GDT)。12-17行完成了GDT的定义。
GdtLen为GDT的长度。
GdtPtr为一个数据结构,里面包含两个元素,第一个元素是2 bytes的GDT界限。第二个元素是4 bytes的GDT的基地址。该数据结构与全局描述符表寄存器(GDTR)的数据结构相同,所以在加载GDTR的时候(源代码55行),就是将该GdtPtr加载到GDTR中。
由于第一个段LABEL_GDT是空描述符,它仅仅代表该GDT的初始地址,所以该描述符为空描述符,一般情况下,不为它创建选择子。然后该程序建立了两个选择子(24、25行)SelectorCode32和SelectorVideo,分别对应着这两个段LABEL_SESC_CODE32和LABEL_DESC_VIDEO。
这段代码的结构大家应该明白了吧,下面我要分别介绍段描述符,全局描述符表寄存器,选择子的数据结构。
段描述符(Descriptor)的结构图如下:
段描述符占有8个字节,在这里我只想提醒大家一下,段基址分别占有BYTE2、BYTE3、BYTE4和BYTE7。在下面初始化段描述符的时候需要用到这些。
段选择子的结构图如下图所示:
在这里简单的介绍一下,它使用(15…3)来表示索引,故每一个描述符表最多只用213个描述符,除去第一个空描述符,则可以使用的描述符为8191个描述符。
TI标志着该选择子所指向的段描述符是全局描述符,还是局部描述符。当TI=0时,表示全局描述符,当TI=1时,表示局部描述符。
RPL请求优先级,稍后下一节将会提到。
全局描述符表寄存器(GDT)的结构图如下所示:
在这里,你可以和上面程序中的GdtPtr数据结构做比较,是不是格式相同。2个字节表示GDT界限,4个字节表示GDT基地址。
3、实模式下的寻址方式与保护模式下的寻址方式有什么不同?
在实模式下,也就是在8086系统下的寻址方式。 Intel 8086是16位的CPU,它有着16位的寄存器(Register),16位的数据总线(Data Bus)以及20位的地址总线(Address Bus)和1MB的寻址能力。一个地址是由段和偏移两部分组成的,物理地址遵循这样的计算公式:
物理地址(Physical Address) = 段值(Segment) * 16 + 偏移(Offset)
其中段值和偏移都是16位的。故寻址范围为1MB。
在保护模式下,有了分段机制,所以它的寻址方式发生了很大的变化。具体如下图所示:
在保护模式下,首先使用段选择子 在 段描述符表 中查找到相对应的 段描述符,找到32位段基址,然后在与32位的偏移量相加,得到线性地址。段基址和段偏移量都是32位的,所以寻址范围大小为4GB。在程序中jmp dword SlectorCode32:0的作用,就是进入保护模式下的寻址方式。其中,在使用某个段时,它的段选择子是存储在段寄存器中的。
这里面存在着一个问题,是否我们每次寻址都要先去全局描述符表寄存器(GDTR)中,查找到全局描述符表(GDT)的基址,然后再次根据选择子的索引跳转到该描述符所在的位置,然后取得段描述符中的基址,如果这样的话,我们里里外外采访了几次内存,太浪费时间了。实际上段寄存器结构是这样的:
这样的好处就是,我们可以直接获取段描述符。
4、描述符宏定义和初始化段描述符
- 1 ; 描述符
- 2 ; usage: Descriptor Base, Limit, Attr
- 3 ; Base: dd
- 4 ; Limit: dd (low 20 bits available)
- 5 ; Attr: dw (lower 4 bits of higher byte are always 0)
- 6 %macro Descriptor 3
- 7 dw %2 & 0FFFFh ; 段界限 1 (2 字节)
- 8 dw %1 & 0FFFFh ; 段基址 1 (2 字节)
- 9 db (%1 >> 16) & 0FFh ; 段基址 2 (1 字节)
- 10 dw ((%2 >> 8) & 0F00h) | (%3 & 0F0FFh) ; 属性 1 + 段界限 2 + 属性 2 (2 字节)
- 11 db (%1 >> 24) & 0FFh ; 段基址 3 (1 字节)
- 12 %endmacro ; 共 8 字节
2、3、4、5行注释告诉我们,该宏定义需要三个变量,分别是段基址(4 bytes),段界限(4 bytes),段属性(dw)。
回顾刚才的段描述符结构,该宏定义,就是将变量Base,Limit,Attr分别安插到描述符中相应的位置。Base是1,Limit是2,Attr是3
7 是将Limit低16位赋值给描述符的BYTE0和BYTE1
8 是将Base低16位赋值给描述符的BYTE2和BYTE3
9 是将Base右移16位后的低8位(也就是原Base的第16—23位)赋值给描述符的BYTE4
10是将Limit右移8位之后的第8—11位和Attr的0—7和12—15位,组合起来存储到描述符的BYTE5和BYTE6
11是将Base右移24位后的低8位(也就是原Base的24—32位)赋值给描述符的BYTE7
初始化段描述符代码:
- 37 ; 初始化 32 位代码段描述符
- 38 xor eax, eax
- 39 mov ax, cs
- 40 shl eax, 4
- 41 add eax, LABEL_SEG_CODE32
- 42 mov word [LABEL_DESC_CODE32 + 2], ax
- 43 shr eax, 16
- 44 mov byte [LABEL_DESC_CODE32 + 4], al
- 45 mov byte [LABEL_DESC_CODE32 + 7], ah
为什么要初始化?你会发现这里只是修改了段描述符LABEL_DESC_CODE32的BYTE2,BYTE4,BYTE7。是不是突然恍然大悟?因为在我们初始化该LABEL_DESC_CODE32描述符时,将其基地址初始化为0,所以我们要修改描述符的基地址为其实际的地址。这也是在前面介绍段描述符的时候,我提醒大家需要注意的地方,即描述符的基地址所占有的字节是BYTE2,BYTE4,BYTE7。
为什么要使用mov ax,cs指令?代码段的段描述符是如何进行初始化的?
5、为加载gdtr做准备工作
- 47 ; 为加载 GDTR 作准备
- 48 xor eax, eax
- 49 mov ax, ds
- 50 shl eax, 4
- 51 add eax, LABEL_GDT ; eax <- gdt 基地址
- 52 mov dword [GdtPtr + 2], eax ; [GdtPtr + 2] <- gdt 基地址
- 53
- 54 ; 加载 GDTR
- 55 lgdt [GdtPtr]
这个很好理解,我们就是对GdtPtr进行赋值,主要是初始化GDT的基地址。也就是将GDT的初始地址,赋值给GdtPtr的BYTE2,BYTE3,BYTE4,BYTE5。使GdtPtr的数据结构刚好符合GDTR,然后执行lgdt [GdtPtr],加载全局描述符表寄存器。将GDT的基地址和界限赋值给GDTR。
6、其他
至于接下来的 关中断、打开地址线A20、切换到保护模式、进入保护模式,跳转到32位代码段等一系列的问题,可以从书中找到合适的解释。
总之,进入保护模式的步骤:准备GDT,用lgdt加载gdtr,打开A20,置cr0的PE位,跳转,进入保护模式。
注意:dd和dw的意思是define word的意思,不是double word的意思;但是dword是double word的意思,要注意区分。