本博文围绕80x86 CPU中寄存器的基础部分下手,着眼于CPU寄存器的特性和功能。
首先介绍一下Intel CPU的发展史。
Intel CPU系列,最初是4位微处理器4004,然后到8位微处理器的8008,再到8位微处理器8080,以及稍后的16位微处理器8086。
由 8086 开始,Intel 进入现在所谓的 x86 时代 。
Intel 8086 为 16 位 CPU ,而因为在 8086 之前的 CPU 都是 8 位 CPU,这样也就造成了很多的外设也只支持 8 位,因此 Intel 紧接着就推出了 8 位的 8088 CPU,因此 Intel 8088 也就可以看做是 8086 的 8 位版本;如果是但从汇编语言的角度上来说,8086 和 8088 是没有区别的,即 8086 上跑的程序可以不加修改的移植到 8088 ,8088 上跑的程序也可以不加修改的移植到 8086 上。当然,还是有些特殊的地方是不同的,而这些基本上在这里可以忽略掉。
在 8088 CPU 之后,Intel 又推出了 80186 ,80286 ,这两款 CPU 均是 16 位 CPU 。而对于 80186 来说,其与 8086 的区别可以简单的看做是 80186 多了几条指令而已。而 80286 则不同,80286 的地址总线数目有了变化。在 8086 , 8088 , 80186 上,CPU 的地址总线都是 20 根,即可最大寻址 2^20 即达到 1MB 的寻址能力。而对于 80286 CPU 来说,其地址总线数目达到了 24 根,从而最大寻址能力为 2^24 即 16MB,由于支持更多的物理内存寻址,因此 80286 便开始成为了多任务,多用户系统的核心。
而后来,Intel 又推出了 80386 ,80386 为 32 位微处理器,Intel 80x86 家族的 32 位微处理器始于 80386;同时 80386 也完全兼容先前的 8086/8088,80186,80286,并且 80386 全面支持 32 位数据类型和 32 位操作,并且 80386 的数据总线根数和地址总线根数均达到了 32 根,从而可以最大物理寻址为 2^32 即 4GB 。
之后的 80486 也是 32 位微处理器,而后又出来了 Pentium 和 Pentium Pro 等等第五代微处理器,这些处理器虽然也是 32 位微处理器,但是他们的数据总线和地址总线都有所扩展,比如 Pentium 的数据总线达到 64 位,而 Pentium Pro 的地址总线位数达到了 36 位 。
好,关于 Intel CPU 的介绍就到这里了,下面就要开始回归中心,看 CPU 中的寄存器了。
说了这么多,寄存器到底是什么呢?其实很简单,寄存器就是存储信息的单元或者说是器件又或者说是容器而已。就比如内存,内存也是一种存储介质或者说是存储单元而已。对于寄存器,从功能上说它和内存差不多,只不过寄存器位于CPU内部,而内存位于CPU外部。寄存器是CPU中的稀有资源。
CPU中寄存器分为下面一些寄存器:
数据寄存器主要用来保存操作数和运算结果等信息,从而节省读取操作数所需占用总线和访问存储器的时间。32位CPU有4个32位的通用寄存器EAX、EBX、ECX和EDX。对低16位数据的存取,不会影响高16位的数据。这些低16位寄存器分别命名为:AX、BX、CX和DX,它们和先前的CPU中的寄存器相一致。
4个16位寄存器又可以分割成8个独立的8位寄存器——AX:AH+AL,BX:BH+BL,CX:CH+CL,DX:DH+DL。其中,对于*X16位寄存器,*H表示高位的8位寄存器,*L表示低位的8位寄存器。同时,除了这4个数据寄存器以外,其他寄存器均不可以分为两个独立的8位寄存器。每个寄存器都有自己的名称,可独立存取。程序员可以利用数据存储器的这种“可分可合”的特性,灵活地处理字/字节的信息。
注意上面标志中的“独立”两字,这两个字表明AH和AL作为8位寄存器使用时,可以看做它们是完全互不相关的,也就是说看做两个完全没有联系的寄存器X和Y即可。比如汇编指令 MOV AH, 12H,CPU在执行时根部就不会知道AL中是什么鬼东西,因为它只认识并操作AH。
对于每个数据寄存器,它们的功能是有差别的。
寄存器AX通常称之为累加器(Accumulator),用累加器进行的操作可能需要更少时间。累加器可用于乘和除,输入和输出等操作,它们的使用频率很高。
寄存器BX通常称之为基地址寄存器(Base Register),它可以作为存储器指针来使用。其专属功能为寻址(寻址物理地址)。BX寄存器中存放的数据一般是用来作为偏移地址使用的,它基于段地址的基地址,结合BX寄存器中的偏移地址,就可以进行寻址了。
寄存器CX通常称之为计数寄存器(Count Register),在循环和字符串操作时,要用它来控制循环次数,当在汇编指令中使用循环LOOP指令时,可以通过CX来指定需要循环的次数;在位操作中,当移位多位时,使用寄存器CL来指明移位的位数。
寄存器DX通常称之为数据寄存器(Data Register)。在进行乘和除运算时,它可作为默认的操作数参与运算,也可以存放I/O的端口地址。
在16位CPU中,AX、BX、CX和DX不能作为基址和变址寄存器来存放存储单元的地址,但在32位CPU中,其32位寄存器EAX、EBX、ECX和EDX不仅可传送数据、暂存数据保存算术逻辑运算结果,而且也可作为指针寄存器,所以,这些32位寄存器更具有通用性。
32位CPU有2个通用寄存器ESI和EDI。其低16位对应先前CPU中的SI和DI,对低16位数据的存取,不影响高16位数据。
SI(Source Index)是源变址寄存器,DI(Destination Index)是目的变址寄存器。
寄存器ESI、EDI、SI和DI称为变址寄存器(Index Register),它们主要用于存放存储单元在段内的偏移量,用它们可以实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便。变址寄存器不可分割成8位寄存器。作为通用寄存器,也可存储算术逻辑运算的操作数和运算结果。它们可作一般的存储器指针使用。在字符串操作指令的执行过程中,对它们有特定的要求,而且还具有特殊的功能。
32位CPU有2个32位通用寄存器EBP和ESP。其低16位对应先前CPU中的BP和SP,对低16位数据的存取,不影响高16位的数据。
寄存器EBP、ESP、BP和SP称之为指针寄存器(Pointer Register),主要用于存放堆栈内存储单元的偏移量,用它们可以实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便。指针寄存器不可分割成8位寄存器。作为通用寄存器,也可以存储算术逻辑运算的操作数和运算结果。
它们主要用于访问堆栈内的存储单元,并且规定:
BP为基指针(Base Pointer)寄存器,用它可直接存取堆栈中的数据。
SP为堆栈指针(Stack Pointer)寄存器,用它只可访问栈顶。
段寄存器是根据内存分段的管理模式而设置的。内存单元的物理地址由段寄存器的值和一个偏移量组合而成的,这样可用两个较少位数的值组合成一个可访问较大物理空间的内存地址。
CPU内部的段寄存器有:
DS——代码段寄存器(Code Segment Register),其值为代码段的段值;
DS——数据段寄存器(Data Segment Register),其值为数据段的段值;
SS——堆栈段寄存器(Stack Segment Register),其值为堆栈段的段值;
ES——附加段寄存器(Extra Segment Register),其值为附加数据段的段值;
FS——附加段寄存器(Extra Segment Register),其值为附加数据段的段值;
GS——附加段寄存器(Extra Segment Register),其值为附加数据段的段值。
在16位CPU系统中,它只有4个段寄存器,所以,程序在任何时刻至多有4个正在使用的段可直接访问;在32位微机系统中,它有6个段寄存器,所以,在此环境下开发的程序最多可同时访问6个段。32位CPU有两种不同的工作方式:实方式和保护方式。在不同方式下,段寄存器的作用是不同的。有关规定简单描述如下:
实方式:前4个段寄存器CS、DS、ES和SS与先前CPU中的所对应的段寄存器的含义完全一致,内存单元的逻辑地址仍为“段值:偏移量”的形式。为访问某内存段内的数据,必须使用该段寄存器和存储单元的偏移量。
保护方式:在此方式下,情况要复杂很多,装入段寄存器的不再是段值,而是称为“选择子(Selector)”的某个值。
32位CPU把指令指针扩展到32位,并记作EIP(Instruction Pointer Register),EIP的低16位与先前CPU中的IP作用相同。
指令指针EIP和IP(Instruction Pointer)是存放下次将要执行的指令在代码段的偏移量。在具有预取指令功能的系统中,下次要执行的指令通常已被预取到指令队列中,除非发生转移情况。所以,在理解它们的功能时,不考虑存在指令队列的情况。
在实方式下,由于每个段的最大范围为64K,所以,EIP中的高16位肯定都为0,此时,相当于只用其低16位的IP来反映程序中指令的执行次序。
进位标志CF(Carry Flag)
进位标志CF主要用来反映运算是否产生进位或借位。如果运算结果的最高位产生了一个进位或借位,那么,其值为1,否则其值为0。使用该标志位的情况有:多字(字节)数的加减运算,无符号数的大小比较运算,移位操作,字(字节)之间移位,专门改变CF值的指令等。
奇偶标志PF(Parity Flag)
奇偶标志PF用于反映运算结果中”1″的个数的奇偶性。如果”1″的个数为偶数,则PF的值为1,否则其值为0。
利用PF可进行奇偶校验检查,或产生奇偶校验位。在数据传送过程中,为了提供传送的可靠性,如果采用奇偶校验的方法,就可使用该标志位。
辅助进位标志AF(Auxiliary Carry Flag)
在发生下列情况时,辅助进位标志AF的值被置为1,否则其值为0:
在字操作时,发生低字节向高字节进位或借位时;
在字节操作时,发生低4位向高4位进位或借位时。
对以上6个运算结果标志位,在一般编程情况下,标志位CF、ZF、SF和OF的使用频率较高,而标志位PF和AF的使用频率较低。
零标志ZF(Zero Flag)
零标志ZF用来反映运算结果是否为0。如果运算结果为0,则其值为1,否则其值为0。在判断运算结果是否为0时,可使用此标志位。
符号标志SF(Sign Flag)
符号标志SF用来反映运算结果的符号位,它与运算结果的最高位相同。在微机系统中,有符号数采用补码表示法,所以,SF也就反映运算结果的正负号。运算结果为正数时,SF的值为0,否则其值为1。
溢出标志OF(Overflow Flag)
溢出标志OF用于反映有符号数加减运算所得结果是否溢出。如果运算结果超过当前运算位数所能表示的范围,则称为溢出,OF的值被置为1,否则,OF的值被清为0。”溢出”和”进位”是两个不同含义的概念,不要混淆。如果不太清楚的话,请查阅《计算机组成原理》课程中的有关章节。
状态控制标志位是用来控制CPU操作的,它们要通过专门的指令才能使之发生改变。
追踪标志TF(Trap Flag)
当追踪标志TF被置为1时,CPU进入单步执行方式,即每执行一条指令,产生一个单步中断请求。这种方式主要用于程序的调试。指令系统中没有专门的指令来改变标志位TF的值,但程序员可用其它办法来改变其值。
中断允许标志IF(Interrupt-enable Flag)
中断允许标志IF是用来决定CPU是否响应CPU外部的可屏蔽中断发出的中断请求。但不管该标志为何值,CPU都必须响应CPU外部的不可屏蔽中断所发出的中断请求,以及CPU内部产生的中断请求。具体规定如下:
当IF=1时,CPU可以响应CPU外部的可屏蔽中断发出的中断请求;
当IF=0时,CPU不响应CPU外部的可屏蔽中断发出的中断请求。
CPU的指令系统中也有专门的指令来改变标志位IF的值。
方向标志DF(Direction Flag)
方向标志DF用来决定在串操作指令执行时有关指针寄存器发生调整的方向。具体规定在第5.2.11节——字符串操作指令——中给出。在微机的指令系统中,还提供了专门的指令来改变标志位DF的值。
I/O特权标志IOPL(I/O Privilege Level)
I/O特权标志用两位二进制位来表示,也称为I/O特权级字段。该字段指定了要求执行I/O指令的特权级。如果当前的特权级别在数值上小于等于IOPL的值,那么,该I/O指令可执行,否则将发生一个保护异常。
嵌套任务标志NT(Nested Task)
嵌套任务标志NT用来控制中断返回指令IRET的执行。具体规定如下:
当NT=0,用堆栈中保存的值恢复EFLAGS、CS和EIP,执行常规的中断返回操作;
当NT=1,通过任务转换实现中断返回。
重启动标志RF(Restart Flag)
重启动标志RF用来控制是否接受调试故障。规定:RF=0时,表示”接受”调试故障,否则拒绝之。在成功执行完一条指令后,处理机把RF置为0,当接受到一个非调试故障时,处理机就把它置为1。
虚拟8086方式标志VM(Virtual 8086 Mode)
如果该标志的值为1,则表示处理机处于虚拟的8086方式下的工作状态,否则,处理机处于一般保护方式下的工作状态。