低端处理器一般由算术逻辑单元、寄存器和指令处理单元等几部分组成,典型的8位处理器的基本结构如下图所示
总线接口单元:为处理器提供同外部的接口
指令预取单元:先行读取指令
指令译码单元:从预取队列中取来指令,译码成微指令代码
执行单元:ALU、乘法器、除法器和移位器等
分段单元:逻辑地址变换成线性地址
分页单元:将线性地址变换成物理地址
寄存器就是暂时存放数据的地方
通过编写程序、由处理器执行指令控制直接寄存器
IA-32处理器通用指令(整数处理指令)基本执行环境:8个32位通用寄存器、6个16位段寄存器、32位标志寄存器、32位指令指针
对应用人员(程序员)来说,
处理器被抽象为可编程寄存器
图为IA-32常用寄存器(图中31、15、7、0等依次表达二进制位)
处理器最常使用的整数通用寄存器,可用于保存整数数据、地址等
8个32位通用寄存器(E(Extended)表达扩展含义)
EAX,EBX,ECX,EDX,ESI,EDI,EBP,ESP
8个16位通用寄存器,分别表示相应32位通用寄存器低16位部分
AX,BX,CX,DX,SI,DI,BP,SP
8个8位通用寄存器
AH,AL,BH,BL,CH,CL,DH,DL
存取16位寄存器,高16位不受影响
存取8位寄存器,16/32位寄存器其他位不受影响
通用寄存器的名称
EAX:累加器(Accumulator),使用频度最高,用于算术运算、逻辑运算乙级与外设传送信息
EBX:基址寄存器(Base),常用来存放存储器地址,以方便指向变量或数组中的元素
ECX:计数器(Counter),作为循环操作等指令中的计数器。
EDX:数据寄存器(Data),用来存放数据,其中低16位DX常用来存放外设端口地址
ESI:源变址寄存器(Source Index),用于指向字符串或数组的源操作数。源操作数是指被传送或参与运算的操作数
EDI:目的变址寄存器(Destination Index),用于指向字符串或数组的目的操作数。目的操作数是指保存传送结果或运算结果的操作数。
EBP:基址指针寄存器(Base Pointer),默认情况下指向程序堆栈区域的数据,主要用于在子程序中访问通过堆栈传递的参数和局部变量
ESP:堆栈指针(Stack Pointer),专用于指向程序堆栈区域顶部的数据,在涉及堆栈操作的指令中会自动增加或减少。
堆栈Stack是一个特殊的存储区域,(FILO)。调用子程序,用于暂存数据、传递参数、存放局部变量、临时保存数据。堆栈指针会随着处理器执行有关指令自动增大/减少,所以ESP(SP)应该作为专用寄存器对待;但是ESP又可以像其他通用寄存器一样灵活地改变。
标志(Flag)
反映指令执行结果或控制指令执行形式。
处理器中用一个或多个二进制位表示一种标志,0或1的不同组合表达标志的不同状态,8086支持16位标志寄存器FLAGS,IA-32处理器形成32位EFLAGS标志寄存器。
状态标志:记录指令执行结果的辅助信息,加减运算和逻辑运算指令是主要设置状态标志的指令。有6个,处理器主要使用其中5个构成各种条件,分支指令判断这些条件实现程序分支。
它们从低位到高位:进位标志(Carry Flag,CF)、奇偶标志(Parity Flag,PF)、调整标志(Adjust Flag,AF)、零标志(Zero Flag,ZF)、符号标志(Sign Flag,SF)、溢出标志(Overflow Flag,OF)
控制标志:方向标志(Direction Flag,DF),仅用于串操作指令,控制地址的变化方向。处理器执行CLD指令设置DF=0,每次串操作后的存储器地址自动增加,从低地址像高地址处理;执行STD则反之。
系统标志:控制操作系统或核心管理程序的操作方式
中断允许标志IF(Interrupt-enable Flag)或简称中断标志,用于控制外部可屏蔽中断是否可以被处理器响应。执行STI指令,IF=1允许中断;执行CLI指令则反之。
陷阱标志(Trap Flag,TF)也常称作单步标志,用于控制处理器是否进入单步操作。TF=1执行,处理器在每条指令执行结束时便产生一个内部中断,单步调试。
I/O特权层标志IOPL(I/O Privilege Level)
任务嵌套标志NT
虚拟8086方式标志VM
恢复标志RF
对齐检测标志AC
CPU识别标志ID(Identification Flag)
虚拟中断标志VIF
虚拟中断挂起标志VIP
专用寄存器往往只用于特定指令或场合
物理地址(Physical Address):物理存储器以字节为基本存储单位,每个存储单元被分配一个唯一的地址
物理地址空间从0开始顺序编排,直到处理器支持的最大存储单元
8086处理器支持1MB存储器:00000H~FFFFFH(0-2的20次方-1)
IA-32处理器支持4GB存储器:00000000H~FFFFFFFFH(0-2的32次方-1)
操作系统利用存储管理单元进行存储管理,程序并不直接寻址物理存储器
IA-32处理器提供3种存储模型,用于程序访问存储器
操作系统利用存储单元进行存储管理,程序并不直接寻址物理存储器。IA-32处理器提供了3种存储模型(Memory Model)用于程序访问存储器
在处理器内部、程序员编程时采用的地址
逻辑地址=段基地址∶偏移地址(Offset)
段基地址=在主存中的起始地址
偏移地址=距离段基地址的位移量
某个存储单元可以有多个逻辑地址,但只有一个唯一的物理地址
汇编语言以助记符形式表示计算机指令
助记符(mnemonic)是便于人们记忆、并能描述指令功能和指令操作数的符号
助记符是表明指令功能的英语单词或其缩写
汇编格式指令以及使用它们编写程序的规则就形成汇编语言(Assembly Language)
汇编语言程序:用汇编语言书写的程序
汇编程序:将汇编语言程序“汇编”成机器代码目标模块的程序
汇编语言程序与汇编程序是两个概念
IA-32处理器采用可变长度指令格式
操作码
可选的指令前缀(用于扩展指令功能)
1~3字节的主要操作码
操作数(地址码)
可选的寻址方式域(包括ModR/M和SIB字段)
可选的位移量
可选的立即数
指令代码示例
数据传送指令MOV(取自Move)
将数据从一个位置传送到另一个位置,类似高级语言的赋值语句
mov dest,src
;源操作数src:被传送的数据或数据所在的位置
;目的操作数dest:数据将要传送到的位置
mov eax,ebx ; 机器代码:8B C3
mov eax,[ebx] ; 机器代码:8B 03
mov eax,[ebx+esi*4+80h] ; 机器代码:8B 84 B3 80 00 00 00
程序由语句组成
一个语句常占一行(MASM有续行符“\”)
一个语句不超过132个字符,4个部分
执行性语句:表达处理器指令(硬指令)
标号: 硬指令助记符 操作数,操作数 ;注释
说明性语句:表达伪指令,控制汇编方式
名字 伪指令助记符 参数,参数,…… ;注释
; eg0000.asm in Windows Console
include io32.inc ; 包含32位输入输出文件
.data ; 定义数据段
…… ; 数据定义(数据待填)
.code ; 定义代码段
start: ; 程序执行起始位置
…… ; 主程序(指令待填)
exit 0 ; 程序正常执行结束
…… ; 子程序(指令待填)
end start ; 汇编结束
.686 ; 32位指令
.model flat,stdcall
; 选择平展模型,标准调用规范
option casemap:none
;告知MASM区分用户定义标识符的大小写
在数据段给出这个字符串形式的信息:
; 数据段
msg byte 'Hello, Assembly!',13,10,0
; 定义要显示的字符串
在代码段编写显示字符串的程序:
; 代码段
mov eax,offset msg
; 指定字符串的偏移地址
call dispmsg
; 调用I/O子程序显示信息
; eg0201.asm
include io32.inc
.data ; 数据段
msg byte 'Hello, Assembly!',13,10,0 .code ; 代码段
start: ; 程序执行起始位置
mov eax,offset msg
call dispmsg
exit 0 ; 程序正常执行结束
end start ; 汇编结束
;c语言程序
;#include
;int main()
;{
; printf("Hello, world !\n");
; exit(0);
;}
INCLUDE IO32.INC
子程序调用方法
MOV EAX,入口参数
CALL 子程序名
宏调用方法
宏名 入口参数
*常用输出子程序
*常用输入子程序
指令有两部分:操作码和操作数
操作码:处理器要执行哪种操作,不可缺少,用助记符表示
操作数:指令执行的参与者,各种操作的对象,需要通过地址指示
数据寻址方式:通过地址查找数据(操作数)
立即数寻址:数据与指令操作码一起,用常量表达
寄存器寻址:数据在寄存器中,用寄存器名表示
存储器寻址:数据在主存中,用存储器地址代表
操作数紧跟操作码,是机器代码的一部分
操作数从指令代码中立即得到,即立即数(Immediate),用常量形式直接表达
立即数寻址方式只用于源操作数,常用来给寄存器和存储单元赋值
例如:MOV EAX,33221100H
机器代码:B8 00 11 22 33
操作码:B8
立即数:33221100
操作数存放在处理器的内部寄存器中
用寄存器名表示它的内容
绝大多数指令采用通用寄存器寻址
部分指令支持专用寄存器,例如段寄存器
寄存器寻址方式简单快捷,最常使用
例如:MOV EBX,EAX
32位通用寄存器:EAX EBX ECX EDX ……
16位通用寄存器:AX BX CX DX ……
8位通用寄存器:AH AL BH BL ……
操作数在主存中,通过存储器地址指示
编程时,存储器地址使用包含段选择器和偏移地址的逻辑地址
*段选择器(段寄存器)指示段基地址
默认规定:数据在DS指向的数据段;EBP或ESP作为基地址,数据在SS指向的堆栈段
显式说明:使用段超越指令前缀,段寄存器名后跟英文冒号
*偏移地址由各种寻址方式计算,常被称为有效地址EA(Effective Address)
MOV ECX,COUNT ;COUNT是变量
MOV ECX, DS:[405000H]
指令代码:8B 0D 00 50 40 00
操作码和寻址方式:8B 0D
操作数:有效地址 00405000H
4. 寄存器间接寻址
有效地址存放在寄存器中(寄存器内容=偏移地址)
MASM用中括号括起寄存器
可以方便地对数组的元素或字符串的字符进行操作
寄存器间接寻址没有说明存储单元类型
例如:
mov edx,[ebx]
mov [esi],ecx
mov esi,[ebx+4] ;位移量:4
mov edi,[ebp-08h] ;位移量:-08H
mov esi,count[ebx] ;位移量:COUNT
主存以字节为可寻址单位,地址的加减是以字节为单位
6. 变址寻址
使用变址寄存器寻址操作数
便于支持两维数组等数据结构
例如:
mov edi,[ebx+esi]
mov edi,[ebx][esi]
; 基址变址寻址,功能:EDI=DS:[EBX+ESI]
mov eax,[ebx+edx+80h]
mov eax,80h[ebx+edx]
mov eax,80h[ebx][edx]
;相对基址变址寻址
功能:EAX=DS:[EBX+EDX+80H]
mov eax,[ebx*4] ; 带比例的变址寻址
mov eax,[esi*2+80h] ; 带比例的相对变址寻址
mov eax,[ebx+esi*4] ; 带比例的基址变址寻址
mov eax,[ebx+esi*8-80h] ; 带比例的相对基址变址寻址