第二章,我们主要从CPU如何执行指令的角度讲解了8086CPU的逻辑结构、形成物理地址的方法、相关的寄存器以及一些指令。
这一章,我们从访问内存的角度继续学习几个寄存器。
CPU中,用16位寄存器来存储一个字。字是有2个内存单元组成。高8位存放高位字节,低8位存放低位字节。
例如:问题 3.1 所描述的。
(1) 0 地址单元中存放的字节型数据是多少?
(2) 0 地址字单元中存放的字型数据是多少?
(3) 2 地址单元中存放的字节型数据是多少?
(4) 2 地址字单元中存放的字型数据是多少?
(5) 1 地址字单元中存放的字型数据是多少?
答案一目了然,分别是20H、4E20H、12H、0012H、124E。
CPU要读写一个内存单元时,必须给出这个内存单元的地址,内存地址由段地址和偏移地址组成。 DS 存放要访问数据的段地址, [address] 中address是偏移地址并且是一个具体的数。
这里注意,DS并不能直接给定一个数值。比如 mov ds,1000H 语句在8086CPU中是错的。我们只能通过寄存器去改变ds的值,比如 mov ds,ax 语句。
问题 3.2
写几条指令,将 al 中的数据送入内存单元 10000H 中。
mov ax,1000H ;为了让ds为1000H,先让ax为1000H
mov ds,ax ;ds只接受寄存器向它传送的数据
mov al,[0] ;[0]是偏移地址,1000:0的内存单元是10000H
8086CPU是 16 位结构,有16根数据线,所以,可以一次性传送16位数据,也就是一个字。
问题 3.3
内存中的情况如下图所示,写出下面指令执行后寄存器ax,bx,cx中的值。
mov ax,1000H ;AX = 1000H
mov ds,ax ;DS = 1000H
mov ax,[0] ;由于传送的是一个字数据,所以AX = 1123H
mov bx,[2] ;同上,BX = 6622H
mov cx,[1] ;CX = 2211H
add bx,[1] ;BX = 8833H
add cx,[2] ;CX = 8833H
问题 3.4
mov ax,1000H ;AX = 1000H
mov ds,ax ;DS = 1000H
mov ax,11316 ;AX = 11316 = 0x2C34H
mov [0],ax ;1000:0 = 34 , 1000:1 = 2C
mov bx,[0] ;BX = 2C34
sub bx,[2] ;BX = 1B12
mov [2],bx ;1000:2 = 12 , 1000:3 = 1B
我们知道高字节放入高地址,低字节放入低地址。也就是[0]的高地址为1000:1,低地址为1000:0。
我们在没什么了解的情况之前就是是要几个了mov、add、sub等指令。
先了解mov指令的几种形式:
mov 寄存器,数据
mov 寄存器,寄存器
mov 寄存器,内存单元
mov 内存单元,寄存器
mov 段寄存器,寄存器
(1)我们猜想,既然有 mov 段寄存器,寄存器 指令,那么会有mov 寄存器,段寄存器 指令这样的相反通路吗?
由此可知,mov 寄存器,段寄存器指令是可用的。
(2)同样,既然有 mov 寄存器,内存单元 ,会拥有 mov 内存单元,寄存器 指令吗?
实验如下:
如图所示,内存单元 1000:0 和 1000:1 发生变化,也就是1000:[0]发生变化。
(3)那么 mov 段寄存器,内存单元 也应该可以。
同mov一样, add 和 sub 也有以下几种形式:
add 寄存器,数据
add 寄存器,寄存器
add 寄存器,内存单元
add 内存单元,寄存器
sub 寄存器,数据
sub 寄存器,寄存器
sub 寄存器,内存单元
sub 内存单元,寄存器
我们尝试一下 add 段寄存器,ax 指令,看看可行吗?
前面提到,可以根据需要,将一组内存单元定义为一个段。我们可以将一组的长度为N(N<=64KB)、地址连续、起始地址为16的倍数的内存单元当作专门存储数据的内存空间。
例如将 123B0H~123B9H 的内存单元定义为数据段。现在要累加这个数据段中的前3个单元中的数据,如下:
mov ax,123BH
mov ds,ax
mov al,0 ;注意,由于题目要求是"单元",而不是"字",所以采用al
add al,[0]
add al,[1]
add al,[2]
问题 3.5
写几条指令,累加数据段中的前3个字型数据。代码如下:
mov ax,123BH
mov ds,ax
mov ax,[0] ;因为这里采用的是"字"
add ax,[2]
add ax,[4]
(1)字在内存中存储时,采用两个地址连续的内存单元来存放,字的低位字节存放在低地址单元中,高位字节存放在高地址单元中。
(2)用 mov 指令访问内存单元,可以在 mov 指令中只给出单元的偏移地址,此时,段地址默认在 DS 寄存器中。
(3)[address] 表示一个偏移地址为 address 的内存单元。
(4)在内存和寄存器之间传送字型数据时,高地址单元和高8位寄存器、低地址单元和低8位寄存器相对应。
(5)mov、add、sub 是具有两个操作对象的指令。jmp 是具有一个操作对象的指令。
(6)可以根据自己的推测,在 Debug 中实验指令的新格式。
其实,最麻烦的就是第6点,每种CPU的汇编指令都会有一些不同,所以在针对不同的CPU时需要去猜测所谓的“新格式”。
(1)在 Debug 中,用“d 0:0 1f”查看内存,结果如下。
写出下面每条汇编指令执行后寄存器的值。
mov ax,1 ;AX = 0001H
mov ds,ax ;DS = 0001H
mov ax,[0000] ;AX = 2662H
mov bx,[0001] ;BX = E626H
mov ax,bx ;AX = E626H
mov ax,[0000] ;AX = 2662H
mov bx,[0002] ;BX = D6E6H
add ax,bx ;AX = FD48H
add ax,[0004] ;AX = 2C14H
mov ax,0 ;AX = 0000H
mov al,[0002] ;AL = E6H
mov bx,0 ;BX = 0000H
mov bl,[000c] ;BL = 26H
add al,bl ;AL = 0CH
(2)内存中的情况如图 3.6 所示。
各寄存器的初始值:CS=2000H , IP=0 , DS=1000H , AX=0 , BX=0;
①:我们知道CS=2000H,IP=0,所以从2000:0000处开始执行。因此,代码如下。
mov ax,6622H
jmp 0FF0:0100 ;0FF0:0100 == 1000:0
mov ax,2000H
mov ds,ax
mov ax,[0008]
mov ax,[0002]
②:CS:IP的值如下。
指令 | CS | IP | ax | ds |
---|---|---|---|---|
mov ax,6622 | 2000H | 0003H | 6622H | 1000H |
jmp 0FF0:0100 | OFFOH | 0100H | 6622H | 1000H |
mov ax,2000H | 0FF0H | 0103H | 2000H | 1000H |
mov ds,ax | 0FF0H | 0105H | 2000H | 2000H |
mov ax,[0008] | 0FF0H | 0108H | C389H | 2000H |
mov ax,[0002] | OFFOH | 010BH | EA66H | 2000H |
③:初步猜测,我认为数据和指令无区别。原因,是因为可以将mov bx,ax当做数据传送到[0008]内存中。那我们如何确定是数据还是指令呢?当然是通过我们的CS:IP来确认咯,IP指向的第一个值是我们的指令,例如A1是为 mov ax,内存地址 的指令。执行指令后,IP根据指令来确定向后移动几个位置。(以上是本人的猜想,不知道是否成立)
猜想:CP是时钟脉冲,以A1为例子,我们知道读取一个数据需要一个脉冲,A1是需要3个脉冲时间才能完成的操作?
以上是本人猜想,未经过验证。
栈是一种具有特殊访问方式的存储空间。特殊点在于,数据入栈出栈的次序是“先进后出”或者说“后进先出”(LIFO,Last In First Out)。拥有两种操作:入栈(PUSH)和出栈(POP)。
CPU 提供相关的指令来以栈的方式访问内存空间。说明了,我们可以将一段内存当做栈来使用。(其实我们编程在写递归的时候,总是很经常没有考虑递归基的情况就运行程序,导致内存溢出。我们通过前面所说内存被当做栈来使用,推导出:其实就是栈内存被使用了无限次,导致的内存溢出结果。)
如下所示是栈的操作:
可以看出高地址单元存放高8位,低地址单元存放低8位。
在这里,我们会疑惑!总结一下,大概是两个问题。
这里给出答案,8086CPU 中,有两个寄存器SS、IP分别是栈的段地址和偏移地址。在任意时刻,SS:IP 指向栈顶元素。
我们来看看PUSH操作的过程,如图:
反之,则是POP操作过程,如图:
我们看到,POP操作并没有将栈顶之前的值 清 0 。
问题 3.6
如果将 10000H~1000FH 这段空间当做栈,初始状态栈是空的,此时,SS=1000H,SP=?
答案显然是最高地址的下一个单元,即10010H。
我们知道栈顶的指向有 SS:IP 控制。但并没有控制这栈空间pop次数过多导致下溢以及push多次导致上溢的检测。这样会出现一个问题,我们脑海中的栈空间之外的数据会被栈的pop或者push操作给覆盖,从而导致一系列的错误发生。这非常严重,试想一下,如果C语言编写的一段递归程序没有递归基就运行之后,秒级的时候就会讲内存占满,从而导致RAM死机,计算机只能重启。这也是为什么VC++给程序只分配了4K空间的原因(我记得是4K,若有错误请指正)。
因此,我们在编写汇编程序的时候,需要注意我们的PUSH和POP操作不会导致上溢以及下溢。
push和pop 指令的格式可以是如下形式:
push 寄存器 ;将一个寄存器中的数据入栈
pop 寄存器 ;出栈,用一个寄存器接受出栈的数据
push 段寄存器
pop 段寄存器
push 内存单元
pop 内存单元
问题 3.7
编程,将 10000H~1000FH 这段空间当做栈,初始状态栈是空的,将 AX、BX、DS 中的数据入栈。
mov ax,1000H
mov ss,ax ;由于是段寄存器,所以需要ax来中转
mov sp,0010H ;由于栈是由高地址开始
push ax
push bx
push ds
问题 3.8
编程:
(1)将 10000H~1000FH 这段空间当作栈,初始状态栈是空的;
(2)设置 AX=001AH,BX=001BH;
(3)将 AX、BX 中的数据入栈;
(4)然后将AX、BX清零;
(5)从栈中恢复AX、BX原来的内容。
;第一题答案
mov ax,1000H
mov ss,ax
mov sp,0010H
;第二题答案
mov ax,001AH
mov bx,001BH
;第三题答案
push ax
push bx
;第四题答案
mov ax,0000H
mov bx,0000H
;第五题答案
pop bx ;出栈顺序是LIFO
pop ax ;同上
问题 3.9
编程:
(1)将 10000H~1000FH 这段空间当做栈,初始状态为空;
(2)设置 AX=001AH,BX=001BH;
(3)利用栈,交换 AX 和 BX 中的数据。
;第一题答案
mov ax,1000H
mov ss,ax
mov sp,0010H
;第二题答案
mov ax,001AH
mov bx,001BH
;第三题答案
push ax
push bx
pop ax
pop bx
问题 3.10
如果要在 10000H 处写入字型数据 2266H,可以用以下代码完成:
mov ax,1000H
mov ds,ax
mov ax,2266H
mov [0],ax
补全下面的代码,实现功能:在 10000H 处写入字型数据 2266H 。
要求:不能使用“mov 内存单元,寄存器”这类指令。
;要求三条指令搞定
mov ax,1000H
mov ss,ax
mov sp,2H ;push是先将sp-=2后再传送数据给SS:SP内存单元中
;题目的代码
mov ax,2266H
push ax
(1)8086CPU 提供了栈操作机制,方案如下。
(2)push 指令的执行步骤:
(3)pop 指令的执行步骤:
(4)任意时刻,SS:SP 指向栈顶元素。
(5)8086CPU 只记录栈顶,栈空间的大小我们要自己管理。
(6)用栈来暂存以后需要回复的寄存器的内容时,寄存器出栈的顺序要和入栈的顺序相反。
(7)push、pop 实质上是一种内存传送指令,注意它们的灵活应用。
栈是一种非常重要的机制,一定要深入理解,灵活掌握。
在编程时,我们可以根据需要,将一组内存单元定义为一个段。我们要注意控制栈不会超界。
问题 3.11
如果将 10000H~1FFFFH 这段空间当作栈段,初始状态栈是空的,此时,SS=1000H,SP=?
答案很显然,SP= FFFF+1 = 10000H = 0000H。这是一个64K大小的栈段。
问题 3.12
一个栈最大可以设为多少?为什么?
最大可以设为64K,因为SP的范围只能是 0000H~FFFFH 之间。
例如一段代码,假设CS=1000H,IP=0000H:
mov ax,1000H
mov ss,ax
mov sp,0020H
mov ax,cs
mov ds,ax
mov ax,[0]
add ax,[2]
mov bx,[4]
add bx,[6]
push ax
push bx
pop ax
pop bx
这段代码给我们的信息是:在 10000H~1001FH这段内存中,既是代码段,又是栈段和数据段。这样的代码可能会出现数据发生错误,尽量让一段内存当做三者中的一种段。
(1)补全下面的程序,使其可以将 10000H~1000FH 中的 8 个字,逆序复制到 20000H~2000FH 中。逆序复制的含义如下图所示。
;题目代码
mov ax,1000H
mov ds,ax
;三行代码
mov ax,2000H
mov ss,ax
mov sp,0010H
;题目代码
push [0]
push [2]
push [4]
push [6]
push [8]
push [A]
push [C]
push [E]
(2)补全下面的代码,使其可以将 10000H~1000FH 中的 8 个字,逆序复制到 20000H~2000FH 中。
;题目代码
mov ax,2000H
mov ds,ax
;三行代码
mov ax,1000H
mov ss,ax
mov sp,0000H
;题目代码
pop [E]
pop [C]
pop [A]
pop [8]
pop [6]
pop [4]
pop [2]
pop [0]
(1)使用 Debug,将上面的程序段写入内存,逐条执行,根据指令执行后的实际运行情况填空。
mov ax,FFFF
mov ds,ax
mov ax,2200
mov ss,ax
mov sp,0100
;填空
mov ax,[0] ;我们不考虑AX与BX的值
add ax,[2]
mov bx,[4]
add bx,[6]
push ax ;研究SP的变化,SP = 00FEH
push bx ;SP = 00FCH
pop ax ;SP = 00FEH
pop bx ;SP = 0100H
push [4] ;SP = 00FEH
push [6] ;SP = 00FCH
(2)仔细观察下图的实验过程,然后分析:为什么 2000:0~2000:f 中的内容会发生改变?
我们发现指令 mov ss,ax 被执行后,下一条指令是 mov ax,3123 也就是说 一次T指令对ss操作连同sp也执行了。这变相的说明ss和sp需要连续的改变,也就是mov ss,ax之后必须是mov sp,10。
那我们从中寻找原因:如果ss执行后,不立马执行sp会发生什么情况?
百度了一下,回答是这样的,我们的 T指令 是中断指令,也就是 T指令 执行后需要把相关寄存器信息压入栈中。那么,我们就知道了,SS之后必须跟SP,否则会出现错误。执行后还需要把 T指令 相关的东西压入栈中,所以出现了一堆数据。比如:0B39 是 DS 的值等。