上一节讲述了8086/8088 CPU寻址方式,通过了解它的寻址方式会使得今后学习8086/8088汇编语言指令变得更加容易,因为汇编语言中大多数的指令就是对数据进行处理和运算。
但是看完上一节内容,不仅没有让人觉得有所收获,反而增添了对汇编的一些恐惧心理。在收到一些人的回复后我回头审视了一下上一节的内容,确实内容显得比较的专业,很容易让人产生一种压抑的心情。后来,我找了王爽老师编写的《汇编语言》看了看,发现这本书确实写得会比较地通俗,而且看完以后会有一种犹如醍醐灌顶的感觉。所以思量了一下,决定参考王爽老师的经典大作,对上一节的内容进行一下补充。这里,我主要参考了第8章“数据处理的两个基本问题”,自认为里面总结的内容补充进来还是相当得体的。
这一节主要围绕两个基本问题展开:
1)计算机要处理的数据在什么地方?
2)计算机要处理的数据有多长?
那么,我们为什么要关心这些问题?同样,正如我在前面说到的,汇编语言中大多数的指令就是对数据进行处理和运算的。而既然是这个样子,那么通常计算机中的数据有两种比较重要的属性:地址和长度。因而,我们需要认识这两个基本问题,以及上一节所讲到的寻址方式。
知识回顾
首先我们需要回顾一些知识,这些也是在前面的小节中讲述过的。
引入两个描述性符号:reg和sreg。其中,reg用来表示一个寄存器,sreg用来表示一个段寄存器。
reg的集合包括: ax bx cx dx ah al bh bl ch cl dh dl sp bp si di
sreg集合包括: ds ss cs es
四个特殊的寄存器:bx si di bp,总结一下它们的特点:
1) 在8086CPU中 只有这4个寄存器可以用在"[...]"中来进行内存单元的寻址。
比如下面的指令是正确的:
mov ax, [bx] ; right
mov ax, [bx+si] ; right
mov ax, [bx+di] ; right
mov ax, [bp] ; right
mov ax, [bp+si] ; right
mov ax, [bp+di] ; right
相反,下面这些指令是错误的:
mov ax, [cx] ; wrong
mov ax, [ax] ; wrong
mov ax, [dx] ; wrong
mov ax, [ds] ; wrong
2) 在[...]中,这4个寄存器可以单个出现,或只能以4种组合出现:bx和si、bx和di、bp和si、bp和di。
比如下面这些指令就是正确的:
mov ax, [bx] ; right
mov ax, [si] ; right
mov ax, [di] ; right
mov ax, [bp] ; right
mov ax, [bx+si] ; right
mov ax, [bx+di] ; right
mov ax, [bp+si] ; right
mov ax, [bp+di] ; right
mov ax, [bx+si+idata] ; right
mov ax, [bx+di+idata] ; right
mov ax, [bp+di+idata] ; right
mov ax, [bp+si+idata] ; right
而下面的指令是错误的:
mov ax, [bx+bp] ; wrong
mov ax, [si+di] ; wrong
3)只要在[...]中使用寄存器bp,而指令中没有显性地给出段地址,段地址就默认在ss中。
比如:
mov ax, [bp] ; (ax) = ( (bp) + (ss) * 10H )
mov ax, [bp+idata] ; (ax) = ( (bp) + idata + (ss) * 10H )
mov ax, [bp+si] ; (ax) = ( (bp) + (si) + (ss) * 10H )
mov ax, [bp+si+idata] ; (ax) = ( (bp) + (si) + idata + (ss) * 10H )
接下来的内容比较重要,主要是结合8086/8088汇编语言来回答之前的两个问题。
机器指令处理的数据在什么地方?
绝大部分机器指令都是进行数据处理的指令,处理大致可分为3类:读取、写入、运算。
指令在执行前,所要处理的数据可以在3个地方:CPU内部、内存、端口。
数据位置的表达?
总共有3个概念来表达数据的位置
1)立即数(idata)
对于直接包含在机器指令中的数据,在汇编指令中直接给出。例如:
mov ax, 1
add bx, 2000h
or bx, 00010000b
mov al, 'a'
2)寄存器
指令要处理的数据在寄存器中,在汇编指令中给出相应的寄存器名。
mov ax, bx
mov ds, ax
push bx
mov ds:[0], bx
push ds
mov ss, ax
mov sp, ax
3)段地址(SA)和偏移地址(EA)
数据在内存中,在汇编指令中用[X]的格式给出EA,SA在某个段寄存器中。存放段地址的寄存器可以是默认的,比如:
mov ax, [0]
mov ax, [di]
mov ax, [bx+8]
mov ax, [bx+si]
mov ax, [bx+si+8]
等指令,段地址默认在ds中;而如下
mov ax, [bp]
mov ax, [bp+8]
mov ax, [bp+si]
mov ax, [bp+si+8]
等指令,段地址默认在ss中。
存放段地址的寄存器也可以是显性给出的。
比如:
mov ax, ds:[bp]
mov ax, es:[bx]
mov ax, ss:[bx+si]
mov ax, cs:[bx+si+8]
指令要处理的数据有多长?
8086CPU的指令,可以处理两种尺寸的数据,byte和word。所以在机器指令中要指明,指令进行的是字操作还是字节操作。这里主要通过三种方式可以指明数据尺寸:
1)通过寄存器名指明要处理的数据的尺寸。
例如,下面指令中,寄存器指明了指令进行的是字操作。
mov ax, 1
mov bx, ds:[0]
mov ds, ax
mov ds:[0], ax
inc ax
add ax, 1000
下面指令中,寄存器执行了指令进行的是字节操作。
mov al, 1
mov al, bl
mov al, ds:[0]
mov ds:[0], al
inc al
add al, 100
2)在没有寄存器名存在的情况下,用操作符X ptr指明内存单元的长度,X在汇编指令中可以为word或byte。
例如,下面的指令中,用word ptr指明了指令访问的内存单元是一个字单位。
mov word ptr ds:[0], 1
inc word ptr [bx]
inc word ptr ds:[0]
add word ptr [bx], 2
又如,下面的指令中,用byte ptr指明了指令访问的内存单元是一个字节单位。
mov byte ptr ds:[0], 1
inc byte ptr [bx]
inc byte ptr ds:[0]
add byte ptr [bx], 2
3)其他方法
有些指令默认了访问的是字单元还是字节单元,比如,push [1000H]就不用指明访问的是字单元还是字节单元,因为push指令只进行字操作。