1-计算机和汇编语言

1. 什么是汇编语言

汇编语言(assembly language)是一种用于电子计算机、微处理器、微控制器或其他可编程器件的低级语言,亦称为符号语言,是计算机高级程序设计语言的鼻祖。汇编语言不像其他大多数的程序设计语言一样被广泛用于程序设计,但是汇编语言运行效率非常高,快速执行和响应,在某些场合下仍然有着不可替代的作用,例如操作系统内核,工业控制,驱动设备等领域具有广泛的应用。

 

2. 为什么要学习汇编语言

那我们为什么还要学习汇编语言呢?这是因为汇编语言在计算机中有着独特的作用——直击计算机系统的核心,可以帮助我们更好的学习和理解计算机原理和操作系统的理解,所以学习汇编语言还是很有必要的。

也就是说,通过学习汇编语言,我们能够感知,体会和理解机器的逻辑功能。向上为理解各种软件系统的原理,打下技术理论基础;向下为掌握硬件系统的原理,打下实践应用基础,并掌握底层的程序调试和错误分析方法。

 

3. 由机器语言到汇编语言

 

3.1 机器语言与机器指令

机器语言是机器指令的集合。

机器指令是一台机器可以正确执行的命令。

机器指令则是由一串二进制数(0和1)来表示的,例如01010000。

 

所以在早期程序员们的工作就是将0 , 1这样的二进制数的程序代码打在纸带或卡片上,1表示打孔,0表示不打孔,再将程序通过纸带或卡片机输入计算机进行运算。

例如计算S = 768 + 12288 - 1280这样的程序,对应的二进制机器码指令如下:

101100000000000000000011

000001010000000000110000

001011010000000000000101

但是这样会有一个问题,如果用打纸带编写这样的程序时,不小心写错了,要找出错误是非常头疼的,所以机器码指令对于排错极其不方便,而汇编语言就是为了解决这样的问题。

3.2 汇编语言和汇编指令

1-计算机和汇编语言_第1张图片 图1

 

汇编语言的主体就是汇编指令。

汇编指令和机器指令的差别在于指令的表示方法上,汇编指令是机器指令便于记忆的书写格式,也就是说汇编指令其实就是机器指令的助记符,便于程序员们记忆。

 

3.3 汇编语言编写程序的工作过程

程序员们可以通过汇编指令代替机器指令编写程序,但计算机只认识机器指令,难点在于计算机要如何执行程序员用汇编指令编写的程序?这就需要一个能将汇编指令翻译成机器指令的翻译程序,而这个翻译的程序我们通常叫做“汇编器”或者“编译器”。

1-计算机和汇编语言_第2张图片

从上图中可以清楚的看到汇编语言的工作过程,当程序员们编写好一段汇编程序指令后,计算机是不能直接执行汇编指令,需要运行编译器把汇编程序编译成机器码指令,然后再交给计算机去执行。

 

下图是汇编程序的示例:

1-计算机和汇编语言_第3张图片 图3

 

伪指令不是计算机能直接执行的,而是由编译器把伪汇编指令转换成纯汇编指令,再转成机器码指令的过程中需要用到的。

 

4. 浅谈计算机的组成

主板上主要有以下这些部件:

 CPU,是计算机的运算核心和控制核心(即中央处理器)

 总线,计算机在运行过程中传输数据或指令

 内存,计算机运行过程中数据的读写

 扩展槽(接外部设备),例如显示器,键盘鼠标等 

cpu是计算机的核心部件,想要让cpu进行工作运算就必须向它提供指令和数据,而数据和指令存放在存储器(内存)中。

4.1 处理器

处理器是一台电子计算机的核心,它会从内存中获取指令,并发起一系列由该指令所以定义的操作,当这些操作结束后,它接着再取下一条指令,通常情况下,这个过程是连续不断,循环往复的。

4.2 寄存器和算术逻辑部件

处理器有很多引脚,其中有一部分引脚是用来将参与运算的数据送入处理器内部,有些引脚是复用的,当被加数送入处理器,就需要通过寄存器存储数据。算术逻辑单元是专门负责运算的,可以计算加法,减法或乘法,也可以做逻辑运算。

处理器内部还会有一个控制器,在指令的执行过程中,负责给各个部件发送控制信号,使各个部件在某个时间点执行某个动作。

1-计算机和汇编语言_第4张图片 标题

 

例如RA和RB寄存器分别存储了被加数和加数,然后算数逻辑单元计算完后会将结果存储到寄存器RC中。

处理器总是很繁忙,当它在工作运行的时候,所有数据在寄存器里面都只能是临时存在一会,然后在送往别处,这也是它为什么叫做“寄存器”的原因。在早期寄存器只能保存4比特,8比特,16比特,也称为4位,8位,16位寄存器,现在的处理器一般是32位或64位,甚至更多。

 

4.3 指令和数据的表示

计算机中的数据和指令一般是存储在磁盘或内存中,永久性的存储是存放在外存中,也就是磁盘;当计算机在开始运行工作的时候,需要把数据从外存(磁盘)读到内存中,然后cpu通过总线对数据和指令进行运算。

 

我们知道数据和指令都是由二进制表示的,1000100111011000这样的二进制信息是数据,还是指令呢?

1000100111011000 ─> 89D8H (数据)

1000100111011000 ─> MOV AX,BX (程序)

 

如果我们把这样的二进制信息当做数据来看的话,那么就是89D8H,H代表是十六进制的数据形式;如果当做程序来看的话,就是MOV AX,BX这样的汇编程序指令;也就是说既可以当做数据,也可以当做程序,当然这是由CPU来决定的。

 

数据的表示:

1000100111011000B (二进制)

89D8H (十六进制)

104730O(O代表八进制)

35288D(D代表十进制)

 

4.4 计算机中的存储单元

存储器被划分为若干个存储单元,从0开始顺序编号。

1-计算机和汇编语言_第5张图片 标题

 

例如:一个存储器有128个存储单元,编号从0~127,但实际上内存空间是很大的,8086有20条数据线,寻址空间220,为1MB,编号为0~FFFFF。

4.5 计算机中的总线

在计算机中专门有连接CPU和其他芯片的导线,通常称为总线(英文为BUS),计算机中的总线有数据总线(Data Bus),地址总线(Address Bus),控制总线(Control Bus),如下图所示:

1-计算机和汇编语言_第6张图片

 

地址总线(Address Bus):cpu是通过地址总线来指定存储数据的地址,当cpu要从存储单元(内存)读取或存储数据时,就可以通过地址总线把数据存储到指定的地址中。地址总线越多说明可寻址的地址范围越大,N根地址总线(宽度为N),对应寻址空间为2^{N} 。

1-计算机和汇编语言_第7张图片

数据总线(Data Bus):CPU与内存或其它器件之间来回传输需要处理或存储数据的总线。数据总线的宽度决定了CPU和外界的数据传送速度。

举个例子,向内存中写入数据89D8H时的数据传送。

1-计算机和汇编语言_第8张图片

上图是8088CPU和8086CPU写入数据89D8H(十六进制) ,8088CPU只有8位数据总线的,这意味着8088CPU每次只能传输8位的数据,在传输89D8H十六进制数据时,需要传输两次。8086CPU有16位数据总线,每次可以传输16位的数据,在传输89D8H数据只需要传输一次就可以了。

 

控制总线:CPU通过控制总线对外部器件进行控制,控制总线是一些不同控制线的集合,控制总线宽度决定了CPU对外部器件的控制能力。

 

5. 内存读写与地址空间

 

 

5.1 CPU对存储器的读写

CPU要想进行数据的读写,必须和外部器件进行三类信息的交互:即存储单元的地址(地址信息),器件的读或写命令(控制信息),读或写的数据(数据信息)

 

CPU对存储器的读写示例:

机器码:   101000000000001100000000

16进制:   A00300

汇编指令: MOV AL,[3]

1-计算机和汇编语言_第9张图片

MOV AL,[3]汇编指令的含义就是从编号为3的存储单元读取数据存储到寄存器AL,过程如上图所示:CPU通过地址线找到编号为3的存储单元,然后通过控制线发出读取数据命令,再由数据线把内存的数据08传输到CPU中。

 

5.2 内存地址空间

CPU是如何通过地址线找到内存中的数据的?这又得提到内存地址空间了。

CPU地址总线宽度为N,那么其寻址空间为2^{N};8086CPU的地址总线宽度为20,那么其寻址空间就是2^{20},可以寻址1MB个内存单元,其内存地址空间为1MB。

CPU管理地址空间分配

1-计算机和汇编语言_第10张图片

所有的物理存储器被看作一个由若干存储单元组成的逻辑存储器,每个物理存储器在这个逻辑存储器中占有一个地址段,即一段地址空间;CPU在这段地址空间中读写数据,实际上就是在相对应的物理存储器中读写数据。

 

5.3 寄存器及数据存储

寄存器是CPU内部的信息存储单元,8086CPU有14个寄存器:

通用寄存器:AX、BX、CX、DX

变址寄存器:SI、DI

指针寄存器:SP、BP

指令指针寄存器: IP

段寄存器:CS、SS、DS、ES

标志寄存器:PSW

8086CPU所有的寄存器都是16位的,可以存放两个字节。

 

以通用寄存器AX为例,一个16位寄存器存储一个16位的数据,最大可以存储216 - 1,十进制为65535。

1-计算机和汇编语言_第11张图片

 

 

在AX中存储20000D(八进制),十六进制为4E20H,二进制为0100111000100000B:

 

那么现在有一个问题,上一代CPU中的寄存器都是8位的,那么8086CPU要如何保证程序的兼容性?

1-计算机和汇编语言_第12张图片

 

解决方案就是通用寄存器都可以分为两个独立的8位寄存器使用,也就是说,对于AX寄存器,可以分为AH和AL两个独立的寄存器,当你操作其中一个寄存器时,并不会影响到另一个寄存器;同理, BX可以分为BH和BL, CX可以分为CH和CL,等等......

另外,把二进制数据转换成十六进制可以直观的看出这个数据是由哪些8位数据构成。

 

5.4 “字”在寄存器中的存储

1-计算机和汇编语言_第13张图片

对于8086CPU来说,它的寄存器是16位的,可以存储2个字节,这称为1个字(word),各个数位编号为0 - 15,其中0-7是低字节,8-15是高字节,这个字的高位字节存在这个寄存器的高8位寄存器, 这个字的低位字节存在这个寄存器的低8位寄存器。

同理,对于32位寄存器可以存放4字节,这称为一个双字(double word),各个数位编号为0 - 31,其中0-15是低字节,16-31是高字节。64位寄存器以此类推.....

你可能感兴趣的:(汇编修炼心法)