2.1 综述
这部分内容主要是一些计算机硬件的概念,如果你有计算机基础可以不看。当然,也可以作为学习汇编的热身运动,毕竟有好多东西我们平常不使用总会忘记或者忽略。
2.2 机器语言
机器语言是机器指令集合。机器指令展开来讲就是一台机器可以正确执行的命令。电子计算机的机器指令是一列二进制数字。计算机将之转变为一列高低电平,以使计算机的电子器件受到驱动,进行计算。
现在,我们常用的PC机中,有一个芯片来完成上面所说的计算机的功能。这个芯片就是我们常说的CPU,CPU是一种微处理器。
机器语言是 0 1 代码,难于辨别和记忆!
2.3 汇编语言的产生
机器指令的可读性和维护性对人来说,太难了,汇编语言应运而生。
汇编语言的主体是汇编指令。汇编指令和机器指令的区别在于表示方法上。
例如:
1000100111011000
上面的指令表示把寄存器BX的内容送到AX中。汇编指令改写成:
mov ax,bx
这样的写法与人类语言相近,便于阅读和记忆。
什么是寄存器?
简单的讲是 CPU 中可以存储数据的器件,一个CPU中有多个寄存器。AX是其中一个寄存器的代号,BX是另一个寄存器的代号。
有了汇编语言我们就可以直接用汇编指令编写源程序。可是,计算机能读懂的只有机器执行,那么我们就需要一个能将汇编指令转换为机器指令的翻译程序,这样的程序我们称之为:编译器。
我们通过汇编语言写出源程序,然后再用编译器将其编译成机器码(机器指令),由计算机最终执行。图 2-1描述了整个过程。
2.4 汇编语言的组成
三类指令:
- 汇编指令:机器码的助记符,有对应的机器码;
- 伪指令:没有对应的机器码,由编译器执行,计算机并不执行;
- 其他符号:如+、-、*、/ 等,由编译器识别,没有对应的机器码。
核心是汇编指令,它决定了汇编语言的特性。
2.5 存储器
CPU 是计算机核心部件,它控制整个计算机的运作并进行计算。要想让一个CPU工作,就必须向它提供指令和数据。内存,存放着这些指令和数据。要灵活的利用汇编程序,我们首先要了解CPU是如何从内存中读取信息,以及向内存中写入信息的。
2.6 指令和数据
指令和数据的区分是在应用上的概念。在内存或者磁盘上,指令和数据没有任何区别看,都是二进制信息。CPU在工作的时候会把有的信息看做指令,有的信息看做数据,为同样的信息赋予了不同的意义。就如同:
二进制信息: 1000 1001 1101 1000,计算机可以把它看做 89D8H 的数据来处理,也可以看做 mov ax,bx 来执行。
2.7 存储单元
存储器别划分为若干个存储单元,每个存储单元从 0 开始顺序编号,例如一个存储器有 128 个存储单元,编号从 0 ~ 127 , 如图 2-2。
那么一个存储单元能存储的信息是多少?
计算机最小信息单位是 bit, 8 个 bit 构成一个 Byte,即 8 个二进制位。微型计算机的存储单元可以存储一个 Byte。一个存储器有 128 个存储单元的,那么可存储 128 个Byte。
2.8 CPU 对存储器的读写
CPU 对存储器的读写涉及三个方面:
- 地址信息,存储单元的地址;
- 控制信息,器件的选择,因为在计算机中不仅仅只有存储器这一个器件,以及读/写操作的选择
- 数据信息,需要读/写的数据
计算机中能处理、传输的信息都是电信号,电信号的传输通过导线实现。所以,要完成上面的操作,必须有专门的导线连接,所有的导线在计算机中称之为: 总线。
根据导线上传输的信息的不同,将导线分为:
- 地址总线
- 控制总线
- 数据总线
CPU 从 3 号内存单元中读取数据的过程 如图 2-3 所示:
- CPU 通过地址总线将地址信息 3 发出;
- CPU 通过控制总线发出内存读取命令,选中存储器芯片,并通知它,将要从中读取数据
- 存储器 3 号单元中的数据 8 通过数据总线送入 CPU。
同样,写操作和读取操作类似。如果向 3 好单元写入数据,其步骤如下:
- CPU 通过地址总线将地址信息 3 发出;
- CPU 通过控制总线发出内存写命令,并选中存储芯片,通知他要进行写操作
- CPU 通过数据线将数据 26 送入到内存存储的 3 号单元中
我们已经知道了 CPU 是如何进行数据读写操作的,那么,如何命令计算机进行数据的读写呢?
要想让计算机工作,应向其处理器输入能够驱动它进行工作的电平信息(机器码)
对于 8086CPU 下面的机器码,能够完成从 3 号 单元读取数据操作
机器码: 10100001000000110000000
解释: 从 3 号存储单元读取数据并送入到寄存器 AX 中
CPU接收到这条机器码后将完成我们上面所述的读写操作
机器码难于记忆,通过汇编指令表示,情况如下:
机器码: 10100001 00000011 000000000
对应的汇编指令: MOV AX , [3 ]
解释: 传送 3 号 单元的内容如 AX
2.9 地址总线
现在,我们知道CPU 通过地址总线来指定要访问的存储单元。可见地址总线上能传送多少个不同的信息,CPU就能对多少个存储单元进行寻址。
现假设,一个 CPU 有 10 根地址总线,让我们来看一下它的寻址情况。我们知道,在计算机中,一根导线可以传送的稳定状态只有两种,高电平和低电平。用二进制表示就是 1 或者 0, 10 根导线可以传送 10 位 二进制数据。而 10 位二进制数可以表示多少个不同的数据呢? 2^10 = 1024, 也就是可以表示 1024 个不同的数据,最小是 0,最大是 1023。
图 2-4 展示了一个具有 10 根地址线的CPU向内存发送地址信息 11 时候, 10 根地址线上传送的二进制信息。如果访问地址12 、 13 、 14 等内存单元,地址线上传输的内容又是多少呢?
一个CPU有 N 根地址线,则可以说这个额CPU 的地址总线宽度为 N。
这样 CPU最多可以寻找 2 ^ N 个内存单元。
2.10 数据总线
CPU 与 内存或者其他器件之间的数据传送是通过数据总线来进行的。数据总线的宽度决定了CPU和外界的数据传送的速度。 8 根数据总线一次可传送 8 位二进制数(也就是一个字节)。 同理,16根数据总线可以传送两个字节。
8088CPU 的数据总线宽度为 8, 8086CPU 的数据总线宽度为 16。我们分别看下它们向内存中写入数据 89D8H时,是如何通过数据总线传送数据的。
如图 2-5 所示,8088CPU数据总线上的数据传送情况:
如图 2-6 所示, 8086CPU数据总线数据传输情况:
8086CPU 有 16 根数据线,可以一次传送 16 位数据,所以可一次传送数据 89D8H;
而 8088CPU 只有 8 根数据线,一次只能传送 8 位数据,所以向内存写入数据 89D8H时需要进行两次数据传送。
2.11 控制总线
CPU 对外部器件的控制是通过控制总线进行的。在这里控制总线是个总称,控制总线是一些不同控制线的结合。有多少根控制总线,就意味着 CPU 提供了对外部器件的多少种控制。所以,控制总线的宽度决定了 CPU 对外部器件的控制能力。
2.12 总结:
- 汇编指令是机器指令的助记符,通机器指令一一对应;
- 每一种 CPU 都有自己的汇编指令集;
- CPU 可直接使用的信息存储在存储器中;
- 在存储器中指令和数据没有区别,都是二进制信息;
- 存储单元从 0 开始编号;
- 一个存储单元可以存储 8 个bit;
- 1 Byte = 8 bit, 1 KB = 1024 B 1 MB = 1024KB 1GB = 1024MB
- 每个CPU芯片都有许多银角,这些银角和总线相连。也可以说,这些银角引出总线。一个 CPU 可以引出 3 中总线宽度标志了这个CPU的不同方面的性能:
- 地址总线的宽度决定了CPU的寻址能力
- 数据总线的宽度决定了CPU与其他器件进行数据传送时一次数据传送量
- 控制总线的宽度决定了CPU对系统中其他器件的控制能力
2.13 主板
在每一台 PC 机中,都有一个主板,主板上有核心器件和一些主要器件,这些器件通过总线相连。这些器件有CPU、存储器、外围芯片组、扩展插槽。扩展插槽上一般有 RAM 内存条和各类接口卡。
2.14 接口卡
计算机系统中,所有可用程序控制其工作的设备必须受到 CPU 的控制。 CPU 对外部设备都不能直接控制,CPU对外部设备不能直接控制,如显示器、音响、打印机等。直接控制这些外部设备进行工作的是插在扩展插槽上的接口卡。扩展插槽通过总线和CPU相连,所以接口卡也通过总线和CPU相连。CPU可以直接控制这些接口卡,从而实现 CPU 对外设的间接控制。简单地讲,就是CPU通过总线向接口卡发送命令,接口卡根据CPU的命令控制外设进行工作。接口卡作为了CPU控制外设的一个媒介。
2.15 各类存储器芯片
一台PC机中,装有多个存储芯片,这些存储芯片从物理连接上看是独立的、不同的器件。从读写属性上看分为两类:随机存储器(RAM)和只读存储器(ROM)。随机存储器可读可写,但必须带电存储,关机后存储的内容丢失;只读存储器只能读取不能写入,关机后其中的内容不会丢失。这些存储器从功能和连接上又可分为以下几类:
- 随机存储器
用于存放共 CPU 使用的绝大部分程序和数据,主随机存储器一般由两个位置上的 RAM 组成,装在主板上RAM和插在扩展插槽上的RAM。 - 装有 BIOS的ROM(BIOS:Basic Input/Output System)
BIOS 是有主板和各类接口卡(如显卡、网卡等)厂商提供的软件系统,可以通过它利用该硬件设备进行最基本的输入输出。在主板和某些接口卡上插有存储相应BIOS的ROM。例如, 主板上的ROM中存着主板的BIOS;显卡上的ROM中存储着夏卡的BIOS;如果网卡装有 ROM,那么其中就可以存储网卡的BIOS - 接口卡上的RAM
某些接口卡需要对大批量输入、输出数据进行暂时存储,在其上装有 RAM。最典型的显示卡上的 RAM,一般为显存。显示卡随时将显存总的数据向显示器上输出。换句话说,我们将需要显示的内容写入显存,就会出现在显示器上。
图 2-7 展示了 PC 系统中各类存储器的逻辑连接情况
2.16 内存地址空间
什么是内存地址空间? 举例来讲,一个CPU的地址总线宽度为 10, 那么可寻址 1024 个内存单元,这 1024 个可寻到的内存单元就构成了这个CPU的内存地址空间。
上面介绍的那些存储器,在物理上都是独立的器件,但是在以下两点上相同。
- 都和CPU的总线相连
-
CPU 对它们进行读或写的时候都通过控制线发出内存读写命令
这也就是说,CPU 在操控它们的时候,把它们当做内存来对待,把它们总的看做一个由若干存储单元组成的逻辑存储器,这个逻辑存储器就是我们说的内存地址空间。在汇编学习过程中,我们所面对的就是内存地址空间。
如图所示,所有的物理存储器都被看做一个由若干存储单元组成的逻辑存储器,每个物理存储器在这个逻辑存储器中占有一个地址段,即一段地址空间。CPU 在这段地址空间中读写数据,实际上就是在相对应的物理存储器中读写数据。
假设,图 1-8 中的内存地址空间的地址段分配如下:
- 地址 0~7FFFH的 32 KB 空间为主随机存储器的地址空间(RAM主存储器材);
- 地址8000H~9FFFH的8KB空间为显存地址空间;
- 地址A000H~FFFFH 的 24 KB 空间为各个ROM的地址空间;
(温馨提示:如果对于 16 进制到 空间的转换,看不明白,需要仔细计算下上面的说法)
这样,
- CPU 向内存地址为 1000H的内存单元写入数据,这个数据就被写入主随机存储器中;(1000H < 7FFFH)
- CPU 向内存地址为 8000H 的内存单元写入数据,这个数据就被写入到了显存中,然后显卡输出到显示器上;(8000H < 9FFFH & 8000H > 7FFFH)
- CPU 向内存地址为 C000H 的内存单元写入数据的操作是没有结果的, C000H 单元中内容只读不能修改。C000H 单元实际上就是 ROM存储器中的一个。(C000H > A000H & C000H < FFFFH)
内存地址空间的大小受 CPU 地址总线宽度的限制。 8086CPU 的地址总线宽度为 20,可以传送 2^20 个不同的地址信息(0 ~ 2^20 - 1)。也就是说可以定位 2^20 个内存单元,则 8086CPU 的内存地址空间大小为 1MB。同理,80386CPU 的地址总线宽度为 32,则内存地址空间最大为 4 GB。
我们基于一个计算机硬件系统编程的时候,必须知道这个系统的内存地址空间分配情况。因为当我们想在某类存储器中读写数据的时候,必须知道它的第一个单元的地址和最后一个单元的地址,才能保证写操作是在预期的存储器中进行。比如,我们希望向显示器输出一段信息,那么必须将这段信息写到显存中,显卡才能将它输出到显示器上。而要想向显存中写入数据,必须知道显卡在内存地址空间的地址。
不同的计算机系统的内存地址空间的分配情况是不同的。如图 2-9 8086PC 机内存地址空间分配情况:
8086CPU 有 16 根数据总线和 20 根地址总线
从图中可以得知,
- 从地址 0~9FFFF 的内存单元中读取数据,实际上就是在读取主随机存储器中的数据;
- 向地址 A0000~BFFFF 的内存单元写数据,就是向显存中写入数据,这些数据会被显卡输出到显示器上;
- 向地址 C0000~FFFFF 的内存单元写入数据的操作无效,因为这段地址是访问的只读存储器的内容
内存地址空间小结
最终运行程序的是 CPU,我们用汇编语言的时候,必须要从 CPU 的角度考虑问题。对 CPU 来讲,系统中的所有存储器中国的存储单元都处于一个统一的逻辑存储器中,它的容量收CPU寻址能力的限制。这个逻辑存储器即使我们所说的内存地址空间。
DONE!整理耗时 5 小时