ClimberCoding

王爽《汇编语言》学习笔记

文章目录

一、基础知识
- 1、基础概念
- 2、存储器
- 3、三种外部总线
- 4、CPU对外设的控制
- 5、内存地址空间
二、寄存器
- 1. 寄存器
- 2. 8086CPU 给出物理地址的方法
- 3. 段寄存器
- 4. 字
- 5. DS 和 [address]
- 6. 栈(SS和SP)
三、第一个程序
- 1.汇编程序从写出到执行的过程
- 2. 程序执行过程
四、[BX] 和 loop指令
- 1. [bx] 和 loop指令
- 2. Debug和masm编译器对指令的不同处理
- 3. loop 和 [bx] 的联合应用
- 用一个16位寄存器来做中介。将内存单元中的8位数据赋值到一个16位寄存器a中，再将ax中的数据加到dx，从而使两个运算对象的类型匹配并且不会越界。
- 4. 安全的编程空间
五、包含多个段的程序
六、更灵活的定位内存地址的方法
- 1. and 和 or 指令
- 2.关于ASCII码
- 3. 大小写字符转换的问题
- 4. [bx+idata]
- 5. SI和DI寄存器
- 6. 不同的寻址方式的灵活应用
七、数据处理的两个基本问题
- 1. bx、si、di和bp
- 2. 机器指令处理的数据在什么地方
- 3. 汇编语言中数据位置的表达
- 4. 寻址方式
- 5. 指令要处理的数据有多长
- 6. div指令(除法指令)
- 7. 伪指令dd，dup
八、转移指令的原理
- 1. 操作符offset
- 2. jmp指令
- - 2.1 依据位移进行转移的jmp指令
  - 2.2 转移的目的地址在指令中的jmp指令
  - 2.3 转移地址在寄存器中的jmp指令
  - 2.4 转移地址在内存中的jmp指令
- 3. jcxz指令
- 4. loop指令
- 5. 编译器对转移位移超界的检测
九、CALL 和 RET 指令
- 1. ret 和 retf
- 2. call 指令
- - 2.1 依据位移进行转移的call指令
  - 2.2 转移的目的地址在指令中的call指令
  - 2.3 转移地址在寄存器中的call指令
  - 2.4 转移地址在内存中的call指令
- 3. call 和 ret 的配合使用
- 4. mul 指令(乘法指令)
十、标志寄存器
- 1. ZF标志（零标志位）
- 2. PF标志（奇偶标志位）
- 3. SF标志（符号标志位）
- 4. CF标志（进位标志位）和 OF寄存器（溢出标志位）
- 5. adc指令和 sbb指令
- 6. cmp指令
- 7. 检测比较结果的条件转移指令
- 8. DF标志(方向标志位)和串传送指令
- 9. pushf 和 popf
十一、内中断
- 1. 内中断的产生
- 2. 中断处理程序和中断向量表
- 3. 中断过程
- 4. iret指令
- 5. 除法错误中断的处理
- 6. 单步中断
- 7. int指令
- 8. 编写中断例程
- 9. BIOS和DOS所提供的中断例程
十二、端口
- 1. 端口基本概念
- 2. 端口的读写
- ３. CMOS RAM芯片
- 4. shl和shr指令
十三、外中断
- 1. 接口芯片和端口
- 2. 外中断信息
- - 1、可屏蔽中断
- 3. PC机键盘的处理过程
- 4. 编写int 9中断例程
十四、指令系统总结
十五、直接定值表
- 1. 描述单元长度的标号
- 2.在其他段中使用数据标号

前言：本笔记主要记录自己在学习过程中的易错、易混淆点，单看笔记可能无法串联知识点，需要结合书本才行。

一、基础知识

1、基础概念

机器指令：CPU能直接识别并执行的二进制数字。

计算机将机器指令转变为一列高低电平，以使计算机的电子器件受到驱动，进行运算。

汇编指令：机器指令的助记符，同机器指令一一对应。

指令：指令通常由操作码和地址码（操作数）两部分组成

指令集：每种CPU都有自己的汇编指令集。

机器语言：机器指令的集合。

汇编语言由3类指令组成。

汇编指令
伪指令：没有对应的机器码，由编译器执行，计算机并不执行
其他符号：如+、-、*、/等，由编译器识别，没有对应的机器码。

编译器：能将汇编指令转换成机器指令的翻译程序。

在内存或磁盘上，指令和数据没有任何区别，都是二进制信息。

磁盘不同于内存，磁盘上的数据或程序如果不读到内存中，就无法被CPU使用。

2、存储器

随机存储器（RAM）在程序的执行过程中可读可写，但必须带电存储，关机后存储的内容丢失。

只读存储器（ROM）在程序的执行过程中只读，关机后数据不丢失。

3、三种外部总线

CPU要想进行数据的读写，必须和外部器件(芯片)进行以下三类信息的交互：

存储单元的地址（地址信息）
器件的选择，读或写的命令（控制信息）
读或写的数据（数据信息）

那CPU是通过什么将地址、数据和控制信息传到存储器芯片中的呢？

答：在计算机中专门有连接CPU和其他芯片的导线，通常称为总线 (物理上来讲，就是一根根导线的集合)

地址总线：CPU通过地址总线来指定存储单元的地址

一个CPU有N根地址线，则可以说这个CPU的地址总线宽度为N。这样的CPU最多可以寻找 2^n 个内存单元。
数据总线：数据总线的宽度决定了CPU和外界的数据传送速度。

8根数据总线一次可以传送一个8位二进制数据(即一个字节)。
控制总线：有多少根控制总线，就意味着CPU对外部器件提供多少种控制。

4、CPU对外设的控制

CPU对外设都不能直接控制，如显示器、音箱、打印机等。

直接控制这些设备进行工作的是插在扩展插槽上的接口卡。CPU可以直接控制这些接口卡，从而实现CPU对外设的间接控制。

如：CPU无法直接控制显示器，但CPU可以直接控制显卡，从而实现对显示器的间接控制。

5、内存地址空间

CPU将系统中各类存储器看作一个逻辑存储器，这个逻辑存储器就是我们所说的内存地址空间。

CPU将各类存储器看作一个逻辑存储器：

我们在基于一个计算机硬件系统编程的时候，必须知道这个系统中的内存地址空间分配情况。因为当我们在某类存储器中读写数据的时候，必须知道它的第一个单元的地址和最后一个单元的地址，才能保证读写操作是在预期的存储器中进行。

二、寄存器

1. 寄存器

CPU由运算器、控制器、寄存器等器件构成，这些器件靠内部总线相连。

运算器进行信息处理；控制器控制各种器件进行工作；寄存器进行信息存储；内部总线连接各种器件，在它们之间进行数据的传送。

8086CPU为了兼容上一代的8位寄存器，AX,BX,CX,DX这四个寄存器可以拆开成两个独立的 8位的寄存器来使用。分别为AH,AL, BH,BL, CH,CL, DH,DL。低八位（编号0-7）构成L寄存器，高八位构成H寄存器。

汇编指令或寄存器名称不区分大小写。

在进行数据传送或运算时，要注意指令的两个操作对象的位数应当是一致的。

2. 8086CPU 给出物理地址的方法

CPU通过地址总线送入存储器的，必须是一个内存单元的物理地址。

8086CPU采用一种在内部用两个16位地址合成的方法来形成一个20位的物理地址。

地址加法器采用物理地址 = 段地址×16 + 偏移地址的方法用段地址和偏移地址合成物理地址。

“段地址x16” 其实就是二进制数左移4位。

拓展：一个数据的十六进制形式左移1位，相当于乘以16；一个数据的十进制形式左移1位，相当于乘以10；一个X进制的数据左移1位，相当于乘以X。

3. 段寄存器

CS为代码段寄存器，IP为指令指针寄存器，它们的内容提供了CPU要执行指令的地址。

8086CPU的工作过程简要描述：

从CS:IP指向的内存单元读取指令，读取的指令进入指令缓冲器；
IP=IP+所读取指令的长度，从而指向下一条指令；
执行指令。转到步骤1，重复这个过程。

mov指令(传送指令)不能用于设置CS、IP的值，8086CPU提供转移指令修改CS、IP的内容。

jmp 段地址:偏移地址：用指令中给出的段地址修改CS，偏移地址修改IP。如：jmp 2AE3:3
jmp 某一合法寄存器：用寄存器中的值修改IP。如：jmp ax，在含义上好似：mov IP，ax

4. 字

字单元：存放一个字型数据(16位)的内存单元，由两个地址连续的内存单元组成。

对于字，只要在mov指令中给出16位的寄存器(如，用AX而不是AL/AH)就可以进行16位数据的传送。

5. DS 和 [address]

DS寄存器：存放要访问数据的段地址

[address]：表示一个偏移地址为address的内存单元（8086CPU自动取ds中的数据为内存单元的段地址）。

通过段地址和偏移地址即可定位内存单元。

6. 栈(SS和SP)

8086CPU提供入栈和出栈指令，即可以将一段内存当作栈来使用。

8086CPU的入栈和出栈操作都是以字为单位进行的！

问：CPU如何知道栈顶的位置？

答：8086CPU中由两个寄存器，段寄存器SS和寄存器SP，栈顶的段地址存放在SS中，偏移地址存放在SP中。任意时刻，SS:SP指向栈顶元素

入栈

push ax表示将寄存器ax中的数据送入栈中，由两步完成。

SP=SP-2，SS:SP指向当前栈顶前面的单元，以当前栈顶前面的单元为新的栈顶；
将ax中的内容送入SS:SP指向的内存单元处，SS:SP此时指向新栈顶。

入栈时，栈顶从高地址向低地址方向增长。

出栈

pop ax表示从栈顶取出数据送入ax，由以下两步完成。

将SS:SP指向的内存单元处的数据送入ax中；
SP=SP+2，SS:SP指向当前栈顶下面的单元，以当前栈顶下面的单元为新的栈顶。

8086CPU中没duan有记录栈顶上限和栈底的寄存器，因此需要程序员自己操心栈顶超界的问题。

CPU将内存中的某段内容当作代码，是因 CS:IP 指向了那里；CPU将内存中的某段内容当作栈，是因为 SS:SP 指向了那里。一定要弄清楚什么是我们的安排以及如何让CPU按照我们的安排行事。

三、第一个程序

先看一段简单的汇编语言源程序

assume cs:codesg

codesg segment

	mov ax,0123H
	mov bx,0456H
	add ax,bx
	add ax,ax

	mov ax,4c00
	int 21H

codesg ends

end

对程序进行说明：

XXX segment ··· ··· XXX ends
- segment和ends成对出现，代表一个段的开始和结束。
- 一个汇编程序是由多个段组成的，这些段被用来存放代码，数据或当作栈空间来使用。一个有意义的汇编程序至少要有一个段(存放代码)。
end
- end：一个汇编程序结束的标记，遇到end后编译器停止编译。
assume
- 含义为“假设”，假设某一个段寄存器和程序中的某一个用segment ···ends 定义的段关联。
- 可以理解为将这个段寄存器指向程序段的段地址
标号（codesg）
- 一个标号指代一个地址
程序返回 mov ax, 4c00 int 21H
- 这两条指令代表程序返回

1.汇编程序从写出到执行的过程

2. 程序执行过程

DOS系统中 .EXE文件中的程序的加载过程

四、[BX] 和 loop指令

1. [bx] 和 loop指令

[bx] ：同样表示一个内存单元，它的偏移地址在bx中，段地址默认在ds中。

loop(循环)指令：loop 标号，CPU执行loop指令的时候，要进行两步操作：

(cx) = (cx) - 1；
判断 cx 中的值，不为零则转至标号处执行程序，如果为零则向下执行。

程序示例：编程计算2^12。

assume cs:code 

code segment 
	mov ax, 2
	
	mov cx, 11 
s:  add ax, ax 	;汇编中，这的标号s 实际标识了一个地址，这个地址处有一条指令：add ax，ax。
	loop s     
	
	mov ax,4c00h 
	int 21h 
code ends 
end

用 cx 和 loop 指令相配合实现循环功能的程序框架如下：

	mov cx,循环次数
s:
	循环执行的程序段
	loop s

2. Debug和masm编译器对指令的不同处理

形如 mov ax,[idata] 的指令在Debug和masm中有着不同的解释:

Debug是将它解释为 “[idata]” 是一个内存单元，“idata” 是内存单元的偏移地址；

而编译器masm中则是将 “[idata]” 解释为“idata”。

解决方法1：先将偏移地址送入BX，然后再使用mov ax,[bx]
解决方法2：直接在 “[ ]” 的前面显式地给出段地址所在的段寄存器，如 mov al, ds:[0] 。

这种写法通过编译器之后会变成Debug中的 mov al,[0]

拓展：

这些出现在访问内存单元的指令中，用于显式地指明内存单元的段地址的“ds:”，“cs:”，“ss:”，“es:”，在汇编语言中称为段前缀。

3. loop 和 [bx] 的联合应用

直接看例子：

计算ffff:0 ~ ffff:b单元中的数据的和，结果存储在 dx 中

分析：

这些内存单元都是字节型数据范围0 ~ 255 ，12个这样的数据相加，结果不会大于65535，可以在dx中存放下。
对于8位数据不能直接加到16位的寄存器 dx 中。
如果仅向 dl 中累加 12 个 8 位数据，很有可能造成进位丢失。

解决方案：

用一个16位寄存器来做中介。将内存单元中的8位数据赋值到一个16位寄存器a中，再将ax中的数据加到dx，从而使两个运算对象的类型匹配并且不会越界。

assume cs:code 

code segment 
	mov ax, 0ffffh ;在汇编源程序中，数据不能以字母开头，所以要在前面加0
	mov ds, ax 
	mov bx, 0   ;初始化ds:bx指向ffff:0
	mov dx, 0   ;初始化累加寄存器dx，（dx）= 0
	
	mov cx, 12  ;初始化循环计数寄存器cx，（cx）= 12
s:  mov al, [bx]
	mov ah, 0
	add dx, ax  ;间接向dx中加上（（ds）* 16 +（bx））单元的数值
	inc bx      ;ds:bx指向下一个单元
	loop s 
	
	mov ax, 4c00h 
	int 21h 
code ends 
end

4. 安全的编程空间

之前没有提到的一个问题，如果在写程序之前不关注要操作的内存，直接开始使用，如果改写了内存中重要的系统数据，可能会引起系统崩溃。可见，在不能确定一段内存空间中是否存放着重要数据或代码的时候，不能随意向其中写入内容。

一般操作系统和合法程序都不会使用0:200~0:2ff这256个字节的空间，所以可以使用这段安全的空间。

学习汇编语言，要通过它来获得底层的编程体验，理解计算机底层的基本工作机理。所以我们尽量直接对硬件编程，而不理会操作系统。

这在纯DOS方式（实模式）下是可以做到的，但在windows或Unix这种运行与CPU保护模式的操作系统上是不可能的，因为这种操作系统已经将CPU全面严格的管理了。

五、包含多个段的程序

一个问题：根据什么设置CPU的 CS:IP 指向程序的第一条要执行的指令？

这一点，是由可执行文件中的描述信息指明的。在一个程序文件中，用伪指令end描述程序的结束和程序的入口。

在编译，连接后，由“end start”指明的程序入口被转化为一个入口地址，存储在可执行文件的描述信息中。

当程序被加载入内存之后，加载者从程序的可执行文件的描述信息中读到程序的入口地址，设置CS:IP。这样CPU就从我们希望的地址处开始执行。

在代码段中使用数据

示例：利用栈，将程序中定义的数据逆序存放

assume cs:codesg 

codesg segment 
	dw 0123h，0456h，0789h，0abch，0defh，0fedh，0cbah，0987h ; 0:0~0:15单元
	dw 0，0，0，0，0，0，0，0，0，0，0，0，0，0，0，0 ; 0:16~0:47单元的空间作为栈使用
			
start:	mov ax, cs 
	    mov ss, ax 
	    mov sp, 30h ;将设置栈顶ss:sp指向栈底cs:30
		
	    mov bx, 0
	    mov cx, 8
	 s: push cs:[bx]
	    add bx, 2
	    loop s    ;以上将代码段0~15单元中的8个字型数据依次入栈
		
	    mov bx, 0
		mov cx, 8
	s0:	pop cs:[bx]		
		add bx，2
		loop s0   ;以上依次出栈8个字型数据到代码段0~15单元中
			
		mov ax，4c00h 
		int 21h 
codesg ends 
end start	;指明程序的入口在start处

在描述dw的作用时，不仅可以说用它来定义数据，也可以说用它来开辟内存空间留给之后的程序使用。

将数据、代码、栈放入不同的段

assume cs:code,ds:data,ss:stack 

data segment 
	dw 0123h,0456h,0789h,0abch,0defh,0fedh,0cbah,0987h ;0-15单元
data ends 

stack segment 
	dw 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 ;0-31单元
stack ends 

code segment 
start:	mov ax, stack	;将名称为“stack”的段的段地址送入ax
		mov ss, ax
		mov sp, 20h  	;设置栈顶ss:sp指向stack:20
		
		mov ax, data 	;将名称为“data”的段的段地址送入ax
		mov ds, ax   	;ds指向data段			
		mov bx, 0    	;ds:bx指向data段中的第一个单元
		
		mov cx, 8
	s:  push [bx]
		add bx, 2
		loop s       ;以上将data段中的0~15单元中的8个字型数据依次入栈
			
		mov bx, 0
		
		mov cx, 8
	s0:	pop [bx]
		add bx, 2
		loop s0      ;以上依次出栈8个字型数据到data段的0~15单元中
			
		mov ax, 4c00h 
		int 21h 
code ends
end start

总之，CPU到底如何处理我们定义的段中的内容，是当作指令执行，当作数据访问，还是当作栈空间，完全是考程序中具体的汇编指令，和汇编指令对 CS:IP、SS:IP、DS 等寄存器的设置来决定的。

六、更灵活的定位内存地址的方法

1. and 和 or 指令

and指令：逻辑与指令，按位进行与运算。

例如指令：

mov al, 01100011B
and al, 00111011B

执行后：al=00100011B

or指令：逻辑或指令，按位进行或运算。

例如指令：

mov al, 01100011B
or al, 00111011B
执行后：al=01111011B

2.关于ASCII码

世界上有很多编码方案，有一种方案叫做ASCII编码，是在计算机系统中通常被采用的。简单地说，所谓编码方案，就是一套规则，它约定了用什么样的信息来表示现实对象。比如说，在ASCII编码方案中，用 61H 表示 “a”， 62H 表示 “b”。一种规则需要人们遵守才有意义。

在文本编辑过程中，我们按一下键盘的a键，就会在屏幕上看到“a”。这是怎样一个过程呢？

我们按下键盘的a键，这个按键的信息被送入计算机，计算机用ASCII码的规则对其进行编码，将其转化为 61H 存储在内存的指定空间中；文本编辑软件从内存中取出 61H ，将其送到显卡上的显存中；工作在文本模式下的显卡，用ASCII码的规则解释显存中的内容，61H被当作字符“a”，显卡驱动显示器，将字符“a”的图像画在屏幕上。

3. 大小写字符转换的问题

在汇编语言中，用 '···' 的方式指明数据是以字符形式给出的，编译器会自动将它们转化为ASCII码。

小写字母的ASCII码值比大写字母的ASCII码值大20H。

重新观察：就 ASCII 码的二进制形式来看，除第五位(位数从0开始计算)外，大写字母和小写字母的其他各位都一样。大写字母 ASCII 码的第5位为0，小写字母的第5位为1。

程序示例：将datasg中的第一个字符串转化为大写，第二个字符串转化为小写

assume cs:codesg, ds:datasg 

datasg segment 
	db 'BaSiC'
	db 'iNfOrMaTion'
datasg end

codesg segment 
start:	mov ax, datasg 
		mov ds, ax	;设置ds 指向 datasg段
		
		mov bx, 0	;设置（bx）=0，ds:bx指向'BaSic'的第一个字母
		
		mov cx, 5     	 ;设置循环次数5，因为'Basic'有5个字母
	 s: mov al, [bx]     ;将ASCII码从ds:bx所指向的单元中取出
		and al, 11011111B ;将al中的ASCII码的第5位置为0，变为大写字母
		mov [bx], al	 ;将转变后的ASCII码写回原单元
		inc bx		     ;（bx）加1，ds:bx指向下一个字母
		loop s 
		
		mov bx, 5		;设置（bx）=5，ds:bx指向，'iNfOrMaTion'的第一个字母
		
		mov cx, 11		;设置循环次数11，因为'iNfOrMaTion'有11个字母
     s0: mov al, [bx]
		or al, 00100000B ;将a1中的ASCII码的第5位置为1，变为小写字母
		mov [bx], al 
		inc bx
		loop s0
		
		mov ax, 4c00h 
		int 21h 
codesg ends

4. [bx+idata]

除了前面使用 [bx] 来指明一个内存单元外，还可以使用一种更灵活的方式来指明内存单元： [bx+idata] 表示一个内存单元，它的偏移地址为 (bx)+idata（bx中的数值加idata）的内存单元。

数字化的描述为：(ax)=((ds)*16+(bx)+idata)

也可写为[idata+bx]，还可写为：idata[bx]，[bx].idata

5. SI和DI寄存器

si 和 di 功能和BX相似，但si 和 di 不可以分为两个8位寄存器。

[bx+si]和[bx+di]的含义相似：

[bx+si]表示一个内存单元，它的偏移地址为（bx）+（si）

指令mov ax, [bx + si]的含义：将一个内存单元的内容(长度为2字节)送入ax，存放一个字，偏移地址为 bx 中的数值加上 si 中的数值，段地址在 ds 中。

该指令也可以写成如下格式：mov ax, [bx][si]

[bx+si+idata]和[bx+di+idata]的含义相似：

[bx+si+idata]表示一个内存单元，它的偏移地址为（bx）+（si）+idata

··· ···

6. 不同的寻址方式的灵活应用

总结一下上面几种定位内存地址的方法：

[idata]用一个常量表示偏移地址，可用于直接定位一个内存单元
[bx]用一个变量表示偏移地址，可用于间接定位一个内存单元
[bx+idata]用一个常量和一个变量表示偏移地址，可在一个起始地址的基础上用变量间接定位一个内存单元
[bx+si]用两个变量表示偏移地址
[bx+si+idata]用两个变量和一个常量表示偏移地址

程序示例：将 datasg 段中每个单词的头一个字母改为大写字母

assume cs:codesg,ds:datasg,ss:stacksg 

datasg segment
	db 'ibm            ' ;16个字节
	db 'dec            ' 
	db 'dos            '
	db 'vax            ' 
datasg ends 

stacksg segment 		;定义一个段，用来做栈段，容量为16个字节
	dw 0, 0, 0, 0, 0, 0, 0, 0
stacksg ends 

codesg segment 
start:	mov ax, stacksg 
		mov ss, ax
		mov sp, 16 
		mov ax, datasg 
		mov ds, ax 
		mov bx, 0 
			
		;cx为默认循环计数器，二重循环只有一个计数器，所以外层循环先保存cx值，再恢复，采用栈保存
		mov cx, 4
	s0:	push cx		;将外层循环的cx值入栈
		mov si, 0
		mov cx, 3	;cx设置为内层循环的次数
		
	s:	mov al, [bx+si]
		and al, 11011111b ;每个字符转为大写字母
		mov [bx+si], al 
		inc si
		loop s 
			
		add bx, 16 
		pop cx		;从栈顶弹出原cx的值，恢复cx
		loop s0 	;外层循环的loop指令将cx中的计数值减1
			
		mov ax，4c00H 
		int 21H 
codesg ends
end start

一般来说，在需要暂存数据的时候，我们都应该使用栈。

七、数据处理的两个基本问题

1. bx、si、di和bp

在8086CPU中，只有这4个寄存器可以用在“[…]”中来进行内存单元的寻址。

在[ ]中，这4个寄存器可以单个出现，或只能以4种组合出现：bx和si、bx和di、bp和si、bp和di。(看清楚关系)

只要在[…]中使用寄存器bp，而指令中没有显性地给出段地址, 段地址就默认在ss中。

2. 机器指令处理的数据在什么地方

绝大多数机器指令都是进行数据处理的指令，处理大致可分为3类：读取、写入、运算。

在机器指令这一层来讲，并不关心数据的值是多少，而关心指令执行前一刻，它将要处理的数据所在的位置。指令在执行前，所要处理的数据可以在3个地方：CPU内部、内存、端口。

示例：指令举例

3. 汇编语言中数据位置的表达

汇编语言中用3个概念来表达数据的位置

(1) 立即数（idata）

mov ax, 1     
add bx, 2000h          
or bx, 00010000b
mov al, 'a'

(2) 寄存器

mov ax, bx     
mov ds, ax 
push bx 
mov ds:[0], bx 
push ds 
mov ss, ax
mov sp, ax

(3) 段地址(SA)和偏移地址(EA)

mov ax, [0]
mov ax, [di]
mov ax, [bx+8]
mov ax, [bx+si]
mov ax, [bx+si+8]   

mov ax, [bp]
mov ax, [bp+8]
mov ax, [bp+si]
mov ax, [bp+si+8]   

mov ax, ds:[bp]
mov ax, es:[bx]
mov ax, ss:[bx+si]
mov ax, cs:[bx+si+8]

4. 寻址方式

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TzHjb1Bj-1637678343673)(H:\typora_Note\picture\image-20210625122127619.png)]

5. 指令要处理的数据有多长

8086CPU的指令，可以处理两种尺寸的数据，byte 和 word。所以在机器指令中要指明指令进行的是字操作还是字节操作。

通过寄存器名指明要处理的数据的尺寸。
例： mov ax, ds:[0] ; 寄存器al指明了数据为1字长
在没有寄存器名存在的情况下，用操作符X ptr指明内存单元的长度，X在汇编指令中可以为word或byte。
例：mov byte ptr ds:[0], 1 ; byte ptr 指明了指令访问的内存单元是一字节
有些指令默认了访问的是字单元还是字节单元
例：push [1000H] ; push 指令只进行字操作。

6. div指令(除法指令)

使用div做除法的时候应注意以下问题：

除数：有8位和16位两种，在一个reg或内存单元中。
被除数：默认放在 AX 或 DX 和 AX 中：
如果除数为8位，被除数则为16位，默认在AX中存放；
如果除数为16位，被除数则为32位，DX存放高16位，AX存放低16位。
结果：
如果除数为8位，则AL存储除法操作的商，AH存储除法操作的余数；
如果除数为16位，则AX存储除法操作的商，DX存储除法操作的余数。

格式：

div reg
div 内存单元

7. 伪指令dd，dup

db 和 dw 定义字节型数据和字型数据。

dd 是用来定义 dword(double word，双字) 型数据的伪指令。

dup 是一个操作符，在汇编语言中同 db、dw、dd 等一样，也是由编译器识别处理的符号。

dup 和 db、dw、dd 等数据定义伪指令配合使用，用来进行数据的重复。

示例：

db 3 dup (0)       ;定义了3个字节，它们的值都是0，相当于db 0，0，0
db 3 dup (0, 1, 2) ;定义了9个字节，它们是0、1、2、0、1、2、0、1、2，相当于db 0，1，2，0，1，2，0，1，2
db 3 dup ('abc', 'ABC') ;定义了18个字节，它们是'abcABCabcABCabcABCC'，相当于db'abcABCabcABCabcABC'

八、转移指令的原理

可以修改IP，或同时修改CS和IP的指令统称为转移指令。概括地讲，转移指令就是可以控制CPU执行内存中某处代码的指令。

8086CPU的转移行为有以下几类。

只修改IP时，称为段内转移，比如：jmp ax。
同时修改CS和IP时，称为段间转移，比如：jmp 1000:0。

由于转移指令对IP的修改范围不同，段内转移又分为：短转移和近转移。

短转移IP的修改范围为-128 ~ 127。
近转移IP的修改范围为-32768 ~ 32767。

8086CPU的转移指令分为以下几类。

无条件转移指令（如：jmp）
条件转移指令
循环指令（如：loop）
过程
中断

1. 操作符offset

操作符offset 在汇编语言中是由编译器处理的符号，它的功能是取得标号的偏移地址。

示例：

assume cs:codesg
codesg segment
	start:mov ax,offset start	;相当于 mov ax,0
	    s:mov ax,offset s		;相当于 mov ax,3
codesg ends
ends

2. jmp指令

jmp为无条件转移，可以只修改IP，也可以同时修改CS和IP；

jmp指令要给出两种信息：

转移的目的地址
转移的距离（段间转移、段内短转移，段内近转移）

2.1 依据位移进行转移的jmp指令

jmp short 标号(转到标号处执行指令)(段内短转移)

示例：

assume cs:codesg
codesg segment
  start:mov ax,0
        jmp short s 
        add ax, 1	;被越过
      s:inc ax 		;程序执行后， ax中的值为 1 
codesg ends
end start

jmp short s指令的读取和执行过程：

(CS)=0BBDH，(IP)=0006，CS:IP指向EB 03（jmp short s的机器码）；
读取指令码EB 03进入指令缓冲器；
(IP) = (IP) + 所读取指令的长度 = (IP) + 2 = 0008，CS:IP指向add ax,1；
CPU指行指令缓冲器中的指令EB 03；
指令EB 03执行后，(IP)=000BH，CS:IP指向inc ax

在“jmp short 标号” 指令所对应的机器码中，并不包含转移的目的地址，而包含的是转移的位移。这个位移，是编译器根据汇编指令中的 “标号” 计算出来的。

“jmp short 标号”的功能为 (IP)=(IP)+8 位位移：

8位位移 = 标号处的地址 - jmp指令后的第一个字节的地址；
short指明此处的位移为8位位移；
8位位移的范围为-128~127，用补码表示
8位位移由编译程序在编译时算出。

还有一种和 “jmp short 标号” 功能相近的指令格式，jmp near ptr 标号，它实现的是段内近转移。

指令“jmp near ptr 标号”的功能为：(IP) = (IP) + 16位位移。

16位位移 = 标号处的地址 - jmp指令后的第一个字节的地址；
near ptr 指明此处的位移为16位位移，进行的是段内近转移；
16位位移的范围为-32768~32767，用补码表示；
16位位移由编译程序在编译时算出。

2.2 转移的目的地址在指令中的jmp指令

jmp far ptr 标号（段间转移，又称远转移）

指令 “jmp far ptr 标号” 功能如下：

(CS) = 标号所在段的段地址；
(IP) = 标号所在段中的偏移地址。
far ptr 指明了指令用标号的段地址和偏移地址修改CS和IP。

assume cs:codesg
codesg segment
   start: mov ax, 0
		 mov bx, 0
          jmp far ptr  s
          db 256 dup (0) 
        s:add ax,1
          inc ax
codesg ends
end start

2.3 转移地址在寄存器中的jmp指令

格式：jmp 16位 reg

功能：IP =（16位 reg）

2.4 转移地址在内存中的jmp指令

转移地址在内存中的jmp指令有两种格式：

（1）jmp word ptr 内存单元地址（段内转移）

功能：从内存单元地址处开始存放着一个字，是转移的目的偏移地址。

示例：

mov ax, 0123H
mov ds:[0], ax
jmp word ptr ds:[0]
;执行后，(IP)=0123H

mov ax,0123H
mov [bx],ax
jmp word ptr [bx]
;执行后，(IP)=0123H

（2）jmp dword ptr 内存单元地址（段间转移）

功能：从内存单元地址处开始存放着两个字，高地址处的字是转移的目的段地址，低地址处是转移的目的偏移地址。

(CS)=(内存单元地址+2)
(IP)=(内存单元地址)

示例：

mov ax, 0123H
mov ds:[0], ax
mov word ptr ds:[2], 0
jmp dword ptr ds:[0]
;执行后，(CS)=0，(IP)=0123H，CS:IP 指向 0000:0123

3. jcxz指令

jcxz指令为有条件转移指令，所有的有条件转移指令都是短转移。

在对应的机器码中包含转移的位移，而不是目的地址。

对IP的修改范围都为-128~127。

指令格式：jcxz 标号（如果(cx)=0，转移到标号处执行。）

操作：

当(cx) = 0时，(IP) = (IP) + 8位位移；

8位位移 = “标号”处的地址 - jcxz指令后的第一个字节的地址；
8位位移的范围为-128~127，用补码表示；
8位位移由编译程序在编译时算出。

当(cx) ≠ 0时，什么也不做（程序向下执行）

从jcxz的功能中可以看出，“jcxz 标号” 的功能相当于：if((cx)==0) jmp short 标号

4. loop指令

loop指令为循环指令，所有的循环指令都是短转移。

在对应的机器码中包含转移的位移，而不是目的地址。

对IP的修改范围都为：-128~127。

指令格式：loop 标号((cx) = (cx) - 1，如果(cx) ≠ 0，转移到标号处执行)。

操作：

(cx) = (cx) - 1；
如果 (cx) ≠ 0，(IP) = (IP) + 8位位移。

8位位移 = 标号处的地址 - loop指令后的第一个字节的地址；
8位位移的范围为-128~127，用补码表示；
8位位移由编译程序在编译时算出。

如果（cx）= 0，什么也不做（程序向下执行）。

从loop 的功能中可以看出，“loop 标号” 的功能相当于：(cx)--; if((cx) != 0) jmp short 标号。

5. 编译器对转移位移超界的检测

根据位移进行转移的指令，它们的转移范围受到转移位移的限制，如果在源程序中出现了转移范围超界的问题，在编译的时候，编译器将会报错。

九、CALL 和 RET 指令

call 和 ret 指令都是转移指令，它们都修改IP，或同时修改CS和IP。（经常被共同用来实现子程序的设计）

1. ret 和 retf

ret指令用栈中的数据，修改IP的内容，从而实现近转移；
retf指令用栈中的数据，修改CS和IP的内容，从而实现远转移。

CPU执行ret指令时，相当于进行：pop IP，具体进行下面两步操作：

(IP) = ( (ss) * 16 + (sp) )
(sp) = (sp) + 2

CPU执行retf指令时，相当于进行：pop IP, pop CS：具体进行下面四步操作：

(IP) = ( (ss) * 16 + (sp) )
(sp) = (sp) + 2
(CS) = ( (ss) * 16 + (sp) )
(sp) = (sp) + 2

示例：

assume cs:code 
stack seqment
	db 16 dup (0)
stack ends 

code segment
		mov ax, 4c00h
		int 21h 
 start:	mov ax, stack 
 		mov ss, ax
 		mov sp, 16
		mov ax, 0
		push ax 
		mov bx, 0
		ret 
code ends
end start
;ret指令执行后，(IP)=0，CS:IP指向代码段的第一条指令。

2. call 指令

CPU执行call指令时，进行两步操作：

将当前的 IP 或 CS和IP 压入栈中；
转移。

call指令不能实现短转移，除此之外，call指令实现转移的方法和 jmp 指令的原理相同。

2.1 依据位移进行转移的call指令

call 标号（将当前的IP压栈后，转到标号处执行指令）

操作：

(SP)=(SP)-2
((SS) * 16 + (SP)) = (IP)
(IP)=(IP)+16 位位移

CPU执行此种格式的call指令时，相当于进行 push IP jmp near ptr 标号

2.2 转移的目的地址在指令中的call指令

call far ptr 标号（段间转移）

操作：

(SP)=(SP)-2
((SS) * 16+(SP))=(CS)
(SP)=(SP)-2
((SS) * 16+(SP))=(IP)
(CS)=标号所在的段的段地址
(IP)=标号的偏移地址

CPU执行此种格式的call指令时，相当于进行：push CS push IP jmp far ptr 标号

2.3 转移地址在寄存器中的call指令

call 16位reg

功能：

(SP)=(SP)-2
((SS) * 16+(SP))=(IP)
(IP)=(16为reg)

CPU执行此种格式的call指令时，相当于进行： push IP jmp 16位reg

2.4 转移地址在内存中的call指令

有两种格式：

（1）call word ptr 内存单元地址

CPU执行此种格式的call指令时，相当于进行：push IP jmp word ptr 内存单元地址

（2）call dword ptr 内存单元地址

CPU执行此种格式的call指令时，相当于进行：push CS push IP jmp dword ptr 内存单元地址

3. call 和 ret 的配合使用

配合使用call 和 ret 实现子程序的框架：

assume cs:code
code segment
main: :
      :
	  call sub1			;调用子程序sub1
      :
	  mov ax,4c00h
      int 21h

sub1: :					;子程序sub1开始
	  :
	  call sub2			;调用子程序sub2
	  :
	  ret				;子程序返回

sub2: :					;子程序sub2开始
	  :
	  ret				;子程序返回
code ends
end main

4. mul 指令(乘法指令)

mul是乘法指令，使用 mul 做乘法时，应注意：

（1）相乘的两个数，要么都是8位，要么都是16位。

8 位：一个默认放在 AL 中，另一个放在 8位寄存器或内存字节单元中；
16 位：一个默认放在 AX中，另一个放在 16 位寄存器或内存字单元中。

（2）结果：

8位：结果默认放在 AX 中；
16位：高位默认在DX中，低位在 AX 中。

格式：mul reg ， mul 内存单元

示例：

1.计算100*10
;100和10小于255，可以做8位乘法
mov al,100
mov bl,10
mul bl
;结果： (ax)=1000（03E8H） 

2.计算100*10000
;100小于255，可10000大于255，所以必须做16位乘法
mov ax,100
mov bx,10000
mul bx
;结果： (ax)=4240H，(dx)=000FH   （F4240H=1000000）

十、标志寄存器

CPU内部的寄存器中，有一种特殊的寄存器（对于不同的处理机，个数和结构都可能不同）具有以下3种作用。

（1）用来存储相关指令的某些执行结果；

（2）用来为CPU执行相关指令提供行为依据；

（3）用来控制CPU的相关工作方式。

这种特殊的寄存器在8086CPU中，被称为标志寄存器（flag），其中存储的信息通常被称为程序状态字（PSW）。

flag寄存器不同于其他寄存器，它是按位起作用的（其余的寄存器是用来存放数据的），每一位都有专门的含义，记录特定的信息。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Y1PkENcc-1637678343682)(H:\typora_Note\picture\image-20210629145021777.png)]

注意：

在8086CPU的指令集中，有的指令的执行是影响标志寄存器的，比如，add、sub、mul、div、inc、or、and等，它们大都是运算指令（进行逻辑或算术运算）；有的指令的执行对标志寄存器没有影响，比如，mov、push、pop等，它们大都是传送指令。

在使用一条指令的时候，要注意这条指令的全部功能，其中包括，执行结果对标志寄存器的哪些标志位造成影响。

1. ZF标志（零标志位）

flag 的第6位，它记录相关指令执行后，其结果是否为0。

如果结果为0，那么 zf = 1(表示结果是0)；
如果结果不为0，那么 zf = 0。

mov ax, 2
sub ax, 1 
;执行后，结果不为0，则zf = 0

2. PF标志（奇偶标志位）

flag 的第2位，它记录相关指令执行后，其结果的所有 bit 位中1的个数是否为偶数。

如果1的个数为偶数，pf = 1；
如果为奇数，那么pf = 0。

mov al, 1
or al, 2  
;执行后，结果为00000011B，其中有2（偶数）个1，则pf = 1；

3. SF标志（符号标志位）

flag 的第7位，它记录相关指令执行后，其结果是否为负。

如果结果为负，sf = 1；
如果非负，sf = 0。

计算机中通常用补码表示数据，一个数可以看成有符号数或无符号数。

如：

00000001B，可以看成无符号1，或有符号+1
10000001B，可以看成无符号129，或有符号-127

CPU在执行add等指令的时候，就包含了两种含义：

可以将add指令进行的运算当作无符号数的运算；
也可以将add指令进行的运算当作有符号数的运算。

关键在于我们的程序需要用到哪一种结果。

总结：SF标志，就是CPU对有符号数运算结果的一种记录，它记录数据的正负。在我们将数据当作有符号数来运算的时候，可以通过它来得知结果的正负。如果我们将数据当作无符号数来运算，SF的值则没有意义，虽然相关的指令影响了它的值。

4. CF标志（进位标志位）和 OF寄存器（溢出标志位）

CF标志（进位标志位）

flag 的第0位，一般情况下，在进行无符号数运算的时候，它记录了运算结果的最高有效位向更高位的进位值，或从更高位的借位值。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D0efwO2R-1637678343684)(H:\typora_Note\picture\image-20210629152454655.png)]

例如：

两个8位数据：98H + 98H，将产生进位。

两个8位数据：97H - 98H，将产生借位。

8086CPU中flag的CF位就是用来记录这个进位/借位值的。

OF寄存器（溢出标志位）

什么是溢出呢？

指令运算的结果用8位寄存器或一个内存单元存放，那么对于8位的有符号数据，机器能表示的范围就是-128~127,16位同理。在进行有符号运算的时候，如果结果超过了机器能表示的范围称为“溢出”。

flag 的第11位，一般情况下，OF记录了有符号数运算的结果是否发生了溢出。

如果发生溢出，OF = 1；
如果没有，OF = 0。

注意！！

CF是对无符号数运算有意义的标志位，而OF是对有符号数运算有意义的标志位。

CPU在执行add等指令的时候，就包含了两种含义：无符号数运算和有符号数运算。

对于无符号数运算，CPU用CF位来记录是否产生了进位；
对于有符号数运算，CPU用OF位来记录是否产生了溢出，当然，还要用SF位来记录结果的符号。

示例：

mov al, 98
add al, 99  
;add执行后：CF=0，OF=1。
    
mov al，0F0H  
add al，88H  
;add执行后：CF=1，OF=1。

mov al，0F0H
add al，088H
;add执行后：CF=1，OF=0。

可以看出，CF和OF所表示的进位和溢出，是分别对无符号数和有符号数运算而言的，他们之间没有任何关系。

5. adc指令和 sbb指令

adc指令

adc是带进位加法指令，它利用了CF位上记录的进位值。

指令格式：adc 操作对象1, 操作对象2

功能：操作对象1 = 操作对象1 + 操作对象2 + CF

例如：

mov ax, 2
mov bx, 1
sub bx, ax  ;无符号运算借位CF=1，有符号运算OF = 0
adc ax, 1   
;执行后，（ax）= 4。adc执行时，相当于计算：(ax)+1+CF = 2+1+1 = 4。

加法可以分为两步来进行：（1）低位相加；（2）高位相加再加上低位相加产生的进位值。

注：inc和loop指令不影响CF位。

sbb指令

sbb是带借位减法指令，它利用了CF位上记录的借位值。

指令格式：sbb 操作对象1, 操作对象2

功能：操作对象1 = 操作对象1 - 操作对象2 - CF

例如：计算 003E1000H - 00202000H，结果放在ax，bx中

mov bx, 1000H
mov ax, 003EH
sub bx, 2000H
sbb ax, 0020H

6. cmp指令

cmp是比较指令，cmp的功能相当于减法指令，只是不保存结果。

cmp指令执行后，将对标志寄存器产生影响。其他相关指令通过识别这些被影响的标志寄存器位来得知比较结果。

cmp指令格式：cmp 操作对象1，操作对象2
功能：计算对操作对象1 - 操作对象2但不保存结果，仅仅根据结果对标志位进行设置。

例如：
指令cmp ax, ax，做（ax）-（ax）的运算，结果为0，但并不在ax中保存，仅影响flag的相关各位。
指令执行后：zf=1，pf=1，sf=0，cf=0，of=0。

其实，可以通过执行cmp ax,bx ，相关标志位的值就可以判断结果：

若(ax)=(bx) 则(ax)-(bx)=0，所以：zf=1
若(ax)!=(bx) 则(ax)-(bx)!=0，所以：zf=0
若(ax)<(bx) 则(ax)-(bx)产生借位，所以：cf=1
若(ax)>=(bx) 则(ax)-(bx)不产生借位，所以：cf=0
若(ax)>(bx) 则(ax)-(bx)既不产生借位，结果又不为0，所以：cf=0且zf=0
若(ax)<=(bx) 则(ax)-(bx)既可能借位，结果可能为0，所以：cf=1或zf=1

实际上往往会出现溢出，所以，我们应该在考察sf(得知实际结果的正负)的同时考查of(得知有没有溢出)，就可以得知逻辑上真正结果的正负，同时就可以知道比较的结果。

下面，以cmp ah,bh为例，总结一下CPU执行cmp指令后，sf 和 of 的值是如何来说明比较的结果的。

若sf=1，而of=0；说明没有溢出，那么sf的计算结果正确；所以，(ah)<(bh)
若sf=1，而of=1；说明出现了溢出，那么sf的结果相反；所以，(ah)>(bh)
若sf=0，而of=1；说明有溢出，那么sf的结果相反；所以，(ah)<(bh)
若sf=0，而of=0；说明没有溢出，那么sf的结果正确；所以，(ah)>=(bh)

7. 检测比较结果的条件转移指令

“转移” 指的是它能够修改IP，而 “条件” 指的是它可以根据某种条件，决定是否修改IP。

如：jcxz 就是一个条件转移指令，它可以检测cx中的数值，如果（cx）=0，就修改IP，否则什么也不做。

所有条件转移指令的转移位移都是[-128，127]。

大多数条件转移指令都检测标志寄存器的相关标志位，根据检测的结果来决定是否修改IP。

这些条件转移指令通常都和cmp相配合使用，检测不同的标志位来达到不同的条件跳转效果：

下面是常用的根据无符号数的比较结果进行转移的条件转移指令。

指令	含义	检测的相关标志位
je	等于则转移	zf = 1
jne	不等于则转移	zf = 0
jb	低于则转移	cf = 1
jnb	不低于则转移	cf = 0
ja	高于则转移	cf = 0 且 zf = 0
jna	不高于则转移	cf = 1 且 zf = 1

j：jump，e：equal，ne：not equal，b：below，nb：not below，a：above，na：not above。

例：统计data中数值小于8的字节个数，用ax保存

···
data segment
	db 8,11,8,1,8,5,63,38
data ends
···
	mov ax,data
	mov ds,ax			
	mov ax,0			;初始化累加器
	mov bx,0			;ds:bx指向第一个字节
	mov cx,8
s:  cmp byte ptr [bx],8	 ;和8进行比较
	jne next			;如果不小于8 转到next，继续循环
	inc ax				;如果小于8 就将计数值加1
next:inc bx
	loop s
···
; 程序执行后：（ax）=2

8. DF标志(方向标志位)和串传送指令

flag 的第10位是DF。在串处理指令中，控制每次操作后si、di的增减。

df = 0 每次操作后si、di递增；
df = 1 每次操作后si、di递减。

格式：movsb
功能：将ds:si指向的内存单元中的字节送入es:di中，然后根据标志寄存器df位的值，将si和di递增或递减。

格式：movsw
功能：将ds:si指向的内存字单元中的字送入es:di中，然后根据标志寄存器df位的值，将si和di递增2或递减2。

movsb和movsw进行的是串传送操作中的一个步骤，一般来说，movsb和movsw都和rep配合使用：
格式：rep movsb
功能：rep的作用是根据cx的值，重复执行后面的串传送指令。

8086CPU提供下面两条指令对df位进行设置。

cld指令：将标志寄存器的df位置0
std指令：将标志寄存器的df位置1

示例：用串传送指令，将data段中第一个字符串复制到他后面的空间中

data segment
	db 'Welcome to masm!'
	db 16 dup (0)
data ends

	mov ax,data
	mov ds,ax
	mov si,0	;ds:si 指向 data:0
	mov es,ax
	mov di,16	;es:di 指向 data:0010
	mov cx,16	;(cx)=16,rep循环16次
	cld			;设置df=0，正向传送
	rep movsb
···

9. pushf 和 popf

pushf的功能是将标志寄存器的值压栈，而popf是从栈中弹出数据，送入标志寄存器中

pushf和popf，为直接访问标志寄存器提供了一种方法。

十一、内中断

任何一个通用的CPU，比如8086，都具备一种能力，可以在执行完当前正在执行的指令之后，检测到从CPU外部发送过来的或内部产生的一种特殊信息，并且可以立即对所接收到的信息进行处理。这种特殊的信息，我们可以称其为：中断信息。中断的意思是指，CPU不再接着（刚执行完的指令）向下执行，而是转去处理这个特殊信息。

中断信息可以来自CPU的内部和外部（内中断，外中断）

1. 内中断的产生

内中断：当CPU的内部有以下需要处理的事情发生时，将产生中断信息，引发中断过程。

（1）除法错误，比如，执行div指令产生的除法溢出；
（2）单步执行；
（3）执行 into指令；
（4）执行 int指令。

CPU首先要知道，所接收到的中断信息的来源。8086CPU用称为中断类型码 的数据来标识中断信息的来源。

中断类型码为一个字节型数据，可以表示256种中断信息的来源(中断源)。

上述的4种中断源，在8086CPU中的中断类型码如下：

（1）除法错误：0
（2）单步执行：1
（3）执行into指令：4
（4）执行int指令，该指令的格式为int n，指令中的n为字节型立即数，是提供给CPU的中断类型码。

2. 中断处理程序和中断向量表

中断处理程序

我们编写的，用来处理中断信息的程序被称为中断处理程序。

根据CPU的设计，中断类型码的作用就是用来定位中断处理程序的。那如何根据8位的中断类型码得到中断处理程序的段地址和偏移地址呢？

中断向量表

CPU用8位的中断类型码通过 中断向量表找到相应的中断处理程序入口地址。（中断向量表就是中断向量的列表，中断向量就是中断处理程序的入口地址）

中断向量表在内存中保存，其中存放着256个中断源所对应的中断处理程序的入口。
CPU只要知道了中断类型码，就可以将中断类型码作为中断向量表的表项号，定位相应的表项，从而得到中断处理程序的入口地址。
对于8086PC机，中断向量表指定放在内存地址0处。从0000:0000到0000:03FF的1024个单元存放中断向量表。(不能放在别处)
在中断向量表中，一个表项存放一个中断向量，也就是一个中断处理程序的入口地址，对于8086CPU，这个入口地址包括段地址和偏移地址，所以一个表项占两个字（高地址字存放段地址，低地址字存放偏移地址）

3. 中断过程

CPU会自动根据中断类型找到对应的中断向量并设置CS和IP的值，CPU硬件完成这个工作的过程称为中断过程。

具体步骤：

取得中断类型码N；
pushf
TF=0，IF=0
push CS
push IP
（IP）=（N * 4），（CS）=（N * 4 + 2）

4. iret指令

CPU随时都可能执行中断处理程序，所以中断处理程序必须一直存储在内存某段空间之中。而中断处理程序的入口地址，即中断向量，必须存储在对应的中断向量表表项中。

中断处理程序常规的步骤：

（1）保存用到的寄存器；
（2）处理中断；
（3）恢复用到的寄存器；
（4）用iret指令返回。

iret通常和硬件自动完成的中断过程配合使用。

iret指令执行后，CPU回到执行中断处理程序前的执行点继续执行程序。

5. 除法错误中断的处理

当CPU执行div 等除法指令的时候，如果发生了除法溢出错误，将产生中断类型码为0的中断信息，CPU将检测到这个信息，然后引发中断过程，转去执行0号中断对应的中断处理程序。

mov ax, 1000h 
mov bh, 1
div bh 
;发生除法溢出错误

实例：编程，当发生除法溢出时，在屏幕中间显示“overflow！”，返回DOS。

分析：

编写可以显示 “overflow!” 的中断处理程序：do0
将do0送入内存 0000:0200 处
将do0的入口地址0000:0200存储在中断向量表0号表项中

程序框架：

assume cs:code
code segment
start:	do0安装程序
		设置中断向量表
		mov ax,4c00h
      	int 21h

do0:	显示字符串"overflow!"
		mov ax,4c00h
		int 21th
		
code ends
end start

完整程序：

assume cs:code

code segment
start:	
		mov ax, cs
		mov ds, ax
		mov si, offset do0		;设置ds:si指向源地址
		mov ax, 0
		mov es, ax
		mov di, 200h			;设置es:di指向目的地址0000:0200
		mov cx, offset do0end - offset do0		;设置cx为传输长度
		cld				        ;设置传输方向为正
		rep movsb 
		
		;设置中断向量表
		mov ax, 0               
		mov es, ax
		mov word ptr es:[0*4], 200h
		mov word ptr es:[0*4+2], 0

      	mov ax,4c00h
      	int 21h

		;do0程序的主要任务是显示字符串
do0:	jmp short do0 start 
      	db "overflow!"

do0start:
      	 mov ax, cs
      	 mov ds, ax
      	 mov si, 202h			;设置ds:si指向字符串

      	 mov ax, 0b800h
      	 mov es, ax
		 mov di, 12*160+36*2		;设置es:di指向显存空间的中间位置

         mov cx, 9				;设置cx为字符串长度
	s:	mov al, [si]
      	 mov es:[di], al
      	 inc si
      	 add di, 2
      	 loop s

      	 mov ax, 4c00h
      	 int 21h
      	
do0end:	nop
code ends
end start

6. 单步中断

CPU在执行完一条指令之后，如果检测到标志寄存器的TF位为1，则产生单步中断，引发中断过程。单步中断的中断类型码为1。

关于Debug的内容，见王爽《汇编语言》P249-P250.

7. int指令

int指令的格式为：int n ，n为中断类型码，它的功能是引发中断过程。

CPU执行int n指令，相当于引发一个n号中断的中断过程。执行过程：

取中断类型码n
标志寄存器入栈，IF=0，TF=0
CS，IP入栈
(ip)=(n*4),(cs)=(n*4+2)
转去执行n号中断的中断处理程序

可以在程序中使用int指令调用任何一个中断的中断处理程序。

8. 编写中断例程

示例1：求2 * 3456²

assume cs:code
code segment
start: 
     mov ax, 3456 	;(ax)=3456
     int 7ch  		; 调用中断7ch的中断例程，计算ax中的数据的平方
     add ax, ax  
     adc dx, dx  	;存放结果，将结果乘以2
     mov ax,4c00h
     int 21h
code ends
end start

示例2：
功能：将一个全是字母，以0结尾的字符串，转化为大写。
参数：ds:si指向字符串的首地址。
应用举例：将data段中的字符串转化为大写。

assume cs:code

data segment
	db 'conversation',0
data ends

code segment
start:   mov ax, data
		mov ds, ax
		mov si, 0
		int 7ch
		
		mov ax,4c00h
		int 21h
code ends
end start

安装程序如下：

assume cs:code
code segment

start:  mov ax,cs
		mov ds,ax
		mov si,offset capital
		mov ax,0
		mov es,ax
		mov di,200h
		mov cx,offset capitalend - offset capital
		cld
		rep movsb

		mov ax,0
		mov es,ax
		mov word ptr es:[7ch*4],200h
		mov word ptr es:[7ch*4+2],0
		mov ax,4c00h
		int 21h

capital: push cx
		push si
change:  mov cl,[si]
		mov ch,0
		jcxz ok
		and byte ptr [si],11011111b
		inc si
		jmp short change
ok:	     pop si
		pop cx
		iret
capitalend:nop

code ends
end start

9. BIOS和DOS所提供的中断例程

在系统板的ROM中存放着一套程序，称为BIOS(基本输入输出系统)，BIOS中主要包含以下几部分内容。

（1）硬件系统的检测和初始化程序；
（2）外部中断和内部中断的中断例程；
（3）用于对硬件设备进行I/O操作的中断例程；
（4）其他和硬件系统相关的中断例程。

BIOS 和 DOS 在所提供的中断例程中包含了许多程序员在编程的时候需要用到的小程序。程序员在编程的时候，可以用 int 指令直接调用 BIOS 和 DOS 提供的中断例程，来完成某些工作。

和硬件设备相关的DOS中断例程中，一般都调用了BIOS的中断例程。

BIOS和DOS中断例程的安装过程

BIOS和DOS提供的中断例程是如何安装到内存中的呢？

开机后，CPU一加电，初始化(CS)= 0FFFFH，(IP)= 0，自动从FFFF:0单元开始执行程序。FFFF:0处有一条转跳指令，CPU执行该指令后，转去执行BIOS中的硬件系统检测和初始化程序。
初始化程序将建立 BIOS 所支持的中断向量，即将 BIOS 提供的中断例程的入口地址登记在中断向量表中。注意，对于BIOS所提供的中断例程，只需将入口地址登记在中断向量表中即可，因为它们是固化到ROM中的程序，一直在内存中存在。
硬件系统检测和初始化完成后，调用 int 19h 进行操作系统的引导。从此将计算机交由操作系统控制。
DOS启动后，除完成其他工作外，还将它所提供的中断例程装入内存，并建立相应的中断向量。

DOS中断例程应用

示例：在屏幕的5行12列显示字符串“Welcome to masm！”

assume cs:code 
 
data segment 
	db	'Welcome to masm',  '$' ;“$”本身不显示，只起到边界的作用
data ends 

code segment
start:	 mov ah, 2  ;置光标
		mov bh, 0  ;第0页
		mov dh, 5  ;dh中放行号
		mov dl, 12 ;dl中放列号
		int 10h 
		
		mov ax, data 
		mov ds, ax 
		mov dx, 0  ;ds:dx指向字符串的首地址data:0 
		mov ah, 9  
		int 21h 
		
		mov ax, 4c00h 
		int 21h 
code ends
end start

十二、端口

1. 端口基本概念

前面讲过，各种存储器都和CPU的地址线，数据线，控制线相连，CPU操控它们的时候，把它们都当作内存来对待，把它们总地看做一个由若干个存储单元构成的逻辑存储器，我们称这个逻辑存储器为内存地址空间。

在PC机系统中，和CPU通过总线相连的芯片除各种存储器外，还有以下3种芯片。

各种接口卡（如网卡、显卡）上的接口芯片，它们控制接口卡进行工作；
主板上的接口芯片，CPU通过它们对部分外设进行访问；
其他芯片，用来存储相关系统信息，或进行相应的输入输出处理。

在这些芯片中，都有一种由CPU读写的寄存器。这些寄存器，它们在物理上可能处于不同的芯片中，但是在以下两点上相同。

都和CPU的总线相连（通过它们所在的芯片进行）；
CPU对他们进行读、写的时候都通过控制线向他们所在的芯片发出端口读写指令。

可见，从CPU的角度，将这些寄存器都当做端口，对他们进行统一编址，从而建立了一个统一的端口地址空间。每一个端口在地址空间中都有一个地址。

CPU可以直接读取下面三个地方的数据：

CPU内部的寄存器
内存单元
端口

2. 端口的读写

因为端口所在的芯片和CPU通过总线相连，所以端口地址和内存地址一样，通过地址总线传送。在PC系统中，CPU最多可以定位64KB个不同的端口。则端口地址的范围为0-65535。

端口的读写指令只有两条：in和out，分别用于从端口读取数据和往端口写入数据。

示例：

;对0~255以内的端口进行读写时
in al, 20h  	;从20h端口读入一个字节
out 20h, al  	;往20h端口写入一个字节

;对256~65535的端口进行读写时，端口号放在dx中
mov dx, 3f8h  	;将端口号3f8h送入dx
in al, dx  		;从3f8h端口读入一个字节
out dx, al 		;向3f8h端口写入一个字节

注意：在 in 和 out 指令中，只能使用ax或al来存放从端口中读入的数据或要发送到端口中的数据。

３. CMOS RAM芯片

PC机中，有一个CMOS RAM芯片，一般简称为CMOS。此芯片的特征如下.

包含一个实时钟和一个有128个存储单元的RAM存储器
该芯片靠电池供电。关机后内部的实时钟正常工作，RAM中的信息不丢失
128个字节的RAM中，内部实时钟占用 0~0dh 单元来保存时间信息，其余大部分单元用于保存系统配置信息，供系统启动时BIOS程序读取。BIOS也提供了相关的程序，使我们可以在开机的时候配置CMOS RAM中的系统信息。
该芯片内部有两个端口，端口地址为 70h 和 71h 。CPU通过这两个端口来读写CMOS RAM
70h为地址端口，存放要访问的 CMOS RAM 单元的地址；71h为数据端口，存放从选定的 CMOS RAM 单元中读取的数据，或要写入到其中的数据。

可见，CPU对CMOS RAM的读写分两步进行，比如，读 CMOS RAM 的2号单元：
① 将2送入端口 70h；
② 从端口 71h 读出2号单元的内容。

CMOS RAM中存储的时间信息

在CMOS RAM中，存放着当前的时间：年、月、日、时、分、秒。这6个信息的长度都为1个字节，存放单元为：

秒	分	时	日	月	年
0	2	4	7	8	9

这些数据以BCD码的方式存放。

BCD码是以4位二进制数表示十进制数码的编码方法，如下表所示：

0	1	2	3	4	5	6	7	8	9
0000	0001	0010	0011	0100	0101	0110	0111	1000	1001

4. shl和shr指令

shl和shr是逻辑移位指令。

shl是逻辑左移指令，它的功能为：

将一个寄存器或内存单元中的数据向左移位；
将最后移出的一位写入CF中；
最低位用0补充。

shr是逻辑右移指令，它和 shl 所进行的操作刚好相反~

mov al, 01001000b 
shl al, 1 			;将a1中的数据左移一位
;执行后（al）=10010000b，CF=0。

mov al, 10000001b 
shr al, 1  ;将al中的数据右移一位
;执行后（al）=01000000b，CF=1。

十三、外中断

CPU在计算机系统中，除了能够执行指令，进行运算以外，还应该拥有I/O（输入输出）能力。

1. 接口芯片和端口

PC系统的接口卡和主板上，装有各种接口芯片。这些外设接口芯片的内部有若干寄存器，CPU将这些寄存器当作端口来访问。

外设的输入不直接送入内存和CPU，而是送入相关的接口芯片的端口中；CPU向外设的输出也不是直接送入外设，而是先送入端口中，再由相关的芯片送到外设。CPU还可以向外设输出控制命令，而这些控制命令也是先送到相关芯片的端口中，然后再由相关的芯片根据命令对外设实施控制。

即： CPU通过端口和外部设备进行联系。

2. 外中断信息

当CPU外部有需要处理的事情发生的时候，比如说，外设的输入到达，相关芯片将向CPU发出相应的中断信息。CPU在执行完当前指令后，可以检测到发送过来的中断信息，引发中断过程，处理外设的输入。

在PC系统中，外中断源有两类：

1、可屏蔽中断

可屏蔽中断是CPU可以不响应的外中断。CPU是否响应可屏蔽中断，要看标志寄存器的IF位的设置。

当CPU检测到可屏蔽中断信息时，如果IF=1，则CPU在执行完当前指令后响应中断，引发中断过程；如果IF=0，则不响应可屏蔽中断。可屏蔽中断过程类似于内部中断：

获取中断类型码n（从外部通过总线输入）
标志寄存器入栈，IF=0，TF=0
CS，IP入栈
(IP)=(n*4)，(CS)=(n*4+2)

中断过程中将IF置0的原因：在进入中断处理程序后，禁止其他的可屏蔽中断。如果在中断处理程序中需要处理可屏蔽中断，可以用指令将IF置1。

8086CPU提供的设置IF的指令：

sti，设置IF=1；
cli，设置IF=0。

2、不可屏蔽中断

不可屏蔽中断是CPU必须响应的外中断。当CPU检测到不可屏蔽中断信息时，则在执行完当前指令后，立即响应，引发中断过程。

对于8086CPU，不可屏蔽中断的中断类型码固定为2，所以中断过程中，不需要取中断类型码。则不可屏蔽中断的中断过程为：

标志寄存器入栈，IF=0，TF=0；
CS、IP入栈；
(IP)=(8)，(CS)=(0AH)。

几乎所有由外设引发的外中断，都是可屏蔽中断。如键盘输入，不可屏蔽中断通常是在系统中有必须处理的紧急情况发生时通知CPU的中断信息。

3. PC机键盘的处理过程

1.键盘输入

键盘上每个按键都相当于一个开关，键盘中有一个芯片对键盘上的每一个键的开关状态进行扫描。

按下一个键时，开关接通，该芯片就产生一个扫描码，扫描码说明了按下的键在键盘上的位置。扫描码被送入主板上的相关接口芯片的寄存器中，该寄存器的端口地址为 60h。

松开按下的键时，也产生一个扫描码，扫描码说明了松开的键在键盘上的位置。松开按键时产生的扫描码也被送入 60h 端口中。

一般将按下一个键时产生的扫描码称为通码，松开一个键产生的扫描码称为断码。

扫描码长度为一个字节，通码的第7位为0，断码的第7位为1。
即：断码 = 通码 + 80h。
比如，g键的通码为 22h，断码为 a2h。

2.引发9号中断

键盘的输入到达60h端口时，相关的芯片就会向CPU发出中断类型码为9的可屏蔽中断信息。CPU检测到该中断信息后，如果IF=1，则响应中断，引发中断过程，转去执行int 9中断例程。

3.执行 int 9 中断例程

BIOS提供了int 9中断例程，用来进行基本的键盘输入处理，主要的工作如下：

读出60h端口中的扫描码；
如果是字符键的扫描码，将该扫描码和它所对应的字符码（即ASCII码）送入内存中的BIOS键盘缓冲区；
如果是控制键（比如Ctrl）和切换键（比如CapsLock）的扫描码，则将其转变为状态字节（用二进制位记录控制键和切换键状态的字节）写入内存中存储状态字节的单元；
对键盘系统进行相关的控制，比如说，向相关芯片发出应答信息。

BIOS 键盘缓冲区（是系统启动后，BIOS用于存放int 9中断例程所接收的键盘输入的内存区）可以存储15个键盘输入，在该缓冲区中一个键盘输入用一个字单元存放，高位字节存放扫描码，低位字节存放字符码。

0040:17单元存储键盘状态字节，该字节记录了控制键和切换键的状态。键盘状态字节各位记录的信息如下。

位	状态	置1
0	右shift状态	置1表示按下右shift键
1	左shift状态	置1表示按下左shift键
2	Ctrl状态	置1表示按下Ctrl键
3	Alt状态	置1表示按下Alt键
4	ScrollLock状态	置1表示Scroll指示灯亮
5	NumLock状态	置1表示小键盘输入的是数字
6	CapsLock状态	置1表示输入大写字母
7	Insert状态	置1表示处于删除态

4. 编写int 9中断例程

示例，见王爽《汇编语言》P276-P284

CPU对外设输入的通常处理方法：

外设的输入送入端口；
向CPU发出外中断（可屏蔽中断）信息；
CPU检测到可屏蔽中断信息，如果IF=1，CPU在执行完当前指令后响应中断，执行相应的中断例程；
可在中断例程中实现对外设输入的处理。

端口和中断机制，是CPU进行I/O的基础。

十四、指令系统总结

对8086CPU的指令系统进行一下总结。读者若要详细了解8086指令系统中的各个指令的用，可以查看有关的指令手册。

8086CPU提供以下几大类指令。

数据传送指令
如：mov、push、pop、pushf、popf、xchg 等都是数据传送指令，这些指令实现寄存器和内存、寄存器和寄存器之间的单个数据传送。
算术运算指令
如：add、sub、adc、sbb、inc、dec、cmp、imul、idiv、aaa等都是算术运算指令，这些指令实现寄存器和内存中的数据的算数运算。它们的执行结果影响标志寄存器的sf、zf、of、cf、pf、af位。
逻辑指令
如：and、or、not、xor、test、shl、shr、sal、sar、rol、ror、rcl、rcr等都是逻辑指令。除了not指外，它们的执行结果都影响标志寄存器的相关标志位。
转移指令
可以修改IP，或同时修改CS和IP的指令统称为转移指令。转移指令分为以下几类。
（1）无条件转移指令，比如，jmp；
（2）条件转移指令，比如，jcxz、je、jb、ja、jnb、jna等；
（3）循环指令，比如，loop；
（4）过程，比如，call、ret、retf；
（5）中断，比如，int、iret。
处理机控制指令
这些指令对标志寄存器或其他处理机状态进行设置，如：cld、std、cli、sti、nop、clc、cmc、stc、hlt、wait、esc、lock等都是处理机控制指令。
串处理指令
这些指令对内存中的批量数据进行处理，如：movsb、movsw、cmps、scas、lods、stos等。若要使用这些指令方便地进行批量数据的处理，则需要和rep、repe、repne 等前缀指令配合使用。

十五、直接定值表

讨论如何有效合理地组织数据，以及相关的编程技术。

1. 描述单元长度的标号

在之前，我们一直在代码段中使用标号来标记指令、数据、段的起始地址。这些标号仅仅表示了内存单元的地址。

如：

assume cs:code
code segment
         a : db 1,2,3,4,5,6,7,8  ;在a后面加有":"
         b : dw 0
start :mov si,offset a
         mov bx,offset b
         mov cx,8
    s : mov al,cs:[si]
         mov ah,0
         add cs:[bx],ax
         inc si
         loop s
         mov ax,4c00h
         int 21h
code ends
end start

注意：在后面加有 “ ：” 的地址标号，只能在代码段中使用，不能在其他段中使用。

现在我们引出新的概念：数据标号，这种标号不但表示内存单元的地址，还表示了内存单元的长度（即此标号处的单元，是一个字节单元还是字单元，还是双字单元）。

上面的程序现在可以写成这样：

assume cs:code
code segment
          a db 1,2,3,4,5,6,7,8 	;标号a、b后面没有":"
          b dw 0               
start :  mov si,0
          mov cx,8
    s :   mov al,a[si]
          mov ah,0
          add b,ax
          inc si
          loop s
          mov ax,4c00h
          int 21h
code ends
end start

在code段中a和b后并没有 ”:” 号，这种写法同时描述内存地址和单元长度的标号。

标号a ，描述了地址 code:0 和从这个地址开始后的内存单元都是字节单元；
而标号b，描述了地址 code:8 和从这个地址开始以后的内存单元都是字单元。

2.在其他段中使用数据标号

注意：
如果想在代码段中直接使用数据标号访问数据，需要用伪指令 assume 将标号所在的段和一个段寄存器联系起来。否则，编译器在编译的时候，无法确定标号的段地址在哪一个寄存器中。

当然，并不是说用伪指令 assume 将标号所在的段和某个段相联系，段寄存器中就真的存放该段的地址。在程序中还要使用指令对段寄存器进行设置。

如：在程序中用ds寄存器和data段相连，则编译器对相关指令的编译如下

指令：  mov al,a[si]
编译为：mov al,[si+0]

指令：  add b,ax
编译为：add [8],ax

你可能感兴趣的:(#,汇编语言,汇编语言,汇编)

使用内联汇编实现CAS操作（含详细讲解）（Charon）汇编
在多线程环境下，如何安全地更新共享变量，一直是一个重要的话题。今天，我们通过一段使用内联汇编实现的CAS（CompareAndSwap）代码，深入学习它的原理和用法。完整示例代码如下：#include//标准输入输出头文件#include//pthread多线程编程相关头文件#include//usleep函数需要的头文件#defineTHREAD_COUNT10//定义线程数量为10volati
Golang defer 的编译器实现细节 Golang编程笔记 golang 开发语言后端 ai
Golangdefer的编译器实现细节：从语法糖到运行时的全链路解析关键词：Go语言、defer、编译器优化、运行时、延迟执行摘要：本文将深入解析Go语言中defer关键字的底层实现细节。我们将从defer的基础用法出发，逐步拆解编译器如何将defer语法转换为机器可执行的代码，并结合Go编译器的优化历史（如开放编码优化）、运行时关键结构体（_defer）以及实际汇编代码，揭示defer从“语法糖
c语言变长数组与数组越界保护嵌入式er. Linux应用开发 c语言
文章目录1.定长数组的使用2.定长数组的栈空间3.变长数组的使用4.变长数组的栈空间5数组越界保护在c99协议标准中，增加了变长数组(VLA)这一特性，本文旨在从汇编的角度来理解其原理，并且简单阐述下数组越界保护的内容。在此顺带说一下自己对c语言学习的理解，关于常规的表达式、语法等不做阐述，主要对一些复杂的关键字或者特性的学习方式作以自己的感悟。如：c语言中对const、static、变长数组等的
C语言笔记
学习笔记仅供参考基础介绍程序就是一组计算机能识别的指令，计算机的一切操作都是由程序控制的。人和计算机都能识别的语言就是就是计算机语言，计算机工作是基于二进制的。计算机能直接识别的二进制代码就是机器指令，机器指令的集合就是机器语言。机器语言与人们习惯使用的语言差别太大，所以人们创造出了符号语言，计算机不能直接识别符号语言的指令，需要汇编程序软件将符号语言指令转成机器指令(二进制代码)。机器语言与汇编
brpc中的bthread_jump_fcontext汇编函数到底发生了什么？
我们之前讲了brpc中的bthread创建，分配和切换。那么在切换过程中，brpc中的bthread_jump_fcontext汇编函数到底发生了什么？我们来非常具体地讲一讲。函数签名intptr_tbthread_jump_fcontext(bthread_fcontext_t*ofc,//%rdi:输出参数，保存源上下文指针bthread_fcontext_tnfc,//%rsi:输入参数，目
汇编语言:基于x86处理器第一章习题解答「已注销」 Linux 内核资深专家 arm
汇编语言习题解答习题解答1.1.3本节回顾习题解答1.1.3本节回顾1、汇编器和链接器是如何一起工作的？汇编程序要转化为可执行程序，需要先译码后组合。这是因为一个完整的汇编程序常常是由多个文件构成，先用汇编器将每一个文件中的汇编代码转化为机器语言后，链接器再把这些文件组合成一个可执行程序。2、学习汇编语言如何能提高你对操作系统的理解？可用汇编语言验证操作系统的理论知识，从而更深刻的掌握操作系统3、
汇编语言：基于x86处理器（原书第7版）所有课后习题答案 Up to the mountain 汇编 masm
包含3-13章所有习题答案，覆盖率95%以上，除了意义不大和重复的，高难度题目我全做了包含vs2015工程，使用时将对应的习题拖到vs工程的源码底下，一次编译一个，如果莫名报错，请将文件名改成简单英文或数字名，如a31.asm---引用请注明出处---下载地址：汇编语言：基于x86处理器（原书第7版）所有课后习题答案_汇编语言基于x86处理器第七版课后答案-其它文档类资源-CSDN下载
Android逆向工具简单介绍 @ZhangJun Android 进阶 Android逆向反编译反汇编 Hook
目录一、Android逆向概述1、什么是Android逆向2、逆向过程3、逆向用途1）APP自动化执行程序脚本2）修改APP的功能3）APP安全二、常用逆向工具介绍1、APP抓包工具1）Fiddler2）Wireshark2、jadx反编译工具3、APKDB4、Frida之Hook工具5、IDA反汇编工具1）为何反汇编2）如何反汇编3）IDAPro的基本功能：4）IDA目录结构5）常用快捷键6）常
Solidity——什么是低级调用（low-level calls）和操作码的内联汇编
这是Solidity高级开发中很重要的两个概念，通常用于：精细控制合约行为（比如合约间通信、控制gas、避免fallback限制）编写高性能或底层逻辑的合约（例如代理合约、MEV、Gas优化等）我们逐一讲清楚：✅一、什么是低级调用（Low-levelcalls）Solidity提供了几种**“低级”函数调用方式**，用于替代标准的函数调用。这些函数更原始、更灵活，但使用不当容易出bug（比如失败不
高级汇编语言编程技巧与优化代码世界探索者汇编语言详解汇编 linux
一、宏和宏指令1.宏的基本概念•定义：宏是一种文本替换机制。它允许程序员定义一个宏名，并将一组指令或代码片段与该宏名关联起来。在代码中使用宏名时，汇编器会将其替换为对应的指令或代码片段。2.宏的定义和使用（1）定义宏在汇编语言中，宏的定义通常使用MACRO指令开始，以ENDM指令结束。宏的定义包括宏名和一组指令或代码片段。语法：宏名MACRO参数1,参数2,...指令1指令2...ENDM示例：;
jvm执行i++代码的步骤，内存中数据的流转过期小朋友、 jdk
大家好，今天看了一个java面试讲解课程，里面说i++，在jvm执行时，会被分成四步：1.主存中i的数值放到线程工作内存2.加一3.加一的值放回线程工作内存中4.线程工作内存中的值放回主存中使用idea编写了一个例子，获取jvm的汇编指令，使用指令说明，翻译过来在内存中数值流转。发现2,3是一个命令iadd。具体如下:例子：packagecom.wmr.jvmtest;publicclassIPl
408考研逐题详解：2010年第18题——CPU寄存器
2010年第18题下列寄存器中，汇编语言程序员可见的是（）A.存储器地址寄存器(MAR)\qquadB.程序计数器(PC)\qquadC.存储器数据寄存器(MDR)\qquadD.指令寄存器(IR)解析本题考查的是计算机组成原理中关于CPU寄存器的分类及其可见性，特别是汇编语言程序员的视角。存储器地址寄存器（MAR,MemoryAddressRegister）：用于存储CPU即将访问的内存地址（如
利用反汇编技术将游戏《英雄无敌3》修改为硬盘版安联酋长汇编游戏汇编
最近好不容易找到我最喜欢的游戏《英雄无敌3之埃拉西亚的光复》，可惜是光盘版的，要用虚拟光驱来运行，感觉不爽，网上也找不到免CD补丁，于是决定自己动手。首先感谢这篇文章的作者http://bbs.pediy.com/showthread.php?t=101023是他引领我进入反汇编的大门。这篇文章的第一步，就是找到GetDriveType的调用（GetDriveType就是判断某盘符是光驱、硬盘或网
C++语言标准 Shy_tom C++c++
title:C++语言标准description:C++标准C++语言的起源与C语言一样，C++也是在贝尔实验室诞生的，BjarneStroustrup于20世纪80年代在这里开发出了这种语言。用他自己的话来说，“C++主要是为了我的朋友和我不必再使用汇编语言、C语言或者其他现代高级语言来编程而设计的。它的主要功能是可以更方便地编写出好程序，让每个程序员更加快乐”。C++语言标准美国国家标准委
CppCon 2018 学习:TEACHING OLD COMPILERS NEW TRICKS TEACHING OLD COMPILERS NEW TRICKS Transpiling C++17 虾球xz CppCon 学习 c++开发语言
理解问题与解决方案：C++17和编译器兼容性这个问题描述了由于编译器版本差异（特别是GCC4.9与GCC4.8），在不同编译器版本下生成的汇编代码可能会有所不同，尤其是C++17中的某些新特性和语法在老版本的编译器中可能无法正确处理。这种情况通常会导致程序行为不一致，特别是在对性能或低级代码有要求时。具体问题：问题描述：C++17特性与GCC4.9：例如，0b1000'0000是C++17中引入的
【嵌入式ARM汇编基础】-ELF文件格式内部结构详解（四）视觉与物联智能嵌入式Linux与边缘智能 arm开发汇编嵌入式硬件物联网 RK3588
ELF文件格式内部结构详解（四）文章目录ELF文件格式内部结构详解（四）15、ELF程序初始化和终止部分15.1初始化和终止顺序16、线程局部存储16.1本地执行TLS访问模型16.2Initial-ExecTLS访问模型16.3通用动态TLS访问模型16.4本地动态TLS访问模型15、ELF程序初始化和终止部分一旦程序加载到内存中，其依赖关系得到满足，并且已正确重定位并链接到其共享库依赖项，加载
计算机导论与计算机组成原理关系,计算机组成原理
一、课程简介课程中文名称:《计算机组成原理与汇编语言》课程英文名称:Computerprincipleandassemblylanguage课程编号:ZYB08003课程性质:专业必修课学时数:54学时(其中授课学时，课堂实验学时，讨论学时，自学学时)学分:3学分适用专业:计算机科学与技术课程的主要任务本课程的作用是通过课堂理论学习和实际操作训练，使学生掌握计算机硬件组成的基本原理、汇编语言程序设
【Linux】环境基础开发工具使用——gcc/g++使用风铃子加油 Linux linux 算法运维开发语言 xshell
Linux编译器-gcc/g++使用1.背景知识1.预处理（进行宏替换)2.编译（生成汇编)3.汇编（生成机器可识别代码）4.连接（生成可执行文件或库文件)2.gcc如何完成格式gcc[选项]要编译的文件[选项][目标文件]预处理(进行宏替换)预处理功能主要包括宏定义,文件包含,条件编译,去注释等。预处理指令是以#号开头的代码行。实例:gcc–Ehello.c–ohello.i选项“-E”,该选项
计算机编译原理ppt,编译原理课件.ppt 知知与终生计算机编译原理ppt
文档介绍：高级语言汇编语言SOURCEPROGRAMAssemblePROGRAM?翻译程序?TRANSLATER为什么要学****编译原理程序设计语言是计算机软件专业的重要核心学****编程的历程:C语言--汇编语言--数据结构Monday,July03,2017编译原理为什么要学****编译原理必修主干课程,操作系统和编译系统构成程序设计者与计算机之间的基本界面。通过学****该课程,掌握编译
C语言控制结构深度解析：从底层原理到高效实战技巧 Bryan Ding c语言开发语言
一、程序逻辑的核心密码程序设计的本质是对现实问题的抽象和逻辑表达。C语言作为结构化编程语言的典范，其控制结构构成了程序逻辑的骨架。三大基本结构构成所有程序的逻辑基础：顺序结构：代码的自然执行顺序选择结构：if/else语句实现分支判断循环结构：for/while实现重复操作二、选择结构的底层实现1.if语句的机器级实现if (condition){ //代码块}编译后的汇编代码示例： cmp
【Linux内核及内核编程】Linux 内核的发展与演变：从 UNIX 到开源帝国的崛起 byte轻骑兵 #嵌入式Linux驱动开发实战 linux unix 运维
1969年，贝尔实验室的肯·汤普森和丹尼斯·里奇在报废的DECPDP-7小型机上开发了一个“太空旅行”游戏。为简化开发，他们用汇编语言编写了一个轻量级操作系统——UNICS（UniplexedInformationandComputingService），后缩写为UNIX。这个“游戏外挂”意外开启了操作系统的新纪元目录一、UNIX：现代操作系统的基石1.1起源与早期发展1.2分支与商业化二、Min
从汇编指令看函数调用堆栈的详细过程 melonbo 编译汇编开发语言
1、C++代码这个C++源码实现了一个简单的加法函数，并在主函数中调用该函数来计算两个整数的和。intsum(inta,intb){inttemp=0;temp=a+b;returntemp;}intmain(){inta=10;intb=20;intret=sum(a,b);return0;}2、汇编代码在ARMCortex-A9平台上，编译后的C++源代码的汇编代码如下：.cpucortex-
I.MX6ULL ARM裸机开发---C语言LED实验一盆电子 ARM裸机开发 arm c语言驱动开发
一、引言考虑到工作效率，嵌入式驱动开发很少用汇编，大部分是用C语言进行开发。嵌入式驱动开发开始部分就可以用C语言吗？当然不是！在开始部分用汇编来初始化一下C语言环境，比如初始化DDR、设置堆栈指针SP等等，当这些工作都做完以后就可以进入C语言环境，也就是运行C语言代码，一般都是进入main函数。有两部分文件需要完成： 1、汇编文件汇编文件用来完成C语言环境搭建。 2、C语言文件
C++入门笔记张峻铖 C++c++
写在开头初衷：对于一个程序员/算法工程师来说，只会Python未免过于单薄了。出于未来找工作的需要，开始学习C++，并使用C++刷LeetCode。背景：本科有C语言课程，甚至学过汇编，研究生阶段主要使用Python。提醒：该系列文章以尽可能快地应用C++（刷题）为目的，暂以B站黑马程序员C++教程为教材，主要记录重点内容和对个人来讲不易理解或陌生的内容，具有较浓的个人笔记特点，因此，在全面性和权
解锁 Hello World 的 N 种炫酷玩法
目录一、引言二、编程语言之美2.1C语言艺术字输出2.2用汇编语言实现经典三、硬件交互的奇妙世界3.1Arduino与LED的舞蹈3.2STM32点亮小灯四、AI模型应用的创新之旅4.1OpenAIAPI初体验4.2LangChain框架的魅力五、总结与展望一、引言在编程的世界里，“HelloWorld”就像是一把神奇的钥匙，开启了无数人探索编程奥秘的大门。它作为编程学习的经典入门示例，有着不可替
C51填坑记：中断处理导致主程序函数参数改变 albert_812 C51 C51 Data Overlay 中断参数异常改变
1.现象平台：keilc51，中颖SH79F7019A现象：在增加了一个中断处理逻辑后，发现主程序异常，断点调试发现某个函数的参数被改变了，程序使用了错误的数据导致逻辑出错。2.排查初步分析，可能原因如下：1.参数寄存器(R0-R7)的值，被中断函数改变。2.堆栈溢出。2.1参数寄存器首先排查参数寄存器（中断里面调用了函数，有参数传递）。通过仿真器观察中断函数汇编代码，发现在进入中断之前是对R0-
ARMv8架构参考手册下载唐方展
ARMv8架构参考手册下载【下载地址】ARMv8架构参考手册下载分享ARMv8架构参考手册下载项目地址:https://gitcode.com/Open-source-documentation-tutorial/1df35资源介绍本仓库提供ARM官方的ARM架构参考手册，最新版本为ARMv8-A。该手册是系统学习ARM指令的最佳参考书，涵盖了ARMv8架构的详细信息和汇编指令手册。资源文件文件名
linux的常用命令 Flying Fish（HHH） linux 服务器运维
一、进程相关：查看进程：ps-aux|grep进程id查看僵尸进程：ps-ef|grepdefunct（进程名称）如何查看线程使用哪个so库？lsof-ppid|grepbasecat/proc/376421/maps|grep'\.so'查看对应的.so文件是否已经成功转成汇编yuminstallbinutils-2.37-14.oe2203sp1.x86_64objdump-Sllibbase
Python 爬虫进阶必备 | 当 Js 逆向遇上 wasm（一）咸鱼学 Python python 爬虫 javascript
前言关注公众号【咸鱼学Python】获取更多关于Python爬虫、Js逆向、安卓逆向的文章Wasm是一种底层汇编语言，具有文本格式支持，其目标是可移植、安全和高效。Wasm的模块可以被导入的到一个网络app（或Node.js）中，并且暴露出供JavaScript使用的Wasm函数。Wasm与其他虚拟机的主要区别在于，它没有针对任何特定的编程语言进行优化，而只是抽象底层硬件，字节码直接对应于现代cp
简明x86汇编语言教程(4) Night-Wish ASM
第三章操作内存在前面的章节中，我们已经了解了寄存器的基本使用方法。而正如结尾提到的那样，仅仅使用寄存器做一点运算是没有什么太大意义的，毕竟它们不能保存太多的数据，因此，对编程人员而言，他肯定迫切地希望访问内存，以保存更多的数据。我将分别介绍如何在保护模式和实模式操作内存，然而在此之前，我们先熟悉一下这两种模式中内存的结构。3.1实模式事实上，在实模式中，内存比保护模式中的结构更令人困惑。内存被分割
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出