ARM64指令简易手册

# 概述
# ARM指令集
  ## 跳转指令
  ## 数据处理指令
  ## 程序状态寄存器访问指令
  ## 加载/存储指令
  ## 协处理器指令
  ## 异常产生指令
# ARM汇编伪指令
  ## 符号定义伪指令
  ## 数据定义伪指令
  ## 汇编控制伪指令（包括宏指令）
  ## 其他伪指令

ARM处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器（PSR）处理指令、加载/存储指令、协处理器指令和异常产生指令6大指令。

本文只列举一些常见的基本指令，可以正常阅读汇编代码即可。有几个注意点：

寄存器：为标号，不加前缀
操作数顺序：目标操作数在左，源操作数在右
立即数：前加#作为前缀
寻址格式：常见的有三种

;寻址格式：
    [x10, #0x10]      // signed offset。 意思是从 x10 + 0x10的地址取值
    [sp, #-16]!       // pre-index。  意思是从 sp-16地址取值，取值完后在把 sp-16  writeback 回 sp
    [sp], #16         // post-index。 意思是从 sp 地址取值，取值完后在把 sp+16 writeback 回 sp
    举例：
      ldr x0, [x1]              // 从`x1`指向的地址里面取出一个 64 位大小的数存入 `x0`
      ldp x1, x2, [x10, #0x10]  // 从 x10 + 0x10 指向的地址里面取出 2个 64位的数，分别存入x1, x2
      str x5, [sp, #24]         // 把x5的值（64位数值）存到 sp+24 指向的内存地址上
      stp x29, x30, [sp, #-16]! // 把 x29, x30的值存到 sp-16的地址上，并且把 sp-=16. 
      ldp x29, x30, [sp], #16   // 从sp地址取出 16 byte数据，分别存入x29, x30. 然后 sp+=16;

本文中检索不到，全面的可以查看ARM官网文档。如果想看中文版的资料可以看《汇编器指南》— 第二章、第四章：

一、跳转指令

跳转指令用于实现程序流程的跳转，在ARM程序中有以下两种方法可以实现程序流程的跳转：

使用专门的跳转指令；
直接向程序计数器PC写入跳转地址值，通过向程序计数器PC写入跳转地址值，可以实现在4GB的地址空间中的任意跳转，在跳转之前结合使用MOV LR，PC等类似指令，可以保存将来的返回地址值，从而实现在4GB连续的线性地址空间的子程序调用。

ARM指令集中的跳转指令可以完成从当前指令向前或向后的32MB的地址空间的跳转，包括以下4条指令：

1、B指令
  格式：`B{条件} 目标地址`
  解释：B指令是最简单的跳转指令。一旦遇到一个B指令，ARM处理器将立即跳转到给定的目标地址，从那里继续执行。注意存储在`跳转指令中的实际值是相对当前PC 值的一个偏移量，而不是一个绝对地址`，它的值由汇编器来计算（参考寻址方式中的相对寻址）。它是24位有符号数，左移两位后有符号扩展为32 位，表示的有效偏移为26 位(前后32MB的地址空间)。以下指令：
  示例：
    B    Label      //程序无条件跳转到标号Label处执行
    CMP R1，＃0     //当CPSR寄存器中的Z条件码置位时，程序跳转到标号Label处执行
    BEQ Label    
  补充：BNE与BEQ
    TST     R0, #0X8
    BNE    SuspendUp ；  //BNE指令是“不相等（或不为0）跳转指令”： 
    LDR   R1,#0x00000000
      先进行and运算，如果R0的第四位不为1，则结果为零，则设置zero=1（继续下面的LDR指令）；
    否则，如果R0的第四位为1，zero=0（跳到SuspendUp处执行）。

    tst 和bne连用: 先是用tst进行位与运算，然后将位与的结果与0比较，如果不为0，则跳到bne紧跟着的标记（如bne sleep，则跳到sleep处）。
    tst 和beq连用: 先是用tst进行位与运算，然后将位与的结果与0比较，如果为0，则跳到beq紧跟着的标记（如bne AAAA，则跳到AAAA处）。   

2、BL指令
  格式：BL{条件} 目标地址
  解释：BL是另一个跳转指令，但跳转之前，会在寄存器R14中保存PC的当前内容，因此，可以通过将R14的内容重新加载到PC中，来返回到跳转指令之后的那个 指令处执行。该指令是实现子程序调用的一个基本但常用的手段。
  示例：
    BL   Label      //当程序无条件跳转到标号Label处执行时，同时将当前的 PC值保存到R14（LR）中

3、BLX指令
  格式： BLX 目标地址
  解释：BLX指令从ARM指令集跳转到指令中所指定的目标地址，并将处理器的工作状态有ARM状态切换到Thumb状态，该指令同时将PC的当前内容保存到寄存器R14中。因此，当子程序使用Thumb指令集，而调用者使用ARM指令集时，可以通过BLX指令实现子程序的调用和处理器工作状态的切换。同时，子程序的返回可以通过将寄存器R14值复制到PC中来完成。

4、BX指令
  格式：BX{条件} 目标地址
  解释：BX指令跳转到指令中所指定的目标地址，目标地址处的指令既可以是ARM指令，也可以是Thumb指令。

二、数据处理指令

此类指令用于对通用寄存器执行运算。

它们可对两个寄存器的内容执行加法、减法或按位逻辑等运算，并将结果存放到第三个寄存器中。
还可以对单个寄存器中的值执行运算，或者对寄存器中的值与指令中提供的常数（立即值）执行运算。

数据处理指令可分为数据传送指令、比较指令和算术、逻辑运算指令等。

数据传送指令用于在寄存器和存储器之间进行数据的双向传输；
算术逻辑运算指令完成常用的算术与逻辑的运算，该类指令不但将运算结果保存在目的寄存器中，同时更新CPSR中的相应条件标志位；
比较指令不保存运算结果，只更新CPSR中相应的条件标志位。

数据处理指令如下：

1、MOV指令（传送）
  格式：MOV{条件}{S} 目的寄存器，源操作数
  解释：MOV指令可完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。其中S选项决定指令的操作是否影响CPSR中条件标志位的值，当没有S 时指令不更新CPSR中条件标志位的值。
  示例：
    MOV R1，R0                    //将寄存器R0的值传送到寄存器R1
    MOV PC，R14                   //将寄存器R14的值传送到 PC，常用于子程序返回
    MOV R1，R0，LSL＃3            //将寄存器R0的值左移3位后传送到R1

2、MVN指令（取反移动）
  格式：MVN{条件}{S} 目的寄存器，源操作数
  解释：MVN指令可完成从另一个寄存器、被移位的寄存器、或将一个立即数加载到目的寄存器。与MOV指令不同之处是在传送之前按位被取反了，即把一个被取反的值 传送到目的寄存器中。其中S决定指令的操作是否影响CPSR中条件标志位的值，当没有S时指令不更新CPSR中条件标志位的值。
  示例：
    MVN R0，＃0            ；将 立即数0取反传送到寄存器R0中，完成后R0=-1

比较指令
3、CMP指令（比较）
  格式：CMP{条件} 操作数1，操作数2
  解释：CMP指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较，同时更新CPSR中条件标志位的值。该指令进行一次减法运算，但不存储结果，只更改条件标志位。 标志位表示的是操作数1与操作数2的关系(大、小、相等)，例如，当操作数1大于操作操作数2，则此后的有GT后缀的指令将可以执行。
  示例：
    CMP   R1，R0       ；将寄存器R1的值与寄存器R0的值相减，并根据 结果设置CPSR的标志位
    CMP   R1，＃100   ；将寄存器R1的值与立即数100相减，并根 据结果设置CPSR的标志位

4、CMN指令（负数比较）
  格式：CMN{条件} 操作数1，操作数2
  解释：CMN指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较，同时更新CPSR中条件标志位的值。该指令实际完成操作数1和操作数2相 加，并根据结果更改条件标志位。
  示例：
    CMN   R1，R0     ；将寄存器R1的值与寄存器R0的值相加，并根据 结果设置CPSR 的标志位
    CMN   R1，＃100  ；将寄存器R1的值与立即数100相加，并根据 结果设置CPSR的标志位

5、TST指令（位测试）
  格式：TST{条件} 操作数1，操作数2
  解释：TST指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算，并根据运算结果更新CPSR中条件标志位的值。操作数1是要测试的数据，而操作数2是一个位掩码，该指令一般用来检测是否设置了特定的位。
  示例：
    TST   R1，＃％1            ；用于测试在寄存器R1中是否设置了最低位（％表 示二进制数）
    TST   R1，＃0xffe           ；将寄存器R1的值与立即数0xffe按位与，并根据 结果设置CPSR的标志位

6、TEQ指令（相等测试）
  格式：TEQ{条件} 操作数1，操作数2
  解释：TEQ指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算，并根据运算结果更新CPSR中条件标志位的值。该指令通常用于比较操作数1和操作数2是否相等。
  示例：
    TEQ   R1，R2          ；将寄存器R1的值与寄存器R2的值按位异或，并根据结果 设置CPSR的标志位

算术运算指令
7、ADD指令（相加）
  格式：ADD{条件}{S} 目的寄存器，操作数1，操作数2
  解释：ADD指令用于把两个操作数相加，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。
  示例：
    ADD     R0，R1，R2                  ； R0 = R1 + R2
    ADD     R0，R1，#256                ； R0 = R1 + 256
    ADD     R0，R2，R3，LSL#1       ； R0 = R2 + (R3 << 1)

8、ADC指令（带进位相加）
  格式：ADC{条件}{S} 目的寄存器，操作数1，操作数2
  解释：ADC指令用于把两个操作数相加，再加上CPSR中的C条件标志位的值，并将结果存放到目的寄存器中。它使用一个进位标志位，这样就可以做比32位大的数 的加法，注意不要忘记设置S后缀来更改进位标志。操作数1应是一个寄存器，操作数2可以是一 个寄存器，被移位的寄存器，或一个立即数。
  示例：
    以下指令序列完成两个128位数的加法，第一个数由高到低存放在寄存器R7～R4，第二个数由高到低存放在寄存器R11～R8，运算结果由高到低存放在寄 存器R3～R0：
    ADDS    R0，R4，R8          ； 加低端的字
    ADCS    R1，R5，R9          ； 加第二个字，带进位
    ADCS    R2，R6，R10        ； 加第三个字，带进位
    ADC      R3，R7，R11        ； 加第四个字，带进位

9、SUB指令（相减）
  格式：SUB{条件}{S} 目的寄存器，操作数1，操作数2
  解释：SUB指令用于把操作数1减去操作数2，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令可用于有符号数或无符号数的减法运算。
  示例：
    SUB     R0，R1，R2                 ； R0 = R1 - R2
    SUB     R0，R1，#256            ； R0 = R1 - 256
    SUB     R0，R2，R3，LSL#1      ； R0 = R2 - (R3 << 1)

10、SBC指令（带进位减法）
  格式：SBC{条件}{S} 目的寄存器，操作数1，操作数2
  解释：SBC指令用于把操作数1减去操作数2，再减去CPSR中的C条件标志位的反码，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以 是一个寄存器，被移位的寄存器，或一个立即数。该指令使用进位标志来表示借位，这样就可以做大于32位的减法，注意不要忘记设置S后缀来更改进位标志。该指令可用于有符号数或无符号数的减法运算。
  示例：
    SUBS    R0，R1，R2        ；R0 = R1 - R2 - ！C，并根据结果设置CPSR的进位标志位

11、RSB指令（逆向/反向减法）
  格式：RSB{条件}{S} 目的寄存器，操作数1，操作数2
  解释：RSB指令称为逆向减法指令，用于把操作数2减去操作数1，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令可用于有符号数或无符号数的减法运算。
  示例：
    RSB     R0，R1，R2                         ； R0 = R2 – R1
    RSB     R0，R1，#256                     ； R0 = 256 – R1
    RSB     R0，R2，R3，LSL#1           ； R0 = (R3 << 1) - R2

12、RSC指令（反向带进位减）
  格式：RSC{条件}{S} 目的寄存器，操作数1，操作数2
  解释：RSC指令用于把 操作数2减去操作数1，再减去CPSR中的C条件标志位的反码，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位 的寄存器，或一个立即数。该指令使用进位标志来表示借位，这样就可以做大于32位的减法，注意不要忘记设置S后缀来更改进位标志。该指令可用于有符号数或 无符号数的减法运算。
  示例：
    RSC     R0，R1，R2           ；R0 = R2 – R1 - ！C

乘法指令与乘加指令
  ARM 微处理器支持的乘法指令与乘加指令共有6条，可分为运算结果为32位和运算结果为64位两类，与前面的数据处理指令不同，指令中的所有操作数、目的寄存器 必须为通用寄存器，不能对操作数使用立即数或被移位的寄存器，同时，目的寄存器和操作数1必须是不同的寄存器。 
乘法指令与乘加指令共有以下6条：
13、MUL指令（相乘）
  格式：MUL{条件}{S} 目的寄存器，操作数1，操作数2
  解释：MUL指令完成将操作数1与操作数2的乘法运算，并把结果放置到目的寄存器中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操 作数2均为32位的有符号数或无符号数。
  示例：
    MUL R0，R1，R2            ；R0 = R1 × R2
    MULS R0，R1，R2           ；R0 = R1 × R2，同时设置CPSR中的相关条件标志位

14、MLA指令（带累加的相乘）
  格式：MLA{条件}{S} 目的寄存器，操作数1，操作数2，操作数3
  解释：MLA指令完成将操作数1与操作数2的乘法运算，再将乘积加上操作数3，并把结果放置到目的寄存器中，同时可以根据运算结果设置CPSR中相应的条件标志 位。其中，操作数1和操作数2均为32位的有符号数或无符号数。
  示例：
    MLA   R0，R1，R2，R3            ；R0 = R1 × R2 + R3
    MLAS R0，R1，R2，R3            ；R0 = R1 × R2 + R3，同时设置CPSR中的相关条件标志位

15、SMULL指令
  格式：SMULL{条件}{S}   目的寄存器Low，目的寄存器High，操作数1，操作数2
  解释：SMULL指令完成将操作数1与操作数2的乘法运算，并把结果的低32位放置到目的寄存器Low中，结果的高32位放置到目的寄存器High中，同时可以 根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数。
  示例：
    SMULL   R0，R1，R2，R3     ；R0 = （R2 × R3）的低32位
                              ；R1 = （R2 × R3）的高32位

16、SMLAL指令
  格式：SMLAL{条件}{S}   目的寄存器Low，目的寄存器High，操作数1，操作数2
  解释：SMLAL指令完成将操作数1与操作数2的乘法运算，并把结果的 低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中，结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中，同 时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数。
对于目的寄存器Low，在指令执行前存放64位加数的低32位，指令执行后存放结果的低32位；对于目的寄存器High，在指令执行前存放64位加数的高32位，指令执行后存放结果的高32位。
  示例：
    SMLAL   R0，R1，R2，R3       ；R0 = （R2 × R3）的低32位 ＋ R0
                                ；R1 = （R2 × R3）的高32位 ＋ R1

17、UMULL指令
  格式：UMULL{条件}{S}   目的寄存器Low，目的寄存器High，操作数1，操作数2
  解释：UMULL指令完成将操作数1与操作数2的乘法运算，并把结果的低32位放置到目的寄存器Low中，结果的高32位放置到目的寄存器High中，同时可以 根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的无符号数。
  示例：
    UMULL   R0，R1，R2，R3       ；R0 = （R2 × R3）的低32位
                                 ；R1 = （R2 × R3）的高32位

18、UMLAL指令
  格式：UMLAL{条件}{S}   目的寄存器Low，目的寄存器High，操作数1，操作数2
  解释：UMLAL指令完成将操作数1与操作数2的乘法运算，并把结果的 低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中，结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High 中，同 时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的无符号数。
        对于目的寄存器Low，在指令执行前存放64位加数的低32位，指令执行后存放结果的低32位；对于目的寄存器High，在指令执行前存放64位加数的高32位，指令执行后存放结果的高32位。
示例：
    UMLAL   R0，R1，R2，R3            ；R0 = （R2 × R3）的低32位 ＋ R0
                                     ；R1 = （R2 × R3）的高32位 ＋ R1

逻辑运算指令
19、AND指令（逻辑位 与）
  格式：AND{条件}{S} 目的寄存器，操作数1，操作数2
  解释：AND指令用于在两个操作数上进行逻辑与运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令常用于屏蔽操作数1的某些位。
  示例：
    AND     R0，R0，＃3          ；该指令保持R0的0、1位，其余位清零。

20、ORR指令（逻辑位 或）
  格式： ORR{条件}{S} 目的寄存器，操作数1，操作数2
  解释：ORR指令用于在两个操作数上进行逻辑或运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令常用于设置操作数1的某些位。
  示例：
    ORR R0，R0，＃3        ；该指令设置R0的0、1位，其余位保持不变。

21、EOR指令（逻辑位 异或）
  格式：EOR{条件}{S} 目的寄存器，操作数1，操作数2
  解释：EOR指令用于在两个操作数上进行逻辑异或运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一 个立即数。该指令常用于反转操作数1的某些位。
  示例：
    EOR R0，R0，＃3        ；该指令反转R0的0、1位，其余位保持不变。

22、BIC指令（位清零）
  格式：BIC{条件}{S} 目的寄存器，操作数1，操作数2
  解释：BIC指令用于清除操作数1的某些位，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。 操作数2为32位的掩码，如果在掩码中设置了某一位，则清除这一位。未设置的掩码位保持不 变。
  示例：
    BIC R0，R0，＃％1011    ；该指令清除R0中的位 0、1、和 3，其余的位保持不变。

23、LSL（或ASL）(LSL逻辑左移、ASL算术左移)
  格式：通用寄存器，LSL（或ASL） 操作数      
  解释：LSL（或ASL）可完成对通用寄存器中的内容进行逻辑（或算术）的左移操作，按操作数所指定的数量向左移位，低位用零来填充。 其中，操作数可以是通用寄存器，也可以是立即数（0～31）。
  示例
    MOV   R0, R1, LSL #2          ；将R1中的内容左移两位后传送到R0 中。

24、LSR（逻辑右移）
  格式：通用寄存器，LSR 操作数      
  解释：LSR可完成对通用寄存器中的内容进行右移的操作，按操作数所指定的数量向右移位，左端用零来填充。其中，操作数可以 是通用寄存器，也可以是立即数（0～31）。
  示例： 
    MOV   R0, R1, LSR #2         ；将R1中的内容右移两位后传送到R0 中，左端用零来填充。

25、ASR（算术右移）
  格式：通用寄存器，ASR 操作数      
  解释：ASR可完成对通用寄存器中的内容进行右移的操作，按操作数所指定的数量向右移位，左端用第31位的值来填充。其中，操作数可以是通用寄存器，也可以是立 即数（0～31）。
  示例：
    MOV    R0, R1, ASR #2        ；将R1中的内容右移两位后传送到R0 中，左端用第31位的值来填充。

26、ROR（向右循环移）
  格式：通用寄存器，ROR 操作数      
  解释：ROR可完成对通用寄存器中的内容进行循环右移的操作，按操作数所指定的数量向右循环移位，左端用右端移出的位来填充。其中，操作数可以是通用寄存器，也 可以是立即数（0～31）。显然，当进行32位的循环右移操作时，通用寄存器中的值不改变。
  示例：
    MOV    R0, R1, ROR #2       ；将R1中的内容循环右移两位后传送到R0 中。

27、RRX（带扩展向右循环移）
  格式：通用寄存器，RRX 操作数      
  解释：RRX可完成对通用寄存器中的内容进行带扩展的循环右移的操作，按操作数所指定的数量向右循环移位，左端用进位标志位C来填充。其中，操作数可以是通用寄 存器，也可以是立即数（0～31）。
  示例：
    MOV   R0, R1, RRX #2         ；将R1中的内容进行带扩展的循环右移两位 后传送到R0中。

三、程序状态寄存器访问指令

此类指令向通用寄存器或者从通用寄存器往外移动状态寄存器的内容。

1、MRS指令（从 PSR 移动到寄存器）
  格式：MRS{条件}    通用寄存器 程序状态寄存器（CPSR或SPSR）
  解释：MRS指令用于将程序状态寄存器的内容传送到通用寄存器中。该指令一般用在以下两种情况：
    Ⅰ.当需要改变程序状态寄存器的内容时，可用MRS将程序状态寄存器的内容读入通用寄存器，修改后再写回程序状态寄存器。
    Ⅱ.当在异常处理或进程切换时，需要保存程序状态寄存器的值，可先用该指令读出程序状态寄存器的值，然后保存。
  示例：
    MRS R0，CPSR                         ；传送CPSR的内容到R0
    MRS R0，SPSR                         ；传送 SPSR的内容到R0

2、MSR指令（从寄存器移动到 PSR）
  格式：MSR{条件}    程序状态寄存器（CPSR或SPSR）_<域>，操作数
  解释：MSR指令用于将操作数的内容传送到程序状态寄存器的特定域中。其中，操作数可以为通用寄存器或立即数。<域>用于设置程序状态寄存器中需要 操作的位，32位的程序状态寄存器可分为4个域：
          位[31：24]为条件位域，用f表示；
          位[23：16]为状态位域，用s表示；
          位[15：8] 为扩展位域，用x表示；
          位[7：0]    为控制位域，用c表示；
        该指令通常用于恢复或改变程序状态寄存器的内容，在使用时，一般要在MSR指令中指明将要操作的域。
  示例：
    MSR CPSR，R0        ；传送R0的内容到CPSR
    MSR SPSR，R0        ；传送R0的内容到SPSR
    MSR CPSR_c，R0     ；传送R0的内容到SPSR，但仅仅修改CPSR中的控制位域

四、加载/存储指令

ARM微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据，加载指令用于将存储器中的数据传送到寄存器，存储指令则完成相反的操作。

此类指令用于从内存加载单个寄存器的值，或者在内存中存储单个寄存器的值。它们可加载或存储 32 位字、16 位半字或 8 位无符号字节。可以用符号或零扩展字节和半字加载以填充 32 位寄存器
此外，还有多个寄存器加载和存储指令，此类指令可从内存加载通用寄存器的任何子集，或者在内存中存储这样的子集。

常用的加载存储指令如下：

1、LDR指令
  格式：LDR{条件} 目的寄存器，<存储器地址>
  解释：LDR指令用于从存储器中将一个32位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取32位的字数据到通用寄存器，然后对数据进行处理。当程序计数器PC作为目的寄存器时，指令从存储器中读取的字数据被当作目的地址，从而可以实现程序流程的跳转。该指令在程序设计中比较常用，且寻址方式灵活多样，请读者认真掌握。
  示例：
    LDR R0，[R1]                ；将存储器地址为R1的字数据读入寄存器R0。
    LDR R0，[R1，R2]       ；将存储器地址为R1+R2的字数据读入寄存器R0。
    LDR R0，[R1，#8]        ；将存储器地址为R1+8的字数据读入寄存器R0。
    LDR R0，[R1，R2] ！   ；将存储器地址为R1+R2的字数据读入寄存器R0，并将新地址R1＋R2写入R1。
    LDR R0，[R1，＃8] ！  ；将存储器地址为R1+8的字数据读入寄存器R0，并将新地址 R1＋8写入R1。
    LDR R0，[R1]，R2        ；将存储器地址为R1的字数据读入寄存器R0，并将新地址 R1＋R2写入R1。
    LDR R0，[R1，R2，LSL＃2]！ ；将存储器地址为R1＋R2×4的字数据读入寄存器R0，并将新地址R1＋R2×4写入R1。
    LDR R0，[R1]，R2，LSL＃2      ；将存储器地址为R1的字数据读入 寄存器R0，并将新地址R1＋R2×4写入R1。

2、LDRB指令
  格式：LDR{条件}B 目的寄存器，<存储器地址>
  解释：LDRB指令用于从存储器中将一个8位的字节数据传送到目的寄存器中，同时将寄存器的高24位清零。 该指令通常用于从存储器中读取8位的字节数据到通用寄存器，然后对数据进行处理。当程序计数器PC作为目的寄存器时，指令从存储器中读取的字数据被当作目 的地址，从而可以实现程序流程的跳转。
  示例：
    LDRB R0，[R1]        ；将存储器地址为R1的字节数据读入寄存器R0，并将R0的高24位清零。
    LDRB R0，[R1，＃8]       ；将存储器地址为R1＋8的字节数据读入寄存器R0，并将R0的高24位清零。

3、LDRH指令
  格式：LDR{条件}H 目的寄存器，<存储器地址>
  解释：LDRH指令用于从存储器中将一个16位的半字数据传送到目的寄存器中，同时将寄存器的高16位清零。 该指令通常用于从存储器中读取16位的半字数据到通用寄存器，然后对数据进行处理。当程序计数器PC作为目的寄存器时，指令从存储器中读取的字数据被当作 目的地址，从而可以实现程序流程的跳转。
  示例：
    LDRH   R0，[R1]             ；将存储器地址为R1的半字数据读入寄存器 R0，并将R0的高16位清零。
    LDRH R0，[R1，＃8]     ；将存储器地址为R1＋8的半字数据读入寄存器R0，并将R0 的高16位清零。
    LDRH R0，[R1，R2]     ；将存储器地址为R1＋R2的半字数据读入寄存器R0，并将 R0的高16位清零。

4、STR指令
  格式：STR{条件} 源寄存器，<存储器地址>
  解释：STR指令用于从源寄存器中将一个32位的字数据传送到存储器中。 该指令在程序设计中比较常用，且寻址方式灵活多样，使用方式可参考指令LDR。
  示例：
    STR R0，[R1]，＃8           ；将R0中的字数据写入以R1为地址的存储器中，并将新地址R1＋8写入R1。
    STR R0，[R1，＃8]          ；将R0中的字数据写入以R1＋8为地址的存储器中。

5、STRB指令
  格式：STR{条件}B 源寄存器，<存储器地址>
  解释：STRB指令用于从源寄存器中将一个8位的字节数据传送到存储器中。该字节数据为源寄存器中的低8位。
  示例：
    STRB    R0，[R1]             ；将寄存器R0中的字节数据写入以R1为地 址的存储器中。
    STRB    R0，[R1，＃8]     ；将寄存器R0中的字节数据写入以R1＋8为地址的存 储器中。

6、STRH指令
  格式：STR{条件}H 源寄存器，<存储器地址>
  解释：STRH指令用于从源寄存器中将一个16位的半字数据传送到存储器中。该半字数据为源寄存器中的低16位。
  示例：
    STRH   R0，[R1]            ；将寄存器R0中的半字数据写入以R1为地址的 存储器中。
    STRH   R0，[R1，＃8]    ；将寄存器R0中的半字数据写入以R1＋8 为地址的存储器中。

7、ADR指令
  格式：ADR{cond}{.W}  Rd,label
  解释：将一个立即值与 pc 值相加，并将结果写入目标寄存器

8、ADRP指令
  格式：ADRP{cond}  Rd  label
  解释：以页为单位的大范围的地址读取指令，这里的P就是page的意思。取得page的基地址存入寄存器
  示例：
    adrp    x2, .LANCHOR0           ；.LANCHOR0是个——一个大小为4KB的页的基址，指令的作用就是将该页的基址存到寄存器x2中
  示例2：
    adrp    x0, l_.str@PAGE         ；将符号l.str所在的page基址读入x0
    add     x0, x0, l_.str@PAGEOFF  ；x0 = x0 + l.str所在page中的偏移量

批量数据加载/存储指令
  ARM微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据，批量加载指令 用于将一片连续的存储器中的数据传送到多个寄存器，批量数据存储指令则完成相反的操作。
常用的加载存储指令如下：

7、LDM（或STM）指令（加载、存储多个寄存器）
  格式：LDM（或STM）{条件}{类型} 基址寄存器{！}，寄存器列表{∧}
  解释：LDM（或STM）指令用于从由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据，该指令的常见用途是将多个寄存器的内容入栈或出栈。其中：
          {类型}为 以下几种情况：
            IA    每次传送后地址加1；
            IB      每次传送前地址加1；
            DA   每次传送后地址减1；
            DB   每次传送前地址减1；
            FD   满递减堆栈；
            ED   空递减堆栈；
            FA   满递增堆栈；
            EA   空递增堆栈；
          {！}为可选后缀，若选用该后缀，则当数据 传送完毕之后，将最后的地址写入基址寄存器，否则基址寄存器的内容不改变。
          基址寄存器不允许为R15，寄存器列表可以为R0～R15的任意组合。
          {∧}为可选后缀，当指令为LDM且寄存器列表中包含R15，选用该后缀时表示：除了正常的数据传送之外，还将SPSR复制到CPSR。同时，该后缀还表 示传入或传出的是用户模式下的寄存器，而不是当前模式下的寄存器。
  示例：
    STMFD R13!，{R0，R4-R12，LR}        ；将寄存器列表中的寄存器（R0，R4到R12，LR）存入堆栈。
    LDMFD R13!， {R0，R4-R12，PC}       ；将堆栈内容恢复到寄存器（R0，R4到R12，LR）。

数据交换指令（在寄存器和内存之间交换数据）
   SWP{B}：B是一个可选的后缀。如果存在 B，则交换一个字节。否则，交换一 个32位字。
8、SWP指令
  格式：SWP{条件} 目的寄存器，源寄存器1，[源寄存器2]
  解释：SWP指令用于将源寄存器2所指向的存储器中的字数据传送到目的寄存器中，同时将源寄存器1中的字数据传送到源寄存器2所指向的存储器中。显然，当源寄存 器1和目的寄存器为同一个寄存器时，指令交换该寄存器和存储器的内容。
  示例：
    SWP   R0，R1，[R2]     ；将R2所指向的存储器中的字数据传送到R0，同时将R1 中的字数据传送到R2所指向的存储单元。
    SWP   R0，R0，[R1]     ；该指令完成将R1所指向的存储器中的字数 据与R0中的数据交换。

9、SWPB指令
  格式：SWP{条件}B 目的寄存器，源寄存器1，[源寄存器2]
  解释：SWPB指令用于将源寄存器2所指向的存储器中的字节数据传送到目的寄存器中，目的寄存器的高24清零，同时将源寄存 器1中的字节数据传送到源寄存器2所指向的存储器中。显然，当源寄存器1和目的寄存器为同一个寄存器时，指令交换该寄存器和存储器的内容。
  示例：
    SWPB   R0，R1，[R2]       ；将R2所指向的存储器中的字节数据传送到 R0，R0的高24位清零，同时将R1中的低8位数据传送到R2所指向的存储单元。
    SWPB   R0，R0，[R1]      ；该指令完成将R1所指向的存储器中的 字节数据与R0中的低8位数据交换。

五、协处理器指令

此类指令支持一种用于扩展 ARM 体系结构的通用方式。

ARM 微处理器可支持多达 16 个协处理器，用于各种协处理操作，在程序执行的过程中，每个协处理器只执行针对自身的协处理指令，忽略 ARM 处理器和其他协处理器的指令。

ARM 的协处理器指令主要用于 ARM 处理器初始化 ARM 协处理器的数据处理操作，以及在ARM 处理器的寄存器和协处理器的寄存器之间传送数据，和在 ARM 协处理器的寄存器和存储器之间传送数据。

1、CDP指令
  格式：CDP{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存器2，协处理器操作码2。
  解释：CDP指令用于ARM处理器通知ARM协处理器执行特定的操作，若协处理器不能成功完成特定的操作，则产生未定义指令异常。其中协处理器操作码1和协处理 器操作码2为协处理器将要执行的操作，目的寄存器和源寄存器均为协处理器的寄存器，指令不涉及ARM处理器的寄存器和存储器。
  示例：
    CDP   P3，2，C12，C10，C3，4   ；该指令完成协处理器P3的初始化 

2、LDC指令
  格式：LDC{条件}{L} 协处理器编码，目的寄存器，[源寄存器]
  解释：LDC指令用于将源寄存器所指向的存储器中的字数据传送到目的寄存器中，若协处理器不能成功完成传送操作，则产生未定义指令异常。其中，{L}选项表示指 令为长读取操作，如用于双精度数据的传输。
  示例：
    LDC   P3，C4，[R0]        ；将ARM处理器的寄存器R0所指向的存储器中的字数 据传送到协处理器P3的寄存器C4中。 

3、STC指令
  格式：STC{条件}{L} 协处理器编码，源寄存器，[目的寄存器]
  解释：STC指令用于将源寄存器中的字数据传送到目的寄存器所指向的存储器中，若协处理器不能成功完成传送操作，则产生未定义指令异常。其中，{L}选项表示指 令为长读取操作，如用于双精度数据的传输。
  示例：
    STC   P3，C4，[R0]     ；将协处理器P3的寄存器C4中的字数据传送到ARM处理 器的寄存器R0所指向的存储器中。 

4、MCR指令
  格式：MCR{条件} 协处理器编码，协处理器操作码1，源寄存器，目的寄存器1，目的寄存器2，协处理器操作码2。
  解释：MCR指令用于将ARM处理器寄存器中的数据传送到协处理器寄存器中,若协处理器不能成功完成操作，则产生未定义指令异常。其中协处理器操作码1和协处理 器操作码2为协处理器将要执行的操作，源寄存器为ARM处理器的寄存器，目的寄存器1和目的寄存器2均为协处理器的寄 存器。
  示例：
    MCR   P3，3，R0，C4，C5，6     ；将ARM处理器寄存器R0中的数据传送到协处 理器P3的寄存器C4和C5中。 

5、MRC指令
  格式：MRC{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存器2，协处理器操作码2。
  解释：MRC指令用于将协处理器寄存器中的数据传送到ARM处理器寄存器中,若协处理器不能成功完成操作，则产生未定义指令异常。其中协处理器操作码1和协处理 器操作码2为协处理器将要执行的操作，目的寄存器为ARM处理器的寄存器，源寄存器1和源寄存器2均为协处理器的寄存器。
  示例：
    MRC   P3，3，R0，C4，C5，6     ；该指令将协处理器P3的寄存器中的数据传送到 ARM处理器寄存器中。

六、异常产生指令

ARM指令集中提供了两条产生异常的指令，通过这两条指令可以用软件的方法实现异常

1、SWI指令
  格式：SWI{条件} 24位的立即数
  解释：SWI指令用于产生软件中断，以便用户程序能调用操作系统的系统例程。操作系统在SWI的异常处理程序中提供相应的系统服务，指令中24位的立即数指定用 户程序调用系统例程的类型，相关参数通过通用寄存器传递，当指令中24位的立即数被忽略时，用户程序调用系统例程的类型由通用寄存器R0的内容决定，同 时，参数通过其他通用寄存器传递。 
  示例：
    SWI   0x02                ；该指令调用操作系统编号位02的系统例程。

2、BKPT指令
  格式：BKPT   16位的立即数
  解释：BKPT指令产生软件断点中断，可用于程序的调试。

ARM汇编伪指令

在ARM汇编语言程序里，有一些特殊指令助记符，这些助记符与指令系统的助记符不同，没有相对应的操作码，通常称这些特殊指令助记符为伪指令，他们所完成的操作称为伪操作。

伪指令在源程序中的作用是为完成汇编程序作各种准备工作的，这些伪指令仅在汇编过程中起作用，一旦汇编结束，伪指令的使命就完成。

在ARM 的汇编程序中，有如下几种伪指令：符号定义伪指令、数据定义伪指令、汇编控制伪指令(包括宏指令)、以及其他伪指令。

一、符号定义（Symbol Definition）伪指令

符号定义伪指令用于定义ARM 汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。
常见的符号定义伪指令有如下几种：

用于定义全局变量的GBLA 、GBLL 和GBLS 。
用于定义局部变量的LCLA 、LCLL 和LCLS 。
用于对变量赋值的SETA 、SETL 、SETS 。
为通用寄存器列表定义名称的RLIST 。

1、GBLA、GBLL 和GBLS    
  语法格式：    
      GBLA （GBLL 或GBLS ）全局变量名    
      GBLA 、GBLL 和GBLS 伪指令用于定义一个ARM 程序中的全局变量，并将其初始化。其中：    
      GBLA 伪指令用于定义一个全局的数字变量，并初始化为0 ；    
      GBLL 伪指令用于定义一个全局的逻辑变量，并初始化为F（假）；    
      GBLS 伪指令用于定义一个全局的字符串变量，并初始化为空；    
      由于以上三条伪指令用于定义全局变量，因此在整个程序范围内变量名必须唯一。    

  使用示例：    
      GBLA Test1 ；            定义一个全局的数字变量，变量名为 Test1。    
      Test1 SETA 0xaa ；       将该变量赋值为0xaa。    
      GBLL Test2 ；            定义一个全局的逻辑变量，变量名为 Test2。    
      Test2 SETL {TRUE} ；     将该变量赋值为真。    
      GBLS Test3 ；            定义一个全局的字符串变量，变量名为 Test3。    
      Test3 SETS “Testing” ；  将该变量赋值为"Testing”。  

2、LCLA、LCLL 和LCLS    
  语法格式：    
      LCLA （LCLL 或 LCLS ）局部变量名    
      LCLA 、LCLL 和LCLS 伪指令用于定义一个ARM 程序中的局部变量，并将其初始化。其中：    
      LCLA伪指令用于定义一个局部的数字变量，并初始化为0 ；    
      LCLL伪指令用于定义一个局部的逻辑变量，并初始化为F（假）；    
      LCLS伪指令用于定义一个局部的字符串变量，并初始化为空；    
      以上三条伪指令用于声明局部变量，在其作用范围内变量名必须唯一。    

  使用示例：    
      LCLA Test4 ；            声明一个局部的数字变 量，变量名为Test4。  
      Test3 SETA 0xaa ；       将该变量赋值为0xaa。   
      LCLL Test5 ；            声明一个局部的逻辑变 量，变量名为Test5。    
      Test4 SETL {TRUE} ；     将该变量赋值为真。    
      LCLS Test6 ；            定义一个局部的字 符串变量，变量名为Test6。    
      Test6 SETS “Testing” ；  将该变量赋值为 "Testing”。   

3、SETA、SETL 和SETS    
  语法格式：    
      变量名 SETA （SETL 或 SETS ）表达式    
      伪指令 SETA 、SETL 、SETS 用于给一个已经定义的全局变量或局部变量赋值。    
      SETA伪指令用于给一个数学变量赋值；    
      SETL伪指令用于给一个逻辑变量赋值；    
      SETS伪指令用于给一个字符串变量赋值；    
      其中，变量名为已经定义过的全局变量或局部变量，表达式为将要赋给变量的值。    

  使用示例：    
      LCLA Test3 ；             声明一个局部的数字变量，变量名为 Test3。    
      Test3 SETA 0xaa ；        将该变量赋值为0xaa。    
      LCLL Test4 ；             声明一个局部的逻辑变量，变量名为 Test4。    
      Test4 SETL {TRUE} ；      将该变量赋值为真。   

4 、RLIST    
  语法格式：    
      名称 RLIST { 寄存器列表 }    
      RLIST伪指令可用于对一个通用寄存器列表定义名称，使用该伪指令定义的名称可在ARM 指令 LDM/STM中使用。在LDM/STM指令中，列表中的寄存器访问次序为根据寄存器的编号由低到高，而与列表中的寄存器排列次序无关。    

  使用示例：    
      RegList RLIST {R0-R5 ，R8 ，R10} ；将寄存器列表名称定义为 RegList ，可在ARM指令LDM/STM中通过该名称访问寄存器列表。

二、数据定义（Data Definition）伪指令

数据定义伪指令一般用于为特定的数据分配存储单元，同时可完成已分配存储单元的初始化。
常见的数据定义伪指令有如下几种：

DCB：用于分配一片连续的字节存储单元并用指定的数据初始化。
DCW(DCWU)：用于分配一片连续的半字存储单元并用指定的数据初始化。
DCD(DCDU)：用于分配一片连续的字存储单元并用指定的数据初始化。
DCFD(DCFDU)：用于为双精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
DCFS(DCFSU)：用于为单精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
DCQ(DCQU)：用于分配一片以8字节为单位的连续的存储单元并用指定的数据初始化。
SPACE：用于分配一片连续的存储单元。
MAP：用于定义一个结构化的内存表首地址。
FIELD：用于定义一个结构化的内存表的数据域。

1、DCB    
    语法格式：    
    标号 DCB 表达式    
    DCB伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。其中，表达式可以为0～255的数字或字符串。DCB 也可用“=”代替。    
    使用示例：    
    Str DCB “This is a test” ；分配一片连续的字节存储单元并初始化。 
   
2、DCW（或DCWU）    
    语法格式： 
    标号 DCW (或DCWU) 表达式    
    DCW(或DCWU)伪指令用于分配一片连续的半字存储单元并用伪指令中指定的表达式初始化。    
    其中，表达式可以为程序标号或数字表达式。  
    用DCW分配的字存储单元是半字对齐的，而用DCWU分配的字存储单元并不严格半字对齐。    
    使用示例：    
    DataTest DCW 1 ，2 ，3 ；分配一片连续的半字存储单元并初始化。    

3、DCD（或DCDU）    
    语法格式：    
    标号 DCD（或DCDU） 表达式    
    DCD（或DCDU）伪指令用于分配一片连续的字存储单元并用伪指令中指定的表达式初始化。其中，表达式可以为程序标号或数字表达式。DCD也可 用"&” 代替。    
    用DCD分配的字存储单元是字对齐的，而用DCDU分配的字存储单元并不严格字对齐。    
    使用示例：    
    DataTest DCD 4 ，5 ，6 ；分配一片连续的字存储单元并初始化。 
   
4、DCFD（或DCFDU）    
    语法格式：    
    标号 DCFD（或DCFDU） 表达式    
    DCFD（或DCFDU）伪指令用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。每个双精度的浮点数占据两个字单元。用 DCFD分配的字存储单元是字对齐的，而用DCFDU分配的字存储单元并不严格字对齐。    
    使用示例：       FDataTest DCFD 2E115 ，-5E7 ；分配一片连续的字存储单元并初始化 为指定的双精度数。    

5、DCFS（或DCFSU）    
    语法格式：    
    标号 DCFS（或DCFSU） 表达式    
    DCFS（或DCFSU）伪指令用于为单精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。每个单精度的浮点数占据一个字单元。用 DCFS分配的字存储单元是字对齐的，而用DCFSU分配的字存储单元并不严格字对齐。    
    使用示例：    
    FDataTest DCFS 2E5 ，-5E －7 ；分配一片连续的字存储单元并初始化为 指定的单精度数。    

6、DCQ(或DCQU）    
    语法格式：    
    标号 DCQ（或DCQU） 表达式    
    DCQ（或DCQU）伪指令用于分配一片以8个字节(双字)为单位的连续存储区域并用伪指令中指定的表达式 初始化。 用DCQ分配的存储单元是字对齐的，而用DCQU 分配的存储单元并不严格字对齐。    
    使用示例：    
    DataTest DCQ 100 ；分配一片连续的存储单元并初始化为指定的值。 
   
7、SPACE    
    语法格式：    
    标号 SPACE 表达式    
    SPACE伪指令用于分配一片连续的存储区域并初始化为0 。其中，表达式为要分配的字节数。    
    SPACE也可用“ ％ ”代替。    
    使用示例：    
    DataSpace SPACE 100 ；分配连续100字节的存储单元并初始化为0 。    

8、MAP    
    语法格式：    
    MAP 表达式 { ，基址寄存器 }    
    MAP伪指令用于定义一个结构化的内存表的首地址。MAP也可用“＾” 代替。    
    表达式可以为程序中的标号或数学表达式，基址寄存器为可选项，当基址寄存器选项不存在时，表达式的值即为内存表的首地址，当该选项存在时，内存表的首地址 为表达式的值与基址寄存器的和。    
    MAP伪指令通常与FIELD伪指令配合使用来定义结构化的内存表。    
    使用示例：    
    MAP 0x100 ，R0 ；定义结构化内存表首地址的值为0x100＋R0 。 
   
9、FILED    
    语法格式：    
    标号 FIELD 表达式    
    FIELD伪指令用于定义一个结构化内存表中的数据域。FILED 也可用“#” 代替。    
    表达式的值为当前数据域在内存表中所占的字节数。    
    FIELD伪指令常与MAP伪指令配合使用来定义结构化的内存表。MAP伪指令定义内存表的首地址，FIELD伪指令定义内存表中的各个数据域，并可以为 每个数据域指定一个标号供其他的指令引用。    
    注意MAP和FIELD伪指令仅用于定义数据结构，并不实际分配存储单元。    
    使用示例：    
    MAP 0x100 ； 定义结构化内存表首地址的值为0x100。    
    A FIELD 16 ； 定义A的长度为16字节，位置为0x100。    
    B FIELD 32 ； 定义B的长度为32字节，位置为0x110。    
    S FIELD 256 ；定义S的长度为256字节，位置为0x130。

三、汇编控制（Assembly Control）伪指令

汇编控制伪指令用于控制汇编程序的执行流程，常用的汇编控制伪指令包括以下几条：

1、IF、ELSE、ENDIF    
语法格式：    
    IF 逻辑表达式    
    指令序列 1    
    ELSE    
    指令序列 2    
    ENDIF    
    IF 、ELSE 、ENDIF伪指令能根据条件的成立与否决定是否执行某个指令序列。当IF后面的逻辑表达式为真，则执行指令序列1 ，否则执行指令序列2 。其中，ELSE及指令序列2可以没有，此时，当IF后面的逻辑表达式为真，则执行指令序列1 ，否则继续执行后面的指令。    
    IF 、ELSE 、ENDIF伪指令可以嵌套使用。    
    使用示例：    
    GBLL Test ；声明一个全局的逻辑变量，变量名为Test   
    IF Test = TRUE    
    指令序列 1    
    ELSE    
    指令序列 2    
    ENDIF    

2、WHILE、WEND    
语法格式：    
    WHILE 逻辑表达式    
    指令序列    
    WEND    
    WHILE 、WEND伪指令能根据条件的成立与否决定是否循环执行某个指令序列。当WHILE后面的逻辑表达式为真，则执行指令序列，该指令序列执行完毕后，再判断 逻辑表达式的值，若为真则继续执行，一直到逻辑表达式的值为假。    
    WHILE 、WEND伪指令可以嵌套使用。    

使用示例：    
    GBLA Counter ；   声明一个全局的数学变量，变量名为Counter    
    Counter SETA 3 ；由变量Counter 控制循环次数    
    ……    
    WHILE Counter < 10    
    指令序列    
    WEND    

3、MACRO、MEND    
语法格式：    
    $ 标号 宏名 $ 参数 1 ，$ 参数 2 ，……    
    指令序列    
    MEND   
    MACRO 、MEND伪指令可以将一段代码定义为一个整体，称为宏指令，然后就可以在程序中通过宏指令多次调用该段代码。其中，$标号在宏指令被展开时，标号会被替 换为用户定义的符号，宏指令可以使用一个或多个参数，当宏指令被展开时，这些参数被相应的值替换。    
    宏指令的使用方式和功能与子程序有些相似，子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。但在使用子程序结构时需要保护现场，从而增加了 系统的开销，因此，在代码较短且需要传递的参数较多时，可以使用宏指令代替子程序。    
    包含在MACRO和MEND之间的指令序列称为宏定义体，在宏定义体的第一行应声明宏的原型（包含宏名、所需的参数），然后就可以在汇编程序中通过宏名来 调用该指令序列。在源程序被编译时，汇编器将宏调用展开，用宏定义中的指令序列代替程序中的宏调用，并将实际参数的值传递给宏定义中的形式参数。   
    MACRO、MEND伪指令可以嵌套使用。   

4、MEXIT    
语法格式：    
    MEXIT    
    MEXIT用于从宏定义中跳转出去。

四、其他常用的伪指令

还有一些其他的伪指令，在汇编程序中经常会被使用，包括以下几条：

1、AREA    
语法格式：    
    AREA 段名 属性1 ，属性2 ，……    
    AREA伪指令用于定义一个代码段或数据段。其中，段名若以数字开头，则该段名需用“|”括起来，如：|1_test| 。    
    属性字段表示该代码段（或数据段）的相关属性，多个属性用逗号分隔。常用的属性如下：    
    — CODE 属性：用于定义代码段，默认为READONLY 。    
    — DATA 属性：用于定义数据段，默认为READWRITE 。    
    — READONLY 属性：指定本段为只读，代码段默认为READONLY 。    
    — READWRITE 属性：指定本段为可读可写，数据段的默认属性为READWRITE 。    
    — ALIGN 属性：使用方式为ALIGN表达式。在默认时，ELF（可执行连接文件）的代码段和数据段是按字对齐的，表达式的取值范围为0～31，相应的对齐方式为2 表达式次方。    
    — COMMON 属性：该属性定义一个通用的段，不包含任何的用户代码和数据。各源文件中同名的COMMON段共享同一段存储单元。 
    一个汇编语言程序至少要包含一个段，当程序太长时，也可以将程序分为多个代码段和数据段。    
    使用示例：    
AREA Init ，CODE ，READONLY ;   该伪指令定义了一个代码段，段 名为Init ，属性为只读。    

2、ALIGN    
 语法格式：    
    ALIGN { 表达式 { ，偏移量 }}    
    ALIGN伪指令可通过添加填充字节的方式，使当前位置满足一定的对齐方式。其中，表达式的值用于指定对齐方式，可能的取值为2的幂，如1 、2 、4 、8 、16 等。若未指定表达式，则将当前位置对齐到下一个字的位置。偏移量也为一个数字表达式，若使用该字段，则当前位置的对齐方式为：2的表达式次幂＋偏移 量。    
    使用示例：    
    AREA Init ，CODE ，READONLY ，ALIEN＝3 ；指定后面的指令为8 字节对齐。    
    指令序列    
    END    

3、CODE16、CODE32    
语法格式：    
    CODE16（或CODE32）    
    CODE16伪指令通知编译器，其后的指令序列为16位的Thumb指令。    
    CODE32伪指令通知编译器，其后的指令序列为32位的ARM指令。    
    若在汇编源程序中同时包含ARM指令和Thumb指令时，可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令，CODE32伪指令 通知编译器其后的指令序列为32位的ARM指令。因此，在使用ARM指令和Thumb指令混合编程的代码里，可用这两条伪指令进行切换，但注意他们只通知 编译器其后指令的类型，并不能对处理器进行状态的切换。    
    使用示例：    
    AREA Init ，CODE ，READONLY       ……    
    CODE32 ；                    通知编译器其后的指令为32位的 ARM指令    
    LDR R0 ，＝NEXT＋1 ；将跳转地址放入寄存器R0    
    BX R0 ；                         程序跳转到新的位置执行， 并将处理器切换到Thumb工作状态    
    ……    
    CODE16 ；                     通知编译器其后的指令为16位的 Thumb指令    
    NEXT LDR R3，＝0x3FF    
    ……   
    END ；

4、ENTRY    
语法格式：    
    ENTRY    
    ENTRY伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个ENTRY（也可以有多个，当有多个ENTRY时，程序的真正入口点由链 接器指定），但在一个源文件里最多只能有一个ENTRY（可以没有）。    
    使用示例：    
    AREA Init ，CODE ，READONLY    
    ENTRY ； 指定应用程序的入口点    
    ……    

5、END    
语法格式：    
    END    
    END伪指令用于通知编译器已经到了源程序的结尾。    
    使用示例：    
    AREA Init ，CODE ，READONLY    
    ……  
    END ；指定应用程序的结尾   

6、EQU    
语法格式：    
    名称 EQU 表达式 { ，类型 }    
    EQU伪指令用于为程序中的常量、标号等定义一个等效的字符名称，类似于C语言中的＃define 。其中EQU可用“*”代替。名称为EQU伪指令定义的字符名称，当表达式为32位的常量时，可以指定 表达式的数据类型，可以有以下三种类型：    
    CODE16 、CODE32 和DATA    
    使用示例：    
    Test EQU 50 ；                       定义标号Test 的值为50。    
    Addr EQU 0x55 ，CODE32 ； 定义Addr的值为0x55 ，且该处为32位的ARM指令。    

7、EXPORT（或GLOBAL）    
语法格式：    
    EXPORT 标号 {[WEAK]}    
    EXPORT伪指令用于在程序中声明一个全局的标号，该标号可在其他的文件中引用。EXPORT 可用GLOBAL代替。标号在程序中区分大小写，[WEAK] 选项声明其他的同名标号优先于该标号被引用。    
    使用示例：    
    AREA Init ，CODE ，READONLY    
    EXPORT Stest ；声明一个可全局引用的标号Stest   
    END    

8、IMPORT    
语法格式：    
    IMPORT 标号 {[WEAK]}    
    IMPORT伪指令用于通知编译器要使用的标号在其他的源文件中定义，但要在当前源文件中引用，而且无论当前源文件是否引用该标号，该标号均会被加入到当前源文件的符号表中。标 号在程序中区分大小写，[WEAK] 选项表示当所有的源文件都没有定义这样一个标号时，编译器也不给出错误信息，在多数情况下将该标号置为0 ，若该标号为B或BL指令引用，则将B或BL指令置为NOP操作。    
    使用示例：    
    AREA Init ，CODE ，READONLY    
    IMPORT Main ；通知编译器当前文件要引用标号Main，但Main在其他源文件中定 义。 
    END    

9、EXTERN    
语法格式：    
    EXTERN 标号 {[WEAK]}    
    EXTERN伪指令用于通知编译器要使用的标号在其他的源文件中定义，但要在当前源文件中引用，如果当前源文件实际并未引用该标号，该 标号就不会被加入到当前源文件的符号表中。标号在程序中区分大小写， [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时，编译器也不给出错误信息，在多数情况下将该标号置为0 ，若该标号为B或BL指令引用，则将B或BL指令置为NOP操作。    
    使用示例：    
    AREA Init ，CODE ，READONLY    
    EXTERN Main ；通知编译器当前文件要引用标号Main，但Main在其他源文件中定 义。   
    END    

10、GET（或INCLUDE）    
语法格式：    
    GET 文件名    
    GET伪指令用于将一个源文件包含到当前的源文件中，并将被包含的源文件在当前位置进行汇编处理。可 以使用INCLUDE代替GET。    
    汇编程序中常用的方法是在某源文件中定义一些宏指令，用EQU定义常量的符号名称，用MAP和FIELD定义结构化的数据类型，然后用GET伪指令将这个 源文件包含到其他的源文件中。使用方法与C 语言中的"include” 相似。    
    GET伪指令只能用于包含源文件，包含目标文件需要使用INCBIN伪指令    
    使用示例：    
    AREA Init ，CODE ，READONLY    
    GET a1.s ；        通知编译器当前源文件包含源文件a1.s    
    GET C：\a2.s ； 通知编译器当前源文件包含源文件C：\a2.s 
    END   

11、INCBIN    
 语法格式：    
    INCBIN 文件名    
    INCBIN伪指令用于将一个目标文件或数据文件包含到当前的源文件中，被包含的文件不作任何变动的存放在当前文件中，编译器从其后开始继续处理。    
    使用示例：    
    AREA Init ，CODE ，READONLY    
    INCBIN a1.dat ；     通知编译器当前源文件包含文件a1.dat    
    INCBIN C：\a2.txt ；通知编译器当前源文件包含文件C：\a2.txt  
    END    

12、RN    
语法格式：    
    名称 RN 表达式    
    RN伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。其中，名称为给寄存器定义的别名，表达式为寄存器的编码。  
    使用示例：    
    Temp RN R0 ；将R0定义一个别名Temp    

13、ROUT  
    语法格式：    
    {名称} ROUT    
    ROUT伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时，局部 变量的作用范围为所在的AREA，而使用ROUT后，局部变量的作为范围为当前ROUT和下一个ROUT之间。