伪指令
在ARM汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。
伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成了
。
在ARM的汇编程序中,有如下几种伪指令:
1. 符号定义伪指令
2. 数据定义伪指令
3. 汇编控制伪指令
4. 宏指令
5. 其他伪指令
1、符号定义伪指令
符号定义伪指令用于
定义
ARM汇编程序中的
变量
、
对变量赋值
以及
定义寄存器的别名
等操作。
常见的符号定义伪指令有如下几种:
(1) 定义全局变量的
GBLA
、
GBLL
和
GBLS
(2) 定义局部变量的
LCLA
、
LCLL
、
LCLS
(3) 对变量赋值的
SETA
、
SETL
、
SETS
(4) 为通用寄存器列表定义名称的
RLIST
>> GBLA/GBLL/GBLS
语法格式:
GBLA
(
GBLL
或
GBLS
) 全局变量名
GBLA、GBLL和GBLS伪指令用于定义一个ARM程序中的全局变量,并将其初始化。其中:
GBLA:
定义一个全局的数字变量,并初始化为0;
GBLL:
定义一个全局的逻辑变量,并初始化为F(假);
GBLS:
定义一个全局的字符串变量,并初始化为空;
(【注】以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。)
使用示例:
GBLA
Test1 ;定义全局的数字变量,变量名为Test1
Test1
SETA
0xaa ;将该变量赋值为0xaa
GBL
Test2 ;定义一个全局的逻辑变量,变量名为Test2
Test2
SETL
{TRUE} ;将该变量赋值为真
GBLS
Test3 ;定义一个全局的字符串变量,变量名为Test3
Test3
SETS
"Tesing" ;将该变量赋值为“Testing”
>> RLIST指令
语法格式:
名称
RLIST
{寄存器列表}
RLIST
伪指令用于对一个通用寄存器列表定义名称,使用该伪指令定义的列表名称可在ARM指令LDM/STM中使用。
在LDM/STM指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关
。
使用示例:
RegList RLIST {R0-R5, R8, R10} ;将寄存器列表名称定义为RegList,可在ARM指令LDM/STM中通过该名称访问寄存器列表。
2、数据定义伪指令
数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。常用的数据定义伪指令有如下几种:
DCB DCW DCD DCFD
DCFS DCQ SPACE MAP FIELD
>> DCB指令
语法格式:
标号
DCB
表达式
DCB
伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。
其中,表达式可以为0~255的数字或字符串。DCB也可用“
=
”代替。
使用示例:
Str DCB "This is a test!" :分配一片连续的字节存储单元并初始化
>> SPACE指令
语法格式:
标号
SPACE
表达式
SPACE
伪指令用于分配一片连续的字节存储区域并初始化为0。
其中,表达式为要分配的字节数。
SPACE
也可用“
%
”代替。
使用示例:
DataSpace
SPACE
100 ;分配连续的100字节的存储单元并初始化为0。
>> MAP指令
语法格式:
MAP
表达式{, 基址寄存器}
MAP
伪指令用于定义一个结构化的内存表的首地址。
MAP
也可用“
^
”代替。
表达式可以为程序中的标号或数字表达式,基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。
MAP
伪指令通常与
FIELD
伪指令配合使用来定义结构化的内存表。
使用示例:
MAP
0x00 R0 ;定义结构化内存表首地址的值为0x100 + R0。
>> FIELD指令
语法格式:
标号
FIELD
表达式
FIELD
伪指令用于定义一个结构化的内存表的数据域。
FIELD
也可用“
#
”代替。
表达式的值为当前数据域在内存表中所占的字节数。
FIELD
伪指令通常与
MAP
伪指令配合使用来定义结构化的内存表。
MAP
伪指令定义内存表的首地址,
FIELD
伪指令定义内存表中的各个数据域,并可以为每个数据域指定一个标号供其他的指令引用。
使用示例:
MAP
0x100 ;定义结构化内存表首地址的值为0x100 + R0。
A FIELD 16 ;定义A的长度为16字节,位置0x100
B FIELD 32 ;定义B的长度为32字节,位置0x110 (?)
S FIELD 256 ;定义S的长度为256字节,位置0x130
3、汇编控制伪指令
汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制程序伪指令包括以下几条:
IF ELSE ENDIF
WHILE WEND
WACRO WEND
MEXIT
>> IF指令
语法格式:
IF
逻辑表达式
指令序列1
ELSE
指令序列2
ENDIF
IF、ELSE、ENDIF伪指令能根据条件的成立与否决定是否执行某个指令序列。当IF后面的逻辑表达式为真,则执行指令序列1,否则执行指令序列2。其中,ELSE及指令序列2可以没有。IF、ELSE、ENDIF伪指令可以嵌套使用。
使用示例:
GBLL Test ;声明一个全局的逻辑变量,变量名为Test
……
IF Test = TRUE
指令序列1
ELSE
指令序列2
ENDIF
>> WHILE指令
语法格式:
WHILE
逻辑表达式
指令序列
WEND
WHILE、WEND伪指令能根据条件的成立与否决定是否循环执行某个指令序列。
当WHILE后面的逻辑表达式为真,则执行指令序列,该指令序列执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。
WHILE、WEND伪指令可以嵌套使用。
使用示例:
GBLA Counter ;声明一个全局的数学变量,变量名为Counter
Counter SETA 3 ;由变量Counter控制循环次数
……
WHILE Counter<10
WEND
4、其他伪指令
还有一些其他的伪指令,在汇编程序中经常会被使用,包括以下几条:
AREA
ALIGN
CODE16 、CODE32
ENTRY
END
EQU
EXPORT(或GLOBAL)
IMPORT
EXTERN
GET(或INCLUDE)
>> AREA指令
语法格式:
AREA
段名 属性1, 属性2, ……
AREA伪指令用于
定义一个代码段或数据段
。
其中,段名若以数字开头,则该段名需用“
|
”括起来,如
|
1_test
|
。
属性字段表示改代码段(或数据段)的相关属性,多个属性用逗号分隔。
常用的属性如下:
CODE属性 :用于定义代码段,默认为READONLY
DATA属性 :用于定义数据段,默认为READWRITE
READONLY属性 :指本段为只读,代码段默认为READONLY
READWRITE属性 :指定本段为可写,数据段的默认属性为READWRITE
>> ALIGN指令
ALIGN属性,使用方式为
ALIGN 表达式
在默认时,
ELF
(可执行连续文件)的代码段和数据段是
按字对齐
的。
一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分多个代码段和数据段。
使用示例:
AREA Init,CODE, READONLY ;该伪指令定义了一个代码段,段名为Init,属性为只读。
语法格式:
ALIGN
{表达式{, 偏移量}}
ALIGN伪指令可通过添加填充字节的方式,使当前位置满足一定的对齐方式
|
。
其中,表达式的值用于指定对齐方式,可能的取值为2的幂,如1,2,4,8,16等。若未指定表达式,则将当前位置对齐到下一个字的位置。
偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为:2的表达式次幂 + 偏移量。
使用示例:
AREA Init,CODE, READONLY, ALIEN = 3 ;指定后面的指令为8字节对齐
>> CODE16指令
语法格式:
CODE16
(或CODE32)
CODE16伪指令通知编译器,其后的指令序列为16位的Thumb指令。
CODE32伪指令通知编译器,其后的指令为32位的ARM指令。
因此,在使用ARM指令和Thumb指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通过
编译器
其后指令类型,并不对处理器进行状态的切换。
使用示例:
AREA Init, CODE, READONLY
……
CODE32 ;通知编译器其后的指令为32位的ARM指令
LDR R0, =NEXT + 1 ;将跳转地址放入寄存器R0
BX R0 ;程序跳转到新的位置执行,并将处理器切换到Thumb状态
……
CODE16 ;通知编译器其后的指令为16位的ARM指令Thumb
NEXT LDR R3, =0x3FF
……
END ;程序结束
>> ENTRY指令
语法格式
ENTRY
ENTRY伪指令用于指定汇编程序的入口点。
在一个完整的汇编程序中至少要有一个ENTRY( 也可以有多个,当有多个ENTRY时,程序的真正入口点由链接器指定),
但在一个源文件里最多只能有一个ENTRY(可以没有)。
使用示例:
AREA Init, CODE, READONLY
ENTRY ;指定应用程序的入口点
……
>> EQU指令
语法格式
名称 EQU 表达式{, 类型}
EQU伪指令用于程序中的常量、标号等定义一个等效的字符名称,类似于C语言中的
#define
。
其中EQU可用“
*
”代替。
使用示例:
Test EQU 50 ;定义标号Test的值为50
Addr EQU 0x55, CODE32 ;定义Addr的值为0x55,且该处为32位的ARM指令。
>> EXPORT指令
语法格式
EXPORT 标号
EXPORT伪指令用于程序中声明一个全局的标号,该标号可在其他的文件中引用。
EXPORT可用GLOBAL代替。
标号在程序中区分大小写。
使用示例:
AREA Init, CODE,READIONLY
EXOPORT Stest ;声明一个可全局引用的标号Stest
>> IMPORT指令
语法格式
IMPORT
标号
IMPORT
伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用。
标号在程序中区分大小写。
使用示例:
AREA Init, CODE,READIONLY
IMPORT Main ;通知编译器当前文件要引用标号Main,但Main在其他源文件中定义
>> END指令
语法格式
END
END伪指令用于通知编译器已经到达了源程序的结尾。
使用示例:
AREA Init, CODE,READIONLY
……
END ;指定应用程序的结尾