ARM汇编语言
ARM汇编语言源程序语句,一般由指令,伪操作,宏指令和伪指令作成.
ARM汇编语言的设计基础是汇编伪指令,汇编伪操作和宏指令.
伪操作,是ARM汇编语言程序里的一些特殊的指令助记符,其作用主要是为完成汇编程序做各种准备工作,在源程序运行汇编程序处理,而不是在计算机运行期间有机器执行.也就是说,这些伪操作只是汇编过程中起作用,一旦汇编结束,伪操作的使命也就随之消失.
宏指令,是一段独立的程序代码,可以插在程序中,它通过伪操作来定义,宏在被使用之前必须提前定义好,宏之间可以互相调用,也可自己递归调用.通过直接书写宏名来使用宏.并本具宏指令的格式输入输出参数.宏定义本身不产生代码,只是在调用它时把宏体插入到原程序中.宏与C语言中的子函数形参和实参的调用相似,调用宏时通过实际的指令来 代替宏体实现相关的一段代码,但宏的调用与子程序的调用有本质的区别,既宏并不会节省程序的空间,其优点是简化程序代码,提高程序的可读性以及宏内容可以同步修改.
伪操作,宏指令一般与编译程序有关,因此ARM汇编语言的伪操作,宏指令在不同的编译环境下有不同的编写形式和规则.
伪指令也是ARM汇编语言程序里的特殊助记符,也不在处理器运行期间由机器执行,他们在汇编时将被合适的机器指令代替成ARM或Thumb指令,从而实现真正的指令操作
目前常用的ARM编译环境有2种.
1. ADS/SDT IDE:ARM公司开发,使用了CodeWarrior公司的编译器.
2. 集成了GNU开发工具的IDE开发环境;它由GNU的汇编器as,交叉汇编器gcc和连接器id组成.
ADS编译环境下的ARM伪操作和宏指令,可参考北航出版社的<
这里主要讲述ARM GNU常用汇编语言
4 ARM GNU常用汇编语言介绍
4.1 ARM GNU常用汇编伪指令介绍
1. abort
.abort: 停止汇编
.align absexpr1,absexpr2:
以某种对齐方式,在未使用的存储区域填充值. 第一个值表示对齐方式,4, 8,16或32. 第二个表达式值表示填充的值.
2. if...else...endif
.if
.else
.endif: 支持条件预编译
3. include
.include "file": 包含指定的头文件, 可以把一个汇编常量定义放在头文件中
4. comm
.comm symbol, length:在bss段申请一段命名空间,该段空间的名称叫symbol, 长度为length. Ld连接器在连接会
为它留出空间.
5. data
.data subsection: 说明接下来的定义归属于subsection数据段.
6. equ
.equ symbol, expression: 把某一个符号(symbol)定义成某一个值(expression).该指令并不分配空间.
7. global
.global symbol: 定义一个全局符号, 通常是为ld使用.
8. ascii
.ascii "string": 定义一个字符串并为之分配空间.
9. byte
.byte expressions: 定义一个字节, 并为之分配空间.
10. short
.short expressions: 定义一个短整型, 并为之分配空间.
11. int
.int expressions: 定义一个整型,并为之分配空间.
12 long
.long expressions: 定义一个长整型, 并为之分配空间.
13 word
.word expressions: 定义一个字,并为之分配空间, 4bytes.
14. macro/endm
.macro: 定义一段宏代码, .macro表示代码的开始, .endm表示代码的结束.
15. req
name .req register name: 为寄存器定义一个别名.
16. code
.code [16|32]: 指定指令代码产生的长度, 16表示Thumb指令, 32表示ARM指令.
17. ltorg
.ltorg: 表示当前往下的定义在归于当前段,并为之分配空间.
4.2 ARM GNU专有符号
1. @
表示注释从当前位置到行尾的字符.
2. #
注释掉一整行.
3. ;
新行分隔符.
4.3 操作码
1. NOP
nop
空操作, 相当于MOV r0, r0
2. LDR
ldr
相当于PC寄存器或其它寄存器的长转移.
3.ADR
adr
相于PC寄存器或其它寄存器的小范围转移.
ADRL
adrl
相于PC寄存器或其寄存器的中范围转移.
5 可执行生成说明
5.1 lds文件说明
5.1.1 主要符号说明
1. OUTPUT_FORMAT(bfdname)
指定输出可执行文件格式.
2. OUTPUT_ARCH(bfdname)
指定输出可执行文件所运行CPU平台
3. ENTRY(symbol)
指定可执行文件的入口段
5.1.2 段定义说明
1. 段定义格式
SECTIONS
{ ...
段名 :
{
内容
}
...
}
GNU ARM 汇编快速入门
任何汇编行都是如下结构:
[
[<标签>:] [<指令>} @ 注释
GNU ARM 汇编中,任何以冒号结尾的都被认为是一个标签,而不一定非要在一行的开始。下面是一个简单的例子,这段汇编程序定义了一个"add"的函数,该函数返回两个参数的和:
.section .text, “x”
.global add @ give the symbol add external linkage
add:
ADD r0, r0, r1 @ add input arguments
MOV pc, lr @ return from subroutine
@ end of program
GNU ARM汇编伪指令
下面列出了一些GNU ARM汇编伪指令,并给出了相应说明。
.ascii “
.asciz “
.balign
以某种排列方式在内存中填充数值。 (该指令与armasm中的ALIGN类似)。
power_of_2表示排列方式,其值可为4,8,16或32,单位是byte;
fill_value是要填充的值;
max_padding最大的填充界限,请求填充的bytes数超过该值,将被忽略。
.byte
.code
(和armasm中的CODE16,CODE32相同)。
.if
.else
.endif
预编译宏(与armasm中的IF ELSE ENDIF相同)。
.end 汇编文件结束标志,常常省略不用。
.endm 宏结束标志。
.exitm 宏跳出。
.macro
定义一段名为name的宏,arg_xxx为参数。
必须有对应的.endm结尾。
可以使用.exitm从中间跳出宏。(与armasm中的MACRO, MEND, MEXIT相同)。
在使用宏参数时必须这样使用:“\
例如:
[CODE].macro SHIFTLEFT a, b
.if \b < 0
MOV \a, \a, ASR #-\b
.exitm
.endif
MOV \a, \a, LSL #\b
.endm
.rept
(与armasm中的WEN相似)
.irp {,
循环执行.endr前的代码段,param依次取后面给出的值。
在循环执行的代码段中必须以“\ ”表示参数。
.endr 结束循环(与armasm中的WEND相似).
.equ
.err 编译错误报告,将引起编译的终止。
.global
.hword
插入一个16-bit的数据队列。(与armasm中的DCW相同)
.ifdef
.ifndef
.include “
定义一个寄存器,.req的左边是定义的寄存器名,右边是使用的真正使用的寄存器。
(与armasm中的RN类似)
例如:acc .req r0
[CODE].section
开始一个新的代码或数据段。.text, 代码段;.data, 初始化数据段;.bss, 未初始化数据段。
这些段都有缺省的标志(flags),联接器可以识别这些标志。(与armasm中的AREA相同)。
下面是ELF格式允许的段标志
<标志> 含义
a 允许段
w 可写段
x 执行段
.set
.space
分配number_of_bytes字节的数据空间,并填充其值为fill_byte,若未指定该值,缺省填充0。
(与armasm中的SPACE功能相同)
.word
插入一个32-bit的数据队列。(与armasm中的DCD功能相同)
GNU ARM汇编特殊字符和语法
代码行中的注释符号: ‘@’
整行注释符号: ‘#’
语句分离符号: ‘;’
直接操作数前缀: ‘#’ 或 ‘$’
.arm 以arm格式编译,同code32
.thumb 以thumb格式编译,同code16
.code16 以thumb格式编译
.code32 以arm格式编译
篇后语:
更详细的使用说明请参照:ARM Architecture Reference Manual, Addison-Wesley ISBN 0-201-73719-1