ARM程序设计基础 1
1 ARM汇编器所支持的伪指令 1
2 ARM汇编器所支持的伪指令 10
3 汇编语言的语句格式 16
4 汇编语言的程序结构 19
ARM编译器一般都支持汇编语言的程序设计和C/C++语言的程序设计,以及两者的混合编程。本章介绍ARM程序设计的一些基本概念,如ARM汇编语言的伪指令、汇编语言的语句格式和汇编语言的程序结构等,同时介绍C/C++和汇编语言的混合编程等问题。
本章的主要内容:
- ARM编译器所支持的伪指令
- 汇编语言的语句格式
- 汇编语言的程序结构
- 相关的程序示例
在ARM汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。
在ARM的汇编程序中,有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令以及其他伪指令。
符号定义伪指令用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。常见的符号定义伪指令有如下几种:
— 用于定义全局变量的GBLA、GBLL和GBLS。
— 用于定义局部变量的LCLA、LCLL和LCLS。
— 用于对变量赋值的SETA、SETL、SETS。
— 为通用寄存器列表定义名称的RLIST。
1、 GBLA、GBLL和GBLS
语法格式:
GBLA(GBLL或GBLS) 全局变量名
GBLA、GBLL和GBLS伪指令用于定义一个ARM程序中的全局变量,并将其初始化。其中:
GBLA伪指令用于定义一个全局的数字变量,并初始化为0;
GBLL伪指令用于定义一个全局的逻辑变量,并初始化为F(假);
GBLS伪指令用于定义一个全局的字符串变量,并初始化为空;
由于以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。
使用示例:
GBLA Test1 ;定义一个全局的数字变量,变量名为Test1
Test1 SETA 0xaa ;将该变量赋值为0xaa
GBLL Test2 ;定义一个全局的逻辑变量,变量名为Test2
Test2 SETL {TRUE} ;将该变量赋值为真
GBLS Test3 ;定义一个全局的字符串变量,变量名为Test3
Test3 SETS “Testing” ;将该变量赋值为“Testing”
2、 LCLA、LCLL和LCLS
语法格式:
LCLA(LCLL或LCLS) 局部变量名
LCLA、LCLL和LCLS伪指令用于定义一个ARM程序中的局部变量,并将其初始化。其中:
LCLA伪指令用于定义一个局部的数字变量,并初始化为0;
LCLL伪指令用于定义一个局部的逻辑变量,并初始化为F(假);
LCLS伪指令用于定义一个局部的字符串变量,并初始化为空;
以上三条伪指令用于声明局部变量,在其作用范围内变量名必须唯一。
使用示例:
LCLA Test4 ;声明一个局部的数字变量,变量名为Test4
Test3 SETA 0xaa ;将该变量赋值为0xaa
LCLL Test5 ;声明一个局部的逻辑变量,变量名为Test5
Test4 SETL {TRUE} ;将该变量赋值为真
LCLS Test6 ;定义一个局部的字符串变量,变量名为Test6
Test6 SETS “Testing” ;将该变量赋值为“Testing”
3、 SETA、SETL和SETS
语法格式:
变量名 SETA(SETL或SETS) 表达式
伪指令SETA、SETL、SETS用于给一个已经定义的全局变量或局部变量赋值。
SETA伪指令用于给一个数学变量赋值;
SETL伪指令用于给一个逻辑变量赋值;
SETS伪指令用于给一个字符串变量赋值;
其中,变量名为已经定义过的全局变量或局部变量,表达式为将要赋给变量的值。
使用示例:
LCLA Test3 ;声明一个局部的数字变量,变量名为Test3
Test3 SETA 0xaa ;将该变量赋值为0xaa
LCLL Test4 ;声明一个局部的逻辑变量,变量名为Test4
Test4 SETL {TRUE} ;将该变量赋值为真
4、RLIST
语法格式:
名称 RLIST {寄存器列表}
RLIST伪指令可用于对一个通用寄存器列表定义名称,使用该伪指令定义的名称可在ARM指令LDM/STM中使用。在LDM/STM指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。
使用示例:
RegList RLIST {R0-R5,R8,R10} ;将寄存器列表名称定义为RegList,可在ARM指令LDM/STM中通过该名称访问寄存器列表。
数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。常见的数据定义伪指令有如下几种:
— DCB 用于分配一片连续的字节存储单元并用指定的数据初始化。
— DCW(DCWU) 用于分配一片连续的半字存储单元并用指定的数据初始化。
— DCD(DCDU) 用于分配一片连续的字存储单元并用指定的数据初始化。
— DCFD(DCFDU)用于为双精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
— DCFS(DCFSU) 用于为单精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
— DCQ(DCQU) 用于分配一片以8字节为单位的连续的存储单元并用指定的数据初始化。
— SPACE 用于分配一片连续的存储单元
— MAP 用于定义一个结构化的内存表首地址
— FIELD 用于定义一个结构化的内存表的数据域
1、 DCB
语法格式:
标号 DCB 表达式
DCB伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。其中,表达式可以为0~255的数字或字符串。DCB也可用“=”代替。
使用示例:
Str DCB “This is a test!” ;分配一片连续的字节存储单元并初始化。
2、 DCW(或DCWU)
语法格式:
标号 DCW(或DCWU) 表达式
DCW(或DCWU)伪指令用于分配一片连续的半字存储单元并用伪指令中指定的表达式初始化。其中,表达式可以为程序标号或数字表达式。。
用DCW分配的字存储单元是半字对齐的,而用DCWU分配的字存储单元并不严格半字对齐。
使用示例:
DataTest DCW 1,2,3 ;分配一片连续的半字存储单元并初始化。
3、 DCD(或DCDU)
语法格式:
标号 DCD(或DCDU) 表达式
DCD(或DCDU)伪指令用于分配一片连续的字存储单元并用伪指令中指定的表达式初始化。其中,表达式可以为程序标号或数字表达式。DCD也可用“&”代替。
用DCD分配的字存储单元是字对齐的,而用DCDU分配的字存储单元并不严格字对齐。
使用示例:
DataTest DCD 4,5,6 ;分配一片连续的字存储单元并初始化。
4、 DCFD(或DCFDU)
语法格式:
标号 DCFD(或DCFDU) 表达式
DCFD(或DCFDU)伪指令用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。每个双精度的浮点数占据两个字单元。
用DCFD分配的字存储单元是字对齐的,而用DCFDU分配的字存储单元并不严格字对齐。
使用示例:
FDataTest DCFD 2E115,-5E7 ;分配一片连续的字存储单元并初始化为指定的双精度数。
5、 DCFS(或DCFSU)
语法格式:
标号 DCFS(或DCFSU) 表达式
DCFS(或DCFSU)伪指令用于为单精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。每个单精度的浮点数占据一个字单元。
用DCFS分配的字存储单元是字对齐的,而用DCFSU分配的字存储单元并不严格字对齐。
使用示例:
FDataTest DCFS 2E5,-5E-7 ;分配一片连续的字存储单元并初始化为指定的单精度数。
6、 DCQ(或DCQU)
语法格式:
标号 DCQ(或DCQU) 表达式
DCQ(或DCQU)伪指令用于分配一片以8个字节为单位的连续存储区域并用伪指令中指定的表达式初始化。
用DCQ分配的存储单元是字对齐的,而用DCQU分配的存储单元并不严格字对齐。
使用示例:
DataTest DCQ 100 ;分配一片连续的存储单元并初始化为指定的值。
7、 SPACE
语法格式:
标号 SPACE 表达式
SPACE伪指令用于分配一片连续的存储区域并初始化为0。其中,表达式为要分配的字节数。SPACE也可用“%”代替。
使用示例:
DataSpace SPACE 100 ;分配连续100字节的存储单元并初始化为0。
8、 MAP
语法格式:
MAP 表达式{,基址寄存器}
MAP伪指令用于定义一个结构化的内存表的首地址。MAP也可用“^”代替。
表达式可以为程序中的标号或数学表达式,基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。
MAP伪指令通常与FIELD伪指令配合使用来定义结构化的内存表。
使用示例:
MAP 0x100,R0 ;定义结构化内存表首地址的值为0x100+R0。
9、 FILED
语法格式:
标号 FIELD 表达式
FIELD伪指令用于定义一个结构化内存表中的数据域。FILED也可用“#”代替。
表达式的值为当前数据域在内存表中所占的字节数。
FIELD伪指令常与MAP伪指令配合使用来定义结构化的内存表。MAP伪指令定义内存表的首地址,FIELD伪指令定义内存表中的各个数据域,并可以为每个数据域指定一个标号供其他的指令引用。
注意MAP和FIELD伪指令仅用于定义数据结构,并不实际分配存储单元。
使用示例:
MAP 0x100 ;定义结构化内存表首地址的值为0x100。
A FIELD 16 ;定义A的长度为16字节,位置为0x100
B FIELD 32 ;定义B的长度为32字节,位置为0x110
S FIELD 256 ;定义S的长度为256字节,位置为0x130
汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制伪指令包括以下几条:
— IF、ELSE、ENDIF
— WHILE、WEND
— MACRO、MEND
— MEXIT
1、 IF、ELSE、ENDIF
语法格式:
IF 逻辑表达式
指令序列1
ELSE
指令序列2
ENDIF
IF、ELSE、ENDIF伪指令能根据条件的成立与否决定是否执行某个指令序列。当IF后面的逻辑表达式为真,则执行指令序列1,否则执行指令序列2。其中,ELSE及指令序列2可以没有,此时,当IF后面的逻辑表达式为真,则执行指令序列1,否则继续执行后面的指令。
IF、ELSE、ENDIF伪指令可以嵌套使用。
使用示例:
GBLL Test ;声明一个全局的逻辑变量,变量名为Test
……
IF Test =TRUE
指令序列1
ELSE
指令序列2
ENDIF
2、 WHILE、WEND
语法格式:
WHILE 逻辑表达式
指令序列
WEND
WHILE、WEND伪指令能根据条件的成立与否决定是否循环执行某个指令序列。当WHILE后面的逻辑表达式为真,则执行指令序列,该指令序列执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。
WHILE、WEND伪指令可以嵌套使用。
使用示例:
GBLA Counter ;声明一个全局的数学变量,变量名为Counter
Counter SETA 3 ;由变量Counter控制循环次数
……
WHILE Counter< 10
指令序列
WEND
3、 MACRO、MEND
语法格式:
$标号 宏名 $参数1,$参数2,……
指令序列
MEND
MACRO、MEND伪指令可以将一段代码定义为一个整体,称为宏指令,然后就可以在程序中通过宏指令多次调用该段代码。其中,$标号在宏指令被展开时,标号会被替换为用户定义的符号,
宏指令可以使用一个或多个参数,当宏指令被展开时,这些参数被相应的值替换。
宏指令的使用方式和功能与子程序有些相似,子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。但在使用子程序结构时需要保护现场,从而增加了系统的开销,因此,在代码较短且需要传递的参数较多时,可以使用宏指令代替子程序。
包含在MACRO和MEND之间的指令序列称为宏定义体,在宏定义体的第一行应声明宏的原型(包含宏名、所需的参数),然后就可以在汇编程序中通过宏名来调用该指令序列。在源程序被编译时,汇编器将宏调用展开,用宏定义中的指令序列代替程序中的宏调用,并将实际参数的值传递给宏定义中的形式参数。
MACRO、MEND伪指令可以嵌套使用。
4、 MEXIT
语法格式:
MEXIT
MEXIT用于从宏定义中跳转出去。
还有一些其他的伪指令,在汇编程序中经常会被使用,包括以下几条:
— AREA
— ALIGN
— CODE16、CODE32
— ENTRY
— END
— EQU
— EXPORT(或GLOBAL)
— IMPORT
— EXTERN
— GET(或INCLUDE)
— INCBIN
— RN
— ROUT
1、 AREA
语法格式:
AREA 段名 属性1,属性2,……
AREA伪指令用于定义一个代码段或数据段。其中,段名若以数字开头,则该段名需用“|”括起来,如|1_test|。
属性字段表示该代码段(或数据段)的相关属性,多个属性用逗号分隔。常用的属性如下:
— CODE属性:用于定义代码段,默认为READONLY。
— DATA属性:用于定义数据段,默认为READWRITE。
— READONLY属性:指定本段为只读,代码段默认为READONLY。
— READWRITE属性:指定本段为可读可写,数据段的默认属性为READWRITE。
— ALIGN属性:使用方式为ALIGN 表达式。在默认时,ELF(可执行连接文件)的代码段和数据段是按字对齐的,表达式的取值范围为0~31,相应的对齐方式为2表达式次方。
— COMMON属性:该属性定义一个通用的段,不包含任何的用户代码和数据。各源文件中同名的COMMON段共享同一段存储单元。
一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。
使用示例:
AREA Init,CODE,READONLY
指令序列
;该伪指令定义了一个代码段,段名为Init,属性为只读
2、 ALIGN
语法格式:
ALIGN {表达式{,偏移量}}
ALIGN伪指令可通过添加填充字节的方式,使当前位置满足一定的对其方式|。其中,表达式的值用于指定对齐方式,可能的取值为2的幂,如1、2、4、8、16等。若未指定表达式,则将当前位置对齐到下一个字的位置。偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为:2的表达式次幂+偏移量。
使用示例:
AREA Init,CODE,READONLY,ALIEN=3 ;指定后面的指令为8字节对齐。
指令序列
END
3、 CODE16、CODE32
语法格式:
CODE16(或CODE32)
CODE16伪指令通知编译器,其后的指令序列为16位的Thumb指令。
CODE32伪指令通知编译器,其后的指令序列为32位的ARM指令。
若在汇编源程序中同时包含ARM指令和Thumb指令时,可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令,CODE32伪指令通知编译器其后的指令序列为32位的ARM指令。因此,在使用ARM指令和Thumb指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通知编译器其后指令的类型,并不能对处理器进行状态的切换。
使用示例:
AREA Init,CODE,READONLY
……
CODE32 ;通知编译器其后的指令为32位的ARM指令
LDR R0,=NEXT+1 ;将跳转地址放入寄存器R0
BX R0 ;程序跳转到新的位置执行,并将处理器切换到Thumb工作状态
……
CODE16 ;通知编译器其后的指令为16位的Thumb指令
NEXT LDR R3,=0x3FF
……
END ;程序结束
4、 ENTRY
语法格式:
ENTRY
ENTRY伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个ENTRY(也可以有多个,当有多个ENTRY时,程序的真正入口点由链接器指定),但在一个源文件里最多只能有一个ENTRY(可以没有)。
使用示例:
AREA Init,CODE,READONLY
ENTRY ;指定应用程序的入口点
……
5、 END
语法格式:
END
END伪指令用于通知编译器已经到了源程序的结尾。
使用示例:
AREA Init,CODE,READONLY
……
END ;指定应用程序的结尾
6、 EQU
语法格式:
名称 EQU 表达式{,类型}
EQU伪指令用于为程序中的常量、标号等定义一个等效的字符名称,类似于C语言中的#define。其中EQU可用“*”代替。
名称为EQU伪指令定义的字符名称,当表达式为32位的常量时,可以指定表达式的数据类型,可以有以下三种类型:
CODE16、CODE32和DATA
使用示例:
Test EQU 50 ;定义标号Test的值为50
Addr EQU 0x55,CODE32 ;定义Addr的值为0x55,且该处为32位的ARM指令。
7、 EXPORT(或GLOBAL)
语法格式:
EXPORT 标号{[WEAK]}
EXPORT伪指令用于在程序中声明一个全局的标号,该标号可在其他的文件中引用。EXPORT可用GLOBAL代替。标号在程序中区分大小写,[WEAK]选项声明其他的同名标号优先于该标号被引用。
使用示例:
AREA Init,CODE,READONLY
EXPORT Stest ;声明一个可全局引用的标号Stest
……
END
8、 IMPORT
语法格式:
IMPORT 标号{[WEAK]}
IMPORT伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,而且无论当前源文件是否引用该标号,该标号均会被加入到当前源文件的符号表中。
标号在程序中区分大小写,[WEAK]选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为0,若该标号为B或BL指令引用,则将B或BL指令置为NOP操作。
使用示例:
AREA Init,CODE,READONLY
IMPORT Main ;通知编译器当前文件要引用标号Main,但Main在其他源文件中定义
……
END
9、 EXTERN
语法格式:
EXTERN 标号{[WEAK]}
EXTERN伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,如果当前源文件实际并未引用该标号,该标号就不会被加入到当前源文件的符号表中。
标号在程序中区分大小写,[WEAK]选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为0,若该标号为B或BL指令引用,则将B或BL指令置为NOP操作。
使用示例:
AREA Init,CODE,READONLY
EXTERN Main ;通知编译器当前文件要引用标号Main,但Main在其他源文件中定义
……
END
10、GET(或INCLUDE)
语法格式:
GET 文件名
GET伪指令用于将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置进行汇编处理。可以使用INCLUDE代替GET。
汇编程序中常用的方法是在某源文件中定义一些宏指令,用EQU定义常量的符号名称,用MAP和FIELD定义结构化的数据类型,然后用GET伪指令将这个源文件包含到其他的源文件中。使用方法与C语言中的“include”相似。
GET伪指令只能用于包含源文件,包含目标文件需要使用INCBIN伪指令
使用示例:
AREA Init,CODE,READONLY
GET a1.s ;通知编译器当前源文件包含源文件a1.s
GE T C:\a2.s ;通知编译器当前源文件包含源文件C:\ a2.s
……
END
11、INCBIN
语法格式:
INCBIN 文件名
INCBIN伪指令用于将一个目标文件或数据文件包含到当前的源文件中,被包含的文件不作任何变动的存放在当前文件中,编译器从其后开始继续处理。
使用示例:
AREA Init,CODE,READONLY
INCBIN a1.dat ;通知编译器当前源文件包含文件a1.dat
INCBIN C:\a2.txt ;通知编译器当前源文件包含文件C:\a2.txt
……
END
12、RN
语法格式:
名称 RN 表达式
RN伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。其中,名称为给寄存器定义的别名,表达式为寄存器的编码。
使用示例:
Temp RN R0 ;将R0定义一个别名Temp
13、ROUT
语法格式:
{名称} ROUT
ROUT伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时,局部变量的作用范围为所在的AREA,而使用ROUT后,局部变量的作为范围为当前ROUT和下一个ROUT之间。
ARM微处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器(PSR)处理指令、加载/存储指令、协处理器指令和异常产生指令六大类。
当处理器工作在ARM状态时,几乎所有的指令均根据CPSR中条件码的状态和指令的条件域有条件的执行。当指令的执行条件满足时,指令被执行,否则指令被忽略。
每一条ARM指令包含4位的条件码,位于指令的最高4位[31:28]。条件码共有16种,每种条件码可用两个字符表示,这两个字符可以添加在指令助记符的后面和指令同时使用。
n立即寻址
n寄存器寻址
n寄存器间接寻址
n基址变址寻址
n多寄存器寻址
n相对寻址
n堆栈寻址
1立即寻址
立即寻址也叫立即数寻址,这是一种特殊的寻址方式,操作数本身就在指令中给出,只要取出指令也就取到了操作数。这个操作数被称为立即数,对应的寻址方式也就叫做立即寻址。
ADDR0,R0,#1 ;R0←R0+1
ADDR0,R0,#0x3f ;R0←R0+0x3f
2寄存器寻址
寄存器寻址就是利用寄存器中的数值作为操作数,这种寻址方式是各类微处理器经常采用的一种方式,也是一种执行效率较高的寻址方式。
ADDR0,R1,R2 ;R0←R1+R2
3寄存器间接寻址
寄存器间接寻址就是以寄存器中的值作为操作数的地址,而操作数本身存放在存储器中。
ADDR0,R1,[R2] ;R0←R1+[R2]
LDRR0,[R1] ;R0←[R1]
STRR0,[R1] ;[R1]←R0
4基址变址寻址
基址变址寻址就是将寄存器(该寄存器一般称作基址寄存器)的内容与指令中给出的地址偏移量相加,从而得到一个操作数的有效地址。变址寻址方式常用于访问某基地址附近的地址单元。
LDR R0,[R1,#4] ;R0←[R1+4]
LDR R0,[R1,#4]! ;R0←[R1+4]、R1←R1+4
LDR R0,[R1] ,#4 ;R0←[R1]、R1←R1+4
LDR R0,[R1,R2] ;R0←[R1+R2]
5多寄存器寻址
采用多寄存器寻址方式,一条指令可以完成多个寄存器值的传送。这种寻址方式可以用一条指令完成传送最多16个通用寄存器的值。
LDMIA R0,{R1,R2,R3,R4}
;R1←[R0],R2←[R0+4],R3←[R0+8],R4←[R0+12]
该指令的后缀IA表示在每次执行完加载/存储操作后,R0按字长度增加,因此,指令可将连续存储单元的值传送到R1~R4。
6相对寻址
与基址变址寻址方式相类似,相对寻址以程序计数器PC的当前值为基地址,指令中的地址标号作为偏移量,将两者相加之后得到操作数的有效地址。以下程序段完成子程序的调用和返回,跳转指令BL采用了相对寻址方式:
BL NEXT ;跳转到子程序NEXT处执行
……
NEXT:
……
MOV PC,LR ;从子程序返回
7 堆栈寻址
操作顺序为“后进先出” 。堆栈寻址是隐含的,它使用一个专门的寄存器(堆栈指针)指向一块存储区域(堆栈),指针所指向的存储单元即是堆栈的栈顶。存储器堆栈可分为两种:
堆栈指针指向最后压入的堆栈的有效数据项,称为满堆栈;堆栈指针指向下一个待压入数据的空位置,称为空堆栈。
四种类型的堆栈方式:
8块拷贝寻址
多寄存器传送指令用于将一块数据从存储器的某一位置拷贝到另一位置。如:
STMIA R0!,{R1-R7} ;将R1~R7的数据保存到存储器中。
;存储指针在保存第一个值之后增加,
;增长方向为向上增长。
STMIB R0!,{R1-R7} ;将R1~R7的数据保存到存储器中。
;存储指针在保存第一个值之前增加,
;增长方向为向上增长。
注意:
1)IA:每次传送后地址加4
2)IB:每次传送前地址加4
3)DA:每次传送后地址减4
4)DB:每次传送前地址减4
5)FD:满递减堆栈
6)ED:空递减堆栈
7)FA:满递增堆栈
8)EA:空递增堆栈
R0!后缀“!”表示最后的地址回写到R0中。
LDMIAR0!,{R2—R3}执行过程分析:
当把R0指向的地址0xFF00中的数据加载到R2后,地址加4,变为0xFF04;接着把0xFF04中的数据加载到R3,地址变为0xFF08。最后把该地址回写到R0。
n跳转指令
n数据处理指令
n程序状态寄存器处理指令
n加载/存储指令
n协处理器指令
n异常产生指令
1跳转指令
n在ARM程序中实现程序流程的跳转有两种方法
v使用专门的跳转指令
v直接向程序计数器PC写入跳转地址值
nARM指令集中的跳转指令包括以下4条指令
vB 跳转指令
vBL 带返回的跳转指令
vBLX 带返回和状态切换的跳转指令
vBX 带状态切换的跳转指令
注意:一旦遇到一个B指令,ARM 处理器将立即跳转到给定的目标地址执行。存储在跳转指令中的实际值是相对当前PC值的一个偏移量,由汇编器来计算。
BL 带返回的跳转指令
跳转之前,会在寄存器R14中保存PC的当前内容,因此,可以通过将R14 的内容重新加载到PC中,来返回到跳转指令之后的那个指令处执行。该指令是实现子程序调用的一个基本手段。
2数据处理指令
n数据处理指令可分为数据传送指令、算术逻辑运算指令和比较指令等。
n数据传送指令用于在寄存器和存储器之间进行数据的双向传输。
n算术逻辑运算指令完成常用的算术与逻辑的运算,该类指令不但将运算结果保存在目的寄存器中,同时更新CPSR中的相应条件标志位。
n比较指令不保存运算结果,只更新CPSR中相应的条件标志位。
MOV{条件}{S} 目的寄存器,源操作数
MVN{条件}{S} 目的寄存器,源操作数
与MOV指令不同之处是在传送之前按位被取反了,即把一个被取反的值传送到目的寄存器中。
CMP{条件} 操作数1,操作数2
CMP指令用于比较一个寄存器的内容和另一个寄存器的内容或立即数,同时更新CPSR中条件标志位的值。该指令进行一次减法运算,但不存储结果,只更改条件标志位。
CMN{条件} 操作数1,操作数2
CMN指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较,同时更新CPSR中条件标志位的值。该指令实际完成操作数1和操作数2相加,并根据结果更改条件标志位。
TST{条件} 操作数1,操作数2
TST指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算,并根据运算结果更新CPSR中条件标志位的值。操作数1是要测试的数据,而操作数2是一个位掩码,该指令一般用来检测是否设置了特定的位。
TEQ{条件} 操作数1,操作数2
用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算,并根据运算结果更新CPSR中条件标志位的值。该指令通常用于比较操作数1和操作数2是否相等。
ADD{条件}{S} 目的寄存器,操作数1,操作数2
ADC{条件}{S} 目的寄存器,操作数1,操作数2
ADC指令用于把两个操作数相加,再加上CPSR的C条件标志位的值,并将结果存放到目的寄存器中。
SUB{条件}{S} 目的寄存器,操作数1,操作数2
SBC{条件}{S} 目的寄存器,操作数1,操作数2
SBC指令用于把操作数1减去操作数2,再减去CPSR的C条件标志位的反码,并将结果存放到目的寄存器中。
RSB{条件}{S} 目的寄存器,操作数1,操作数2
RSB指令称为逆向减法指令,用于把操作数2减去操作数1,并将结果存放到目的寄存器中。
RSC{条件}{S} 目的寄存器,操作数1,操作数2
RSC指令用于把操作数2减去操作数1,再减去CPSR中的C条件标志位的反码,并将结果存放到目的寄存器中。
AND{条件}{S} 目的寄存器,操作数1,操作数2
OR{条件}{S} 目的寄存器,操作数1,操作数2
EOR{条件}{S} 目的寄存器,操作数1,操作数2
EOR指令用于在两个操作数上进行逻辑异或运算,并把结果放置到目的寄存器中。
BIC{条件}{S} 目的寄存器,操作数1,操作数2
BIC指令用于清除操作数1的某些位,并把结果放置到目的寄存器中。
nMUL 32位乘法指令
nMLA 32位乘加指令
nSMULL 64位有符号数乘法指令
nSMLAL 64位有符号数乘加指令
nUMULL 64位无符号数乘法指令
nUMLAL 64位无符号数乘加指令
ASR n 算术右移n位(1<=n<=32)
LSL n 逻辑左移n位(1<=n<=32)
LSR n 逻辑右移n位(1<=n<=32)
ROR n 循环右移n位(1<=n<=32)
RRX 带扩展的循环右移1位
3程序状态寄存器处理指令
ARM微处理器支持程序状态寄存器访问指令,用于在程序状态寄存器和通用寄存器之间传送数据。
nMRS 程序状态寄存器到通用寄存器的数据传送指令
nMSR 通用寄存器到程序状态寄存器的数据传送指令
4程序状态寄存器处理指令
加载指令用于将存储器中的数据传送到寄存器,存储指令则完成相反的操作。
nLDR 字数据加载指令
nLDRB 字节数据加载指令
nLDRH 半字数据加载指令
nSTR 字数据存储指令
nSTRB 字节数据存储指令
nSTRH 半字数据存储指令
nLDM 批量数据加载指令
nSTM 批量数据存储指令
4批量数据加载/存储指令
ARM微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据,批量加载指令用于将一片连续的存储器中的数据传送到多个寄存器,批量数据存储指令则完成相反的操作。
nLDM 批量数据加载指令
nSTM 批量数据存储指令
ARM微处理器所支持的数据交换指令能在存储器和寄存器之间交换数据。
nSWP 字数据交换指令
nSWPB 字节数据交换指令
5协处理器指令
nCDP 协处理器数操作指令
nLDC 协处理器数据加载指令
nSTC 协处理器数据存储指令
nMCR 寄存器到协处理器寄存器的数据传送指令
nMRC 协处理器寄存器到寄存器的数据传送指令
异常产生指令
nSWI 软件中断指令
nBKPT 断点中断指令
ARM(Thumb)汇编语言的语句格式为:
{标号} {指令或伪指令} {;注释}
在汇编语言程序设计中,每一条指令的助记符可以全部用大写、或全部用小写,但不用许在一条指令中大、小写混用。
同时,如果一条语句太长,可将该长语句分为若干行来书写,在行的末尾用“\”表示下一行与本行为同一条语句。
在汇编语言程序设计中,经常使用各种符号代替地址、变量和常量等,以增加程序的可读性。尽管符号的命名由编程者决定,但并不是任意的,必须遵循以下的约定:
— 符号区分大小写,同名的大、小写符号会被编译器认为是两个不同的符号。
— 符号在其作用范围内必须唯一。
— 自定义的符号名不能与系统的保留字相同。
— 符号名不应与指令或伪指令同名。
1、 程序中的变量
程序中的变量是指其值在程序的运行过程中可以改变的量。ARM(Thumb)汇编程序所支持的变量有数字变量、逻辑变量和字符串变量。
数字变量用于在程序的运行中保存数字值,但注意数字值的大小不应超出数字变量所能表示的范围。
逻辑变量用于在程序的运行中保存逻辑值,逻辑值只有两种取值情况:真或假。
字符串变量用于在程序的运行中保存一个字符串,但注意字符串的长度不应超出字符串变量所能表示的范围。
在ARM(Thumb)汇编语言程序设计中,可使用GBLA、GBLL、GBLS伪指令声明全局变量,使用LCLA、LCLL、LCLS伪指令声明局部变量,并可使用SETA、SETL和SETS对其进行初始化。
2、 程序中的常量
程序中的常量是指其值在程序的运行过程中不能被改变的量。ARM(Thumb)汇编程序所支持的常量有数字常量、逻辑常量和字符串常量。
数字常量一般为32位的整数,当作为无符号数时,其取值范围为0~232-1,当作为有符号数时,其取值范围为-231~231-1。
逻辑常量只有两种取值情况:真或假。
字符串常量为一个固定的字符串,一般用于程序运行时的信息提示。
3、 程序中的变量代换
程序中的变量可通过代换操作取得一个常量。代换操作符为“$”。
如果在数字变量前面有一个代换操作符“$”,编译器会将该数字变量的值转换为十六进制的字符串,并将该十六进制的字符串代换“$”后的数字变量。
如果在逻辑变量前面有一个代换操作符“$”,编译器会将该逻辑变量代换为它的取值(真或假)。
如果在字符串变量前面有一个代换操作符“$”,编译器会将该字符串变量的值代换“$”后的字符串变量。
使用示例:
LCLS S1 ;定义局部字符串变量S1和S2
LCLS S2
S1 SETS “Test!”
S2 SETS “This is a $S1” ;字符串变量S2的值为“This is a Test!”
在汇编语言程序设计中,也经常使用各种表达式,表达式一般由变量、常量、运算符和括号构成。常用的表达式有数字表达式、逻辑表达式和字符串表达式,其运算次序遵循如下的优先级:
— 优先级相同的双目运算符的运算顺序为从左到右。
— 相邻的单目运算符的运算顺序为从右到左,且单目运算符的优先级高于其他运算符。
— 括号运算符的优先级最高。
1、 数字表达式及运算符
数字表达式一般由数字常量、数字变量、数字运算符和括号构成。与数字表达式相关的运算符如下:
— “+”、“-”、“×”、“/” 及“MOD”算术运算符
以上的算术运算符分别代表加、减、乘、除和取余数运算。例如,以X和Y表示两个数字表达式,则:
X+Y 表示X与Y的和。
X-Y 表示X与Y的差。
X×Y 表示X与Y的乘积。
X/Y 表示X除以Y的商。
X:MOD:Y 表示X除以Y的余数。
— “ROL”、“ROR”、“SHL”及“SHR”移位运算符
以X和Y表示两个数字表达式,以上的移位运算符代表的运算如下:
X:ROL:Y 表示将X循环左移Y位。
X:ROR:Y 表示将X循环右移Y位。
X:SHL:Y 表示将X左移Y位。
X:SHR:Y 表示将X右移Y位。
— “AND”、“OR”、“NOT”及“EOR”按位逻辑运算符
以X和Y表示两个数字表达式,以上的按位逻辑运算符代表的运算如下:
X:AND:Y 表示将X和Y按位作逻辑与的操作。
X:OR:Y 表示将X和Y按位作逻辑或的操作。
:NOT:Y 表示将Y按位作逻辑非的操作。
X:EOR:Y 表示将X和Y按位作逻辑异或的操作。
2、 逻辑表达式及运算符
逻辑表达式一般由逻辑量、逻辑运算符和括号构成,其表达式的运算结果为真或假。与逻辑表达式相关的运算符如下:
— “=”、“>”、“<”、“>=”、“<= ”、“/=”、“ <>” 运算符
以X和Y表示两个逻辑表达式,以上的运算符代表的运算如下:
X = Y 表示X等于Y。
X > Y 表示X大于Y。
X < Y 表示X小于Y。
X >= Y 表示X大于等于Y。
X <= Y 表示X小于等于Y。
X /= Y 表示X不等于Y。
X <> Y 表示X不等于Y。
— “LAND”、“LOR”、“LNOT”及“LEOR”运算符
以X和Y表示两个逻辑表达式,以上的逻辑运算符代表的运算如下:
X:LAND:Y 表示将X和Y 作逻辑与的操作。
X:LOR:Y 表示将X和Y作逻辑或的操作。
:LNOT:Y 表示将Y作逻辑非的操作。
X:LEOR:Y 表示将X和Y作逻辑异或的操作。
3、 字符串表达式及运算符
字符串表达式一般由字符串常量、字符串变量、运算符和括号构成。编译器所支持的字符串最大长度为512字节。常用的与字符串表达式相关的运算符如下:
— LEN运算符
LEN运算符返回字符串的长度(字符数),以X表示字符串表达式,其语法格式如下:
:LEN:X
— CHR运算符
CHR运算符将0~255之间的整数转换为一个字符,以M表示某一个整数,其语法格式如下:
:CHR:M
— STR运算符
STR运算符将将一个数字表达式或逻辑表达式转换为一个字符串。对于数字表达式,STR运算符将其转换为一个以十六进制组成的字符串;对于逻辑表达式,STR运算符将其转换为字符串T或F,其语法格式如下:
:STR:X
其中,X为一个数字表达式或逻辑表达式。
— LEFT运算符
LEFT运算符返回某个字符串左端的一个子串,其语法格式如下:
X:LEFT:Y
其中:X为源字符串,Y为一个整数,表示要返回的字符个数。
— RIGHT运算符
与LEFT运算符相对应,RIGHT运算符返回某个字符串右端的一个子串,其语法格式如下:
X:RIGHT:Y
其中:X为源字符串,Y为一个整数,表示要返回的字符个数。
— CC运算符
CC运算符用于将两个字符串连接成一个字符串,其语法格式如下:
X:CC:Y
其中:X为源字符串1,Y为源字符串2,CC运算符将Y连接到X的后面。
4、 与寄存器和程序计数器(PC)相关的表达式及运算符
常用的与寄存器和程序计数器(PC)相关的表达式及运算符如下:
— BASE运算符
BASE运算符返回基于寄存器的表达式中寄存器的编号,其语法格式如下:
:BASE:X
其中,X为与寄存器相关的表达式。
— INDEX运算符
INDEX运算符返回基于寄存器的表达式中相对于其基址寄存器的偏移量,其语法格式如下:
:INDEX:X
其中,X为与寄存器相关的表达式。
5、 其他常用运算符
— ?运算符
?运算符返回某代码行所生成的可执行代码的长度,例如:
?X
返回定义符号X的代码行所生成的可执行代码的字节数。
— DEF运算符
DEF运算符判断是否定义某个符号,例如:
:DEF:X
如果符号X已经定义,则结果为真,否则为假。
在ARM(Thumb)汇编语言程序中,以程序段为单位组织代码。段是相对独立的指令或数据序列,具有特定的名称。段可以分为代码段和数据段,代码段的内容为执行代码,数据段存放代码运行时需要用到的数据。一个汇编程序至少应该有一个代码段,当程序较长时,可以分割为多个代码段和数据段,多个段在程序编译链接时最终形成一个可执行的映象文件。
可执行映象文件通常由以下几部分构成:
— 一个或多个代码段,代码段的属性为只读。
— 零个或多个包含初始化数据的数据段,数据段的属性为可读写。
— 零个或多个不包含初始化数据的数据段,数据段的属性为可读写。
链接器根据系统默认或用户设定的规则,将各个段安排在存储器中的相应位置。因此源程序中段之间的相对位置与可执行的映象文件中段的相对位置一般不会相同。
以下是一个汇编语言源程序的基本结构:
AREA Init,CODE,READONLY
ENTRY
Start
LDR R0,=0x3FF5000
LDR R1,0xFF
STR R1,[R0]
LDR R0,=0x3FF5008
LDR R1,0x01
STR R1,[R0]
┉┉
END
在汇编语言程序中,用AREA伪指令定义一个段,并说明所定义段的相关属性,本例定义一个名为Init的代码段,属性为只读。ENTRY伪指令标识程序的入口点,接下来为指令序列,程序的末尾为END伪指令,该伪指令告诉编译器源文件的结束,每一个汇编程序段都必须有一条END伪指令,指示代码段的结束。
在ARM汇编语言程序中,子程序的调用一般是通过BL指令来实现的。在程序中,使用指令:BL 子程序名
即可完成子程序的调用。
该指令在执行时完成如下操作:将子程序的返回地址存放在连接寄存器LR中,同时将程序计数器PC指向子程序的入口点,当子程序执行完毕需要返回调用处时,只需要将存放在LR中的返回地址重新拷贝给程序计数器PC即可。在调用子程序的同时,也可以完成参数的传递和从子程序返回运算的结果,通常可以使用寄存器R0~R3完成。
以下是使用BL指令调用子程序的汇编语言源程序的基本结构:
AREA Init,CODE,READONLY
ENTRY
Start
LDR R0,=0x3FF5000
LDR R1,0xFF
STR R1,[R0]
LDR R0,=0x3FF5008
LDR R1,0x01
STR R1,[R0]
BL PRINT_TEXT
┉┉
PRINT_TEXT
┉┉
MOV PC,BL
┉┉
END
以下是一个基于S3C4510B的串行通讯程序,关于S3C4510B的串行通讯的工作原理,可以参考第六章的相关内容,在此仅向读者说明一个完整汇编语言程序的基本结构:
;********************************************************************************
; Instituteof Automation,Chinese Academyof Sciences
;Description: This example shows the UART communication!
;Author: JuGuang,Lee
;Date:
;********************************************************************************
UARTLCON0 EQU 0x3FFD000
UARTCONT0 EQU 0x3FFD004
UARTSTAT0 EQU 0x3FFD008
UTXBUF0 EQU 0x3FFD00C
UARTBRD0 EQU 0x3FFD014
AREAInit,CODE,READONLY
ENTRY
;**************************************************
;LED Display
;**************************************************
LDR R1,=0x3FF5000
LDR R0,=&ff
STR R0,[R1]
LDR R1,=0x3FF5008
LDR R0,=&ff
STR R0,[R1]
;*************************************************
;UART0 line controlregister
;*************************************************
LDR R1,=UARTLCON0
LDR R0,=0x03
STR R0,[R1]
;**************************************************
;UART0 control regiser
;**************************************************
LDR R1,=UARTCONT0
LDR R0,=0x9
STR R0,[R1]
;**************************************************
;UART0 baud rate divisorregiser
;Baudrate=19200,对应于50MHz的系统工作频率
;***************************************************
LDR R1,=UARTBRD0
LDR R0,=0x500
STR R0,[R1]
;***************************************************
;Print the messages!
;***************************************************
LOOP
LDR R0,=Line1
BL PrintLine
LDR R0,=Line2
BL PrintLine
LDR R0,=Line3
BL PrintLine
LDR R0,=Line4
BL PrintLine
LDR R1,=0x7FFFFF
LOOP1
SUBS R1,R1,#1
BNE LOOP1
B LOOP
;***************************************************
;Print line
;***************************************************
PrintLine
MOV R4,LR
MOV R5,R0
Line
LDRB R1,[R5],#1
AND R0,R1,#&FF
TST R0,#&FF
MOVEQ PC,R4
BL PutByte
B Line
PutByte
LDR R3,=UARTSTAT0
LDR R2,[R3]
TST R2,#&40
BEQ PutByte
LDR R3,=UTXBUF0
STR R0,[R3]
MOV PC,LR
Line1 DCB &A,&D,"******************************************************************",0
Line2 DCB &A,&D,"ChineseAcademy of Sciences,Institute of Automation,Complex System Lab.",0
Line3 DCB &A,&D," ARM Development Board Based on SamsungARM S3C4510B.",0
Line4 DCB &A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,0
END
在应用系统的程序设计中,若所有的编程任务均用汇编语言来完成,其工作量是可想而知的,同时,不利于系统升级或应用软件移植,事实上,ARM体系结构支持C/C+以及与汇编语言的混合编程,在一个完整的程序设计的中,除了初始化部分用汇编语言完成以外,其主要的编程任务一般都用C/C++ 完成。
汇编语言与C/C++的混合编程通常有以下几种方式:
- 在C/C++代码中嵌入汇编指令。
- 在汇编程序和C/C++的程序之间进行变量的互访。
- 汇编程序、C/C++程序间的相互调用。
在以上的几种混合编程技术中,必须遵守一定的调用规则,如物理寄存器的使用、参数的传递等,这对于初学者来说,无疑显得过于烦琐。在实际的编程应用中,使用较多的方式是:程序的初始化部分用汇编语言完成,然后用C/C++完成主要的编程任务,程序在执行时首先完成初始化过程,然后跳转到C/C++程序代码中,汇编程序和C/C++程序之间一般没有参数的传递,也没有频繁的相互调用,因此,整个程序的结构显得相对简单,容易理解。以下是一个这种结构程序的基本示例,该程序基于第五、六章所描述的硬件平台:
;*************************************************************************
; Instituteof Automation, Chinese Academyof Sciences
;File Name: Init.s
;Description:
;Author: JuGuang,Lee
;Date:
;************************************************************************
IMPORTMain ;通知编译器该标号为一个外部标号
AREA Init,CODE,READONLY ;定义一个代码段
ENTRY ;定义程序的入口点
LDR R0,=0x3FF0000 ;初始化系统配置寄存器,具体内容可参考第五、六章
LDR R1,=0xE7FFFF80
STR R1,[R0]
LDR SP,=0x3FE1000 ;初始化用户堆栈,具体内容可参考第五、六章
BL Main ;跳转到Main()函数处的C/C++代码执行
END ;标识汇编程序的结束
以上的程序段完成一些简单的初始化,然后跳转到Main()函数所标识的C/C++代码处执行主要的任务,此处的Main仅为一个标号,也可使用其他名称,与C语言程序中的main()函数没有关系。
/*******************************************************************************
* Instituteof Automation, Chinese Academyof Sciences
* File Name: main.c
* Description: P0,P1LED flash.
* Author: JuGuang,Lee
* Date:
******************************************************************************/
void Main(void)
{
inti;
*((volatile unsigned long *) 0x3ff5000) = 0x0000000f;
while(1)
{
*((volatile unsignedlong *) 0x3ff5008) = 0x00000001;
for(i=0;i<0x7fFFF; i++);
*((volatileunsigned long *) 0x3ff5008) = 0x00000002;
for(i=0;i<0x7FFFF; i++);
}
}