问:想学汇编语言,因为现在用的是linux系统(ubuntu 11.04),so
有一本《汇编语言程序设计》马朝晖译,可惜淘宝、当当、京东等都没货,淘宝上只有盗版的。
ARM的书倒是挺多(但是我不是搞嵌入式的),二者有什么区别?语法一样否?汇编器都是gas?如果学习linux内核,二者是否通用?
学汇编语言(linux平台的最好),有啥经典大作(中文的吧,英语不好)?
答1:at&t汇编是x86处理器的,arm汇编当然是arm处理器的,完全不一样,也没法通用。
学汇编先要学处理器结构。别的不说,x86的寄存器是eax、ebx、……,arm的是r0、r1、……
如果不搞嵌入式,我觉得还是学x86比较好
答2:
如果不是做驱动和底层安全领域,建议不要花大精力学汇编。
而且由于汇编和处理器架构有关。换平台不易。
AT&T汇编和GNU汇编也有区别。
建议楼主还是学习操作系统底层的编程技术吧?
没事研究研究Linux Kernel还是挺有前途的。
转自:https://bbs.csdn.net/topics/370232628
ARM汇编开发指用ARM提供的汇编指令,进行ARM程序的开发。
ARM汇编开发,有两种开发方式,一种是使用ARM汇编,一种是使用ARM GNU汇编。两种汇编开发,使用的汇编指令是完全一样的,区别是宏指令,伪指令,伪操作不一样。其实两种开发方式的区别在于所使用的编译工具不一样。
对于ARM汇编,使用的是ARM公司开发的编译器,而ARM GNU汇编,是使用GNU为ARM指令集开发的编译器,也就是arm-gcc。
两种常用的ARM的编译开发环境
DS5:ARM提供的集成开发软件。使用的是ARM提供的工具链进行程序编译
GNU开发环境: 由GNU的汇编器as,交叉编译器gcc,和链接器ld等组成
伪操作:ARM汇编语言程序里的一些特殊指令助记符,其作用主要是完成汇编程序做各种准备工作,在源程序进行汇编时由汇编程序处理,而不是在计算机运行期间由机器执行。如程序段的定义,就属于伪操作。
宏指令:一段独立的程序代码,可插在源程序中,通过伪操作来定义。
伪指令:ARM汇编语言程序里的一些特殊指令助记符,不在处理器运行期间执行,在汇编时,被合适的ARM的机器指令代替,从而实现真正的指令操作。
伪操作 |
语法格式 |
作用 |
GBLA |
GBLA Varible |
声明一个全局的算术变量,并将其初始化为0 |
GBLL |
GBLL Varible |
声明一个全局的逻辑变量,并将其初始化成{FALSE} |
GBLS |
GBLS Varible |
声明一个全局的字符串变量,并将其初始化成空串 |
LCLA |
LCLA Varible |
声明一个局部的算术变量,并将其初始化为0 |
LCLL |
LCLL Varible |
声明一个局部的逻辑变量,并将其初始化成{FALSE} |
LCLS |
LCLS Varible |
声明一个局部的字符串变量,并将其初始化成空串 |
SETA |
SETA Varible expr |
给一个全局或局部算术变量赋值 |
SETL |
SETL Varible expr |
给一个全局或局部逻辑变量赋值 |
SETS |
SETS Varible expr |
给一个全局或局部字符串变量赋值 |
RLIST |
name LIST {list of registers} |
为一个通用寄存器列表定义名称 |
CN |
name CN expr |
为一个协处理器的寄存器定义名称 |
CP |
name CP expr |
为一个协处理器定义名称 |
DN/SN |
name DN/SN expr |
DN/SN为一个双精度/单精度的VFP寄存器定义名称 |
FN |
name FN expr |
为一个FPA浮点寄存器定义名称 |
LTORG |
LTONG |
声明一个数据缓冲池(文字池)的开始 |
MAP |
MAP expr {, base-register} |
定义一个结构化的内存表(storage map)的首地址 |
FIELD |
{label} FIELF expr |
定义一个结构化内存表中的数据域 |
SPACE |
{label} SPACE expr |
分配一块连续内存单元,并用0初始化 |
DCB |
{label} DCB expr {,expr}.. |
分配一块字节内存单元,并用expr初始化 |
DCD/ DCDU |
{label} DCD/DCDU expr {,expr}… |
分配一块字内存单元, 并用expr初始化 |
DCDO |
{label} DCDO expr {,expr}… |
分配一块字对齐的字内存单元, 并用expr初始化 |
DCFD/DCFDU |
{label} DCFD{U} fpliteral ,{,fpliteral}… |
为双精度的浮点数分配字对齐的内存单元 |
DCFS/DCFSU |
{label} DCFS{U} fpliteral ,{,fpliteral}… |
为单精度的浮点数分配字对齐的内存单元 |
DCI |
{label} DCI expr, {expr}… |
ARM代码分配一段字对齐的内存单元,填充expr(二进制指令码),THUMB代码中,分配一段半字对齐的半字内存单元。 |
DCQ/ DCQU |
{label} DCQ{U} {-} literal, {, {-} literal}… |
分配一段以双字(8个字节)为单位的内存 |
DCW/DCWU |
{label} DCW{U} {-} literal, {, {-} literal}… |
DCW用于分配一段半字对齐的半字内存单元 |
创建一段新的程序代码或数据区。
格式 : AREA name, {,attr,} …
其中,name是程序段名, atrr是段名属性
对于属性,有以下一些:
CODE: 用于定义代码段,默认为是READONLY
DATA: 用于定于数据段,默认为READWRITE
READONLY: 指定本段的内容只读
READWRITE: 指定本段的内容可读可写
ALIGN: 指定对齐为2次幂
COMMON: 定义通用的段。不包含任何用户的代码和数据。各源文件中同名的COMMON属性段共享同一段存储单元
指定对齐
ALIGN 4 表示4字节地址对齐
ALIGN 8 表示8字节地址对齐
注意:在AREA中使用和单独使用ALIGN的区别,在于格式和对齐的计算不一样。
指定汇编程序的入口。
一个程序至少有一个入口点,也可以有多个入口点,但是在一个源文件中,最多只能有一个ENTRY。当多个源文件均有ENTRY时,由链接器指定程序真正的入口。
表示源程序的结束
所以汇编语言源文件必须以END结束,汇编器遇到END, 将结束编译。
格式: EXPORT 标号 [,WEAK]
声明一个全局标号,其他源文件可以使用这个标号。WEAK表示碰上其他同名标号时,其他标号优先。
格式: IMPORT 标号,[,WEAK]
表示该引用的标号在其他源文件中,单要在当前文件中引用。WEAK表示找不到该标号时,也不报错,一般该标号置为0,如果是B 或BL指令用到该标号,该指令置为nop。
该标号会加入到当前源文件的符号表中。
和IMPORT一样,不同在于,如果当前文件没有引用该标号,该标号不会加入到当前源文件的符号表中。
将一个源文件包含到当前的源文件中
对一个常量标号赋值
格式: name EQU expression
其中: name符号名, expression寄存器相关或者程序相关的固定值
如:
num EQU 2 ; 为符号赋予数字2
EQU,等同于C语言中用#define定义一个常量
用于分配一片连续内存单元,并用0初始化。SPACE可用%代替。
格式: {label} SPACE expr
label : 是一个标号, 可选
expr: 分配的内存字节数
如
stack SPACE 100 ; 分配100个字节内存单元,并用0初始化。标号stack是这片空间的起始地址
用于分配段字节内存单元,并用伪操作中的expr初始化。
格式: {label} DCB expr {,expr}
label: 是一个标号,可选
expr: 可以是-128~255的数值或者字符串
如:
string DCB "HELLO" ;为HELLO字符串分配空间, string是这块空间的起始地址
用于分配段字内存单元(分配的内存都是字对齐,DCDU并不严格字对齐),并用伪操作中的expr初始化。 DCD 可用 & 代替。
格式: {label} DCD expr, {,expr}
label: 是一个标号,可选,表示这块内存单元的首地址
expr: 数字表达式或程序中的标号
如:
data DCD 1,2,3,4 ;分配字对齐的字单元空间,初始化为1,2,3,4
ARM伪指令包括: ADR, ADRL,LDR ,NOP
THUMB伪指令包括:ADR, LDR, NOP
伪指令 |
语法格式 |
作用 |
ADR |
ADR{cond} register, expr |
将基于PC或基于寄存器的地址值读取到寄存器中。小范围的地址读取 |
ADRL |
ADRL{cond} register, expr |
将给予PC或基于寄存器的地址值读取到寄存器中。中等范围的地址读取 |
LDR |
LDR {cond} register, =[expr|label] |
将一个32位的立即数或者一个地址值读取到寄存器中。大范围的地址读取 |
NON |
NOP |
在汇编时,被替换成空操作 |
伪操作 |
语法格式 |
作用 |
.byte |
.byte expr {,expr}… |
分配一段字节内存单元,并用expr初始化 |
.hword/.short |
.hword expr {,expr}… |
分配一段半字内存单元,并用expr初始化 |
.ascii |
.ascii expr {,expr}… |
定义字符串expr |
.asciz/.string |
.asciz expr {,expr}… |
定义字符串expr(会增加/0为结束符) |
.floar/.single |
.float expr {,expr}… |
定义32bit IEEE浮点数expr |
.double |
.doubel expr {,expr}… |
定义64bit IEEE浮点数expr |
.word/.long/.int |
.word expr {,expr}… |
分配一段字内存单元,并用expr初始化 |
.fill |
.fill repeat {,size} {,value} |
分配一段字节内存单元,用sieze长度value填充repeat次 |
.zero |
.zero size |
分配一段字节内存单元,并用0填充内存 |
.space/.skip |
.space size, {,value} |
分配一段内存单元,用value将内存初始化 |
.section |
.section expr |
定义一个段 |
.text |
.text {subsection} |
代码段, |
.data |
.data{subsection} |
数据段 |
.bss |
.bss{subsection} |
bss段 |
.cond 16/.thumb |
.code 16/.thumb |
表示之后的汇编指令使用THUMB指令集 |
.code 32/.arm |
.code 32/.arm |
表示之后的汇编指令使用ARM指令集 |
.end |
.end |
标记汇编文件的结束 |
.include |
.include "filename" |
将一个源文件包含到当前源文件中 |
.align/.balign |
.align {alignment} {,fill},{max} |
通过填充字节使当前位置满足一定的对齐格式 |
两种开发环境下的汇编代码,有较多不同的点,主要是符号及伪操作的不同。
ARM汇编的伪操作符 |
GNU汇编的伪操作符 |
INLCUDE |
.include |
NUM EQU 25 |
.equ NUM, 25 |
EXPORT |
.global |
IMPORT |
.extern |
DCD |
.long |
IF: DEF: |
.ifdef |
ELSE |
.else |
ENDIF |
.endif |
OR |
| |
SHL |
<< |
RN |
.req |
GBLA |
.global |
NUM SETA 16 |
.equ NUM , 16 |
MACRO |
.macro |
MEND |
.endm |
END |
.end |
AREA WORD, CODE, READONLY |
.text |
AREA BLOCK, DATE, READWRITE |
.data |
CODE32 |
.arm |
CODE16 |
.thumb |
LTORG |
.ltorg |
% |
.fill |
ENTRY |
ENTRY: |
ldr x0,=0xff |
ldr x0,=0xff |
原文链接:http://www.lujun.org.cn/?p=3943