转载arm汇编语言学习笔记

XREF

XREF的分类：

1.代码交叉引用，-CODE XREF
２.数据交叉引用，-data xref
XREF含义描述

image

这是个代码交叉引用
fun是被引用者，main+2c表示引用者
下箭头表示引用者的地址比fun高，你需要向下滚动才能到达引用者地址（main+2C），上行反之
每个交叉引用注释都包含一个单字符后缀箭头后面），用以说明交叉引用的类型

CODE XREF

代码交叉引用用于表示一条指令将控制权转交给另一条指令。在IDA中，指令转交控制权的方式叫做流，有三种基本流：

普通流
调用流
跳转流

在函数位置处，按x可以查看其所有交叉引用的值，和相应的情况
调用流
由函数调用导致的交叉引用使用后缀 ↓p（看做是procedure）

跳转流
跳转交叉引用使用后缀↑j（看做jump）

DATA XREF

数据交叉引用用于跟踪二进制文件访问数据的方式。数据交叉引用与IDA数据库中任何牵涉到虚拟地址的字节有关

最常用的三种数据交叉引用：
addr何时被读取（读取交叉引用）
addr何时被写入（写入交叉引用）
addr何时被引用（偏移量交叉引用）

读取交叉引用表示访问的是某个内存位置的内容
使用后缀 ↑r（看做是Read）
写入交叉引用指出了修改变量内容的程序位置
使用后缀 ↑w（看做write）
偏移量交叉引用表示引用的是某个位置的地址
使用后缀↑o（看做offset）

出处arm汇编语言学习笔记

1、arm伪指令在汇编时，会被合适的机器指令代替，实现真正的机器指令操作！

2、DCB、DCW、DCD、DCQ，这4条伪指令都是用于分配一段内存单元，并对该内存单元初始化。唯一的区别是它们分配内存单元的大小不同

DCB分配一段字节的内存单元，其后的每个操作数都占有一个字节，操作数可以为-128～255的数值或字符串

DCW分配一段半字的内存单元，其后的每个操作数都占有两个字节，操作数是16位二进制数，取值范围为-32768～65535

DCD分配一段字的内存单元，其后的每个操作数都占有4个字节，操作数可以是32位的数字表达式，也可以是程序中的标号（因为程序中的标号代表地址，也是32位二进制数值）

DCQ分配一段双字的内存单元，其后的每个操作数都占有8个字节

3、宏是一段功能完整的程序，能够实现一个特定的功能，在使用中可以把它视为一个子程序。
宏应用举例：

MACRO ；宏定义开头
MAX time ；宏名为 MAX，带两个参数 date和 time
LDR R1, = 0x1000 ； R1 = 0x1000（存储单元的首地址）
**LDR R0, = time
STR R2, [R1]
MEND ；宏定义结束
...
MAX 0x858, 12 ；调用宏
ADD R3, R0, R2

宏与子程序的区别，在于调用宏时编译程序会在调用处插入宏的程序段，有多少次调用就会插入多少宏的程序段；而调用子程序不增加新的程序段。

上例定义了MAX宏，宏语句段的功能是完成将两个参数date和time保存到起始地址为0x1000的内存单元中。

4、杂项伪指令

杂项伪指令介绍如下：
■ 导出伪指令：EXPORT、GLOBAL。
■ 导入伪指令：IMPORT、EXTERN。
■ 文件包含伪指令：GET、INCLUDE。
一个程序可以由多个汇编源文件组成，多个文件间会互相引用符号（变量或标号）。当在一个源文件中定义的一个符号希望其他文件引用时，则必须用导出伪指令定义这个符号；如果这个文件引用了外部定义的符号，则必须用导入伪指令定义这个符号。

5、顺序程序设计举例

AREA Buf, DATA, READWRITE ；定义数据段 Buf
Array DCD 0x11, 0x22, 0x33, 0x44 ；定义 12个字的数组 Array
DCD 0x55, 0x66, 0x77, 0x88
DCD 0x00, 0x00, 0x00, 0x00
AREA Example, CODE, READONLY
ENTRY
CODE32
LDR R0, = Array ；取得数组 Array首地址
LDR R2, [R0] ；装载数组第 1项字数据给 R2
MOV R1, #4
LDR R3, [R0, R1, LSL #2] ；装载数组第 5项字数据给 R3
ADD R2, R2, R3 ； R2 + R3 → R2
MOV R1, #8 ； R1 = 8
STR R2, [R0, R1, LSL #2] ；保存结果到数组第 9项
END

6、分支程序设计
C语言程序如下：

int x=76; //定义整型变量
int y=88;
if( x>y )
z=100;
else
z=50;

arm汇编如下：

...
MOV R0, #76 ；初始化 R0的值
MOV R1, #88 ；初始化 R1的值
CMP R0, R1 ；判断 R0>R1?
MOVHI R2, #100 ； R0>R1时，这条语句执行，则 R2 = 100
MOVLS R2, #50 ； R0 ...

7、循环程序设计

编写循环语句实现数据块复制

LDR R0, =DATA_DST ；指向数据目标地址
LDR R1, =DATA_SRC ；指向数据源地址
MOV R10, #20 ；赋值数据个数 20×N个字
； N为 LDM指令操作数据个数
LOOP LDMIA R1!, {R2-R9} ；从数据源读取 8个字到 R2～ R9
STMIA R0!, {R2-R9} ；将 R2～ R9的数据保存到目标地址
SUBS R10, R10, #1 ； R10-1，并改变程序状态寄存器
BNE LOOP

8、子程序设计

在一个程序的不同部分往往要用到类似的程序段，这些程序段的功能和结构形式都相同，只是某些变量的赋值不同，此时就可以把这些程序段写成子程序形式，以便需要时可以调用它。
调用程序在调用子程序时，经常需要传送一些参数给子程序；子程序运行完后也经常要回送结果给调用程序。这种调用程序和子程序之间的信息传送称为参数传
送。参数传送可以有以下两种方法：
■ 当参数比较少时，可以通过寄存器传送参数。
■ 当参数比较多时，可以通过内存块或堆栈传送参数。

子程序的正确执行是由子程序的正确调用及正确返回保证的。这就要求调用程序在调入子程序时必须保存正确的返回地址，即当前PC值（由于ARM流水线特性，可能要减去一个偏移量）。PC值可以保存在专用的链接寄存器R14中，也可以保存到堆栈中。根据这两种情况，可以在子程序中采用如下的返回语句：

MOV PC, LR ；恢复 PC的值
或 STMFD SP!, {R0-R7,PC} ；将 PC值从堆栈中返回

使用堆栈来恢复处理器的状态时，注意STMFD与LDMFD要配合使用。一般来讲，在ARM汇编语言程序中，子程序的调用是通过BL指令来实现的。该指令在执行时完成如下操作：将子程序的返回地址存放在链接寄存器LR中（针对流水线特性，已经减去偏移量了），同时将程序计数器PC指向子程序的入口点，当子程序执行完毕需要返回调用处时，只需要将存放在LR中的返回地址重新拷贝给程序计数器PC即可。

9、子程序程序设计举例

MAX函数和调用主程序

int MAX( int i, int j ) //声明子函数 MAX
{
if( i>j ) return ( i );
else return ( j );
}

Main(void) //主函数
{
int a, b, c;
a=19; //给变量 a赋初值
b=20; //给变量 b赋初值
c=MAX(a,b); //调用 MAX子函数，把最大值赋给 c
}

MAX汇编子程序和调用主程序
X EQU 19 ；定义 X的值为 19
N EQU 20 ；定义 N的值为 20
AREA Example4, CODE, READONLY ；声明代码段 Example4
ENTRY ；标识程序入口
CODE32 ；声明 32位 ARM指令
START LDR R0, =X ；给 R0、 R1赋初值
LDR R1, =N
BL MAX ；调用子程序 MAX，返回值为 R2
HALT B HALT ；死循环
MAX ；声明子程序 MAX
CMP R0, R1 ；比较 R0与 R1， R2等于最大值
MOVHI R2, R0
MOVLS R2, R1
MOV PC, LR ；返回语句
MAX_END
END

转载arm汇编语言学习笔记

XREF

XREF的分类：

CODE XREF

出处arm汇编语言学习笔记

你可能感兴趣的:(转载arm汇编语言学习笔记)