由于Android以及Jetson TK的编译工具链中的汇编器仍然不支持大部分的32位Thumb-2指令,比如add.w,因此我们只能通过手工写机器指令码来实现想要的指令。下面我将简单地介绍如何在ARM GCC汇编器中手工去写机器指令码。
对于GCC或Clang的汇编器,我们使用.long或.short来写机器指令码。.long直接插入在指令汇编中,表示一个四字节的整型数据;.short直接插入在汇编中,表示一个双字节的整型数据。
然后,我们举一个add.w指令的例子,由于Android NDK r9d以及当前的Jetson TK1都不支持该指令的汇编。我们先看一下ARM官方对此指令编码的描述:
上图中我们可以看到add.w指令有两个双字节构成。而左边的16位放在低地址;而右边的16位放在高地址。这么做的好处是,处理器的译码器(decoder)在Thumb模式下总是从低双字节到高双字节进行解析,而左边的16位编码包含了Thumb指令类别,从而使得译码器可以知道是否当前指令是一条完整的指令,因为Thumb-2有32位宽和16位宽两种形式的指令类别。因此,如果我们要写:
add.w r0, r0, r1, LSL #1
那么我们就要这么写机器指令码:
.long 0x0041eb00
或者是:
.short 0xeb00
.short 0x0041
这里,imm3与imm2合并成一个5位的移位立即数;两个比特位的type形式如下:
00: LSL(逻辑左移)
01: LSR(逻辑右移)
10: ASR(算术左移)
11: 若5位立即数为00000,那么为RRX(带进位标志的循环右移一位);否则为ROR(循环右移)
下面举一个稍微完整的例子:
.text .align 4 .globl MyASMTest .thumb .thumb_func MyASMTest: // add.w r0, r0, r1, LSL #1 .long 0x0041eb00 // equivalent .short 0xeb00 .short 0x0041 adr r1, MyARMTest bx r1 .arm MyARMTest: movw r12, #0 add r0, r0, r12 bx lr
然后,我们可以在C语言中做如下调用:
#include <stdio.h> extern int MyASMTest(int, int); int main(void) { int result = MyASMTest(10, 20); printf("The result is: %d\n", result); } // 最终输出90
经过Google工程师的提醒,对于ARM GCC的汇编器,在汇编文件最上面加入.syntax unified之后,Thumb-2 T3 encoding汇编也能正常使用了,比如:
.syntax unified .text .align 4 .globl helloThumb .thumb .thumb_func helloThumb: add.w r0, r0, r1, lsl #2 bx lr
以上汇编能顺利通过。