ARMv8中branch指令分类、格式及用法

ARMv8虽然还没有出商用芯片,但是ARM内部已经有成型的模拟器了,其中ARMv8的Fast Models已经内测,虽然还没上市。目前已有ARMv8的Foundation Model可以用来测试ARMv8的应用程序。

一:ARMv8 Branch指令分类:


1、 无条件分支+立即数:直接跳转到某地址,不能跳转到寄存器

指令有两个:”b label”  ”bl label”。在编译过程,编译器会将label翻译成立即数。

举例:编写汇编代码如下

main:

     label:  nop

      b label

      ret

编译并且反汇编后:

0000000000400510 <main>:

label():

  400510:       d503201f        nop

  400514:       17ffffff                        b       400510 <main>

      400518:       d65f03c0        ret

        

2、 无条件分支+寄存器:

blr   Xm:跳转到由Xm目标寄存器指定的地址处,同时将下一条指令存放到X30寄存器中。例如:blr  x20.

br      Xm:跳转到由Xm目标寄存器指定的地址处。不是子程序返回

ret     {Xm}:跳转到由Xm目标寄存器指定的地址处。是子程序返回。Xm可以不写,默认是X30.

3、 条件分支:所有条件分支的跳转目标都是立即数!

ARMv8的条件分支写法:b.cond   label。其中cond是条件码共十六个(EQ,NE,CS等等)


二:指令格式:

#################################################################################################

b ## mask: 0xfc000000 ##opcode: 0x14000000 ## ['ADDR_PCREL26']

|31|30|29|28|27|26|25|24|23|22|21|20|19|18|17|16|15|14|13|12|11|10|09|08|07|06|05|04|03|02|01|00|

imm26 after split: imm26

|0 |0 |0 |1 |0 |1 |A |A |A |A|A |A |A |A |A |A |A |A |A |A |A |A |A |A |A |A |A |A |A |A |A |A |

mask as follow:

|1 |1 |1 |1 |1 |1 |0 |0 |0 |0|0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 |

A  - imm26

#################################################################################################

CSDN的编辑器不好,对不齐,以上是branch指令的opcode


三:用法及解析

另外,上面代码例子中,为什么b指令的base opcode是0x14000000,而“b   label”指令翻译成二级制是0x17ffffff???

解答如下:

Branch指令是相对当前pc的分支指令。

1、 在ARMv8中,相对于当前b指令向后跳转时,编译器生成指令的二进制encoding(即b指令最终生成的二进制代码)的过程如下:

向后跳转时,branch指令将除base opcode之外的位全部置一,然后做减法如下:

指令的Encoding = 0x14000000 | 0x03ffffff(当前b指令所在的指令地址—branch指令的目标地址)/41

即当前b指令地址与目标地址做差后整出4(因为是32位地址),再减一。

label():

  400510:       d503201f        nop

  400514:       17ffffff                        b       400510 <main>

      400518:       d65f03c0        ret

上面的例子中,b指令所在地址为400514,label所在的地址是400510(label只是个标签,不占用空间,其指示的是离自己最近的下一条指令地址),根据上述公式能得到encoding=0x17ffffff—(400514—400510)/4=0x17ffffff.

 

同理就能理解以下代码:

 

000000000040051c <label2>:

label2():

  40051c:      d503201f        nop

  400520:       d503201f        nop

  400524:       d503201f        nop

  400528:       17fffffd       b       40051c <label2>

Encoding=0x17ffffff—400528—40051c/4—1= 0x17ffffff—2 = 17fffffd       

2、理解了向后跳转,则向前跳转是同理的:

向前跳转时,branch指令将除base opcode之外的位全部置零,然后做加法如下:

指令的Encoding = 0x14000000 &0xfc000000+branch指令的目标地址当前b指令所在的指令地址)/4

 

0000000000400510 <main>:

$x():

  400510:       14000003       b       40051c <label2>

  400514:       aa0203e1        mov    x1, x2

  400518:       aa0203e1        mov    x1, x2

 

000000000040051c <label2>:

 

Encoding=0x14000000 + 40051c—400510/4 = 0x14000000 + 3=0x14000003

 


你可能感兴趣的:(ARMv8中branch指令分类、格式及用法)