ARM汇编之解惑条件标志,条件码,条件执行

什么是条件执行(Conditional execution),它的机理是,根据运算结果更新的条件标志(condition flags),来判断指令的条件码(Condition code)是否符合条件,符合条件就执行,不符合条件则不执行。

A32/T32指令可以根据之前汇编指令更新的条件标志,来带条件的执行当前的汇编指令。为了让汇编指令带条件的执行,需要为汇编指令增加条件码后缀,这样就可以让处理器基于条件标志来测试是否需要执行该指令,如果条件测试不符,指令不会被执行,也不会影响其他任何标志,更不会产生异常,但是由于仍然占用了一个流水线空间,会消耗一个指令周期,除此之外什么也不会发生。

  • 几乎所有A32的指令都可以基于APSR中的条件标志,进行带条件判断的执行。
  • 而T32的话只支持部分 指令带条件的执行,分支指令,CBZ(零条件分支)/CBNZ(非零条件分支)——根据寄存器结果是否为零在同一个执行状态下进行短距离(0~126字节)跳转,IT(If-Then,16位指令)。
  • 同样在A64里面也只有少数指令可以真正的有条件执行(也就是说,要是条件测试不符,PC值仍然是往前增加的,除此没有别的影响),这些指令包括 B.EQ,CBNZ,CBZ,TBNZ,TBZ。

条件标志(condition flags)

总共有四个条件标志 N, Z, C, V,A32/T32中可存储更新到APSR寄存器最高的4个位置。大致示意图如下:


image.png

大部分的A32汇编指令编码中也会包含这四个位,而16位的T32指令大部分没有这些,所以不能带条件的执行,16位的指令编码带有的信息有限通常不会包含这四个位。

下面我们来说说,什么情况下这四个位会被置位/清除

条件标志 置位/清除
N 当运算的结果为负数的话置位,其他情况清0
Z 当运算的结果为0的话置位,其他情况清0
C 当运算的结果产生进位或者减法运算没有借位的话置位,其他情况清0
V 当运算的结果产生溢出的话置位,其他情况清0
  • 可能看完上面的表还是有点不明白,下面继续进行补充说明。最复杂的是C位了(这也是今年大家都想要的一个位:)),那就先讲一下C位,C位会在下面四种情况下被置位:

    • 无符号的(unsigned)加法运算(包括比较指令CMN)如果产生进位,C置位。

    • 无符号的(unsigned)减法运算(包括比较指令CMP)如果没有借位(减完结果是正的),C置位。

    • 移位操作也会影响C位(可以参考我之前文章中对移位操作介绍,ARM汇编指令中灵活的第二操作数),C的值是最后一个被移位器移出的位值,当然这个被移出的位值如果为1那么C值就为1

    • 除了上面3种情况,C位通常是不会被改变的,但也有特殊指令会造成C位改变,这个如果自己在编程时会用到C位最好参考一下汇编指令手册,确认一下对应的指令是否对C位有特殊影响。

例子1

ldr r1,=0xffffffff
ldr r2,=0x2
adds r3,r1,r2

例子2

mov r2,#3
mov r1,#1
subs r3,r2,r1;r3 = r2 - r1
  • 在来说一下V位,这个位是针对有符号的加法/减法及比较的,溢出,何为溢出呢,如果运算的结果大于等于2的31次方,或者小于负的2的31次方则V置位

例子:

ldr r1,=0x7fffffff
ldr r2,=0x2
adds r3,r1,r2
  • N位是用来检测运算结果是否为负数时比较有用。什么是负数呢,在计算机系统,负数通常用二进制的补码来表示,如果最高有效位被置位,则该二进制补码为负数。也就是说运算结果最高位为1那么N位就置位。

例子:

mov r1,#-1
mov r2,#-2
adds r3,r1,r2
  • Z位是最好理解的,只有运算的结果所有的位都为0则,Z置位。

例子:

mov r1,#0
mov r2,#0
adds r3,r1,r2

更新条件标志

  • 在A32/T32中条件标志大部分情况下,不会自动更新到APSR中,只有你的指令明确的告诉它要更新它才会去更新,比如你在汇编指令中使用 S 后缀明确告诉它要去更新 APSR中的这些位。如下面的这条指令语法格式,你用ADDS就会去更新条件标志,用ADD就不会去更新。
    ADD{S}{cond} {Rd}, Rn, Operand2
  • 至于四个标志位被更新了几个,这个跟具体的指令有关,有的4位都更新了,有的只更新了1位或者都不更新。为什么会更新多位,因为计算机并不知道你操作的是有符号数还是无符号数,是正数还是负数,它只能傻傻的把所有可能全部给你列出来,所以你要对你写的程序负责,你要清楚你在做什么,你是做有符号的操作,还是无符号的操作,还是对正/负数操作,并以此选择你想要测试的条件标志位,来看操作结果是否符合预期,简单说就是你要什么,你就要去判断什么。

例子:

ldr r1,=0x7fffffff
ldr r2,=0x2
adds r3,r1,r2
bvc stop
nop
nop
nop

stop b stop

下图是上面程序运行之后,条件标志更新结果:

image.png
  • 因为计算机不知道你要的是什么,所有它把所有情况都考虑进去了
    • 如果r1,r2是无符号数,显然加法结果没有溢出因此C位为0
    • 如果r1,r2是有符号数,加法结果超过了有符号数的上限而溢出因此V位为1
    • 同时r3 = r1 + r3 = 0x80000001,最高位是1,因此N位也为1
    • 计算的结果显然并不为0,因此Z为为0。

因此接下来你要用合适的条件码来对操作结果进行判断,比如你明确r1,r2是有符号数,你要判断有符号的加法是否溢出,你就需要对V位进行判断,如例子中的vc条件码。

备注:CMP, CMN,TEQ, TST这几条指令总是会更新条件标志位。他们没有S后缀的格式。如果带条件执行的指令没有被执行,它不会影响条件标志。

  • A64中这四个条件标志是放在NZCV系统寄存器的,除了CMP,CMN, CCMP, CCMN, TST这几条总是会更新条件标志的,其他指令需要更新条件标志同样需要带S的后缀。

条件码(Condition code)

  • 条件码由两个字母组成,在A32/A64中支持条件码后缀的汇编指令中通常会有一个 {cond}的语法选项,比如下面ADD的语法格式
    ADD{S}{cond} {Rd}, Rn, Operand2
  • 对于T32指令,条件码在前面的IT指令中编码。

所有支持的条件码(下图第一列)及含义如下图所示

image.png

例子:

    mov r2,#6
    ldr r1,=0x7fffffff
    subs r3,r2,r1;r3 = r2 - r1
    bgt stop
    nop
    nop
    nop 
stop b stop

比较指令

  • 上面提到的CMP, CMN,TEQ, TST这几条指令,总是会更新条件标志位,但运算结果总是被扔掉,不会进行保存。

他们的语法格式如下

CMP{cond} Rn, Operand2;Rn - Operand2 操作类似SUBS(除了扔掉运算结果)
CMN{cond} Rn, Operand2;Rn + Operand2 操作类似ADDS(除了扔掉运算结果)
TEQ{cond} Rn, Operand2;Rn EOR Operand2  操作类似EORS(除了扔掉运算结果)
TST{cond} Rn, Operand2;Rn AND Operand2  操作类似ANDS(除了扔掉运算结果)

备注:对TEQ和TST来说不会影响到V标志,N位和Z位会根据操作结果会被更新,Operand2移位操作也可能会影响到C位。而CMP和CMN则根据运算结果都有可能会被影响到。

例子:

    mov r1,#-1
    mov r2,#0
    tst r1,r2
    beq stop
    nop
    nop
    nop

stop b stop

为什么需要条件执行

  • 因为条件执行比条件分支效率更高。在没有分支预测(至于什么是分支预测,有兴趣的同学可以参考计算机原理的相关书籍,有详细介绍)的ARM处理器上如果发生分支跳转,需要重填三个机器指令周期的流水线,当然如果有分支预测功能的ARM处理器在预测失败时,也是需要重填的。
    下面是从ARM手册摘出来的一个例子:

C语言描述的算法如下:

int gcd(int a, int b)
{
    while (a != b)
      {
        if (a > b)
            a = a - b;
        else
            b = b - a;
      }
    return a;
}

如果用条件分支实现,代码如下:

gcd     CMP      r0, r1
        BEQ      end
        BLT      less
        SUBS     r0, r0, r1  ; could be SUB r0, r0, r1 for A32
        B        gcd
less
        SUBS     r1, r1, r0  ; could be SUB r1, r1, r0 for A32
        B        gcd
end

如果用带条件指令的条件执行,代码如下:

gcd
        CMP      r0, r1
        SUBGT    r0, r0, r1
        SUBLE    r1, r1, r0
        BNE      gcd

跟用分支执行的比较,该代码长度更小,而且执行的也更快。


参考资料

【1】DUI0801I_armasm_user_guide
【2】ARM Development Tools
【3】ARM Assembly Language_ Fundamentals and Techniques (2nd ed.)
【4】DDI0487C_a_armv8_arm

你可能感兴趣的:(ARM汇编之解惑条件标志,条件码,条件执行)