Linux c++反汇编源码细节解释说明

示例c++源码:

int main(int argc, char** argv)
{
    auto sk = argc;
    int a = 11 << sk;
    int b = 19 + argc;
    volatile int rv = a + b * 8;
    rv *= sk;
    return rv;
}

GUN x86 64bit AT&T 汇编环境下用 g++ -O1 -Wa,-adhln ./main.cc命令反汇编

反汇编源码:

0000 89F9     		movl	%edi, %ecx
0002 B80B0000 		movl	$11, %eax
0007 D3E0     		sall	%cl, %eax
0009 8D84F898 		leal	152(%rax,%rdi,8), %eax
0010 0FAFC7   		imull	%edi, %eax
0013 C3       		ret

一点准备知识:

先通过通用寄存器cx来说明一下寄存器的命名,以便理解。

一般来讲,cx是两个字节(一个字,16bit)的通用寄存器。cx的高8位字节叫做ch大写为CH,低8位字节叫做cl大写为CL,ch和cl可以单独再汇编指令中使用。16位寄存器,8086CPU时代的老物件了。接着到了x86-32位时代。寄存器要存储32bit,这时候cx的名字就变为ecx,大写为ECX。仍然是通用寄存器,ecx由两个cx构成,一个高16位cx另一个是低16位cx。进入如今的64位时代,ecx就升级为rcx大写为RCX。同理,AX,BX,DX,DI,SI等都一样的。相对于16为后续更高位宽的cpu计算系统,相应的增加了其他的寄存器,例如支持SSE(SIMD)和AVX(MIMD)并行计算的相关寄存器。如下图示例:

Linux c++反汇编源码细节解释说明_第1张图片

AT&T 格式(GAS)汇编指令示例说明: movl实际是mov指令,后面这个l(L的小写)是个后缀,还有诸如:"b", "s", "w", "l", "q" or "t" 这些后缀。详情如下所示:

b = byte (8 bit).

s = single (32-bit floating point).

w = word (16 bit).

l = long (32 bit integer or 64-bit floating point).

q = quad (64 bit).

t = ten bytes (80-bit floating point).

所以sall实际是sal指令加上l后缀。

逐句解释说明:

# 下面一句代码,将形参argc的数据值存放到 ecx寄存器
movl	%edi, %ecx
# 下面一句代码,将立即数11存放到 eax寄存器
movl	$11, %eax
# 下面一句代码, 用cl寄存器中的值对eax中的值做左移位运算操作,sal就是算数左移指令也可以是shl
sall	%cl, %eax
# 下面一句代码, 是经过指令优化的。实际实现的运算逻辑是: 8 * rdi + rax + 152,而152 = 19 * 8。
# 这样的优化就减少了计算。lea指令是计算源操作数的地址并保存到目标操作数,也就是将上述计算结果的地址
# 存放到eax寄存器。
leal	152(%rax,%rdi,8), %eax
# 下面一句代码,edi的值乘以eax的值,并将结果放在eax中。imul是有符号乘法指令。
imull	%edi, %eax
# 下面一句代码,函数返回。
ret

你可能感兴趣的:(Assembly,c++/c/asm,c++,开发语言,assembly)