asm [ volatile ] (
assembler template
[ : output operands ] /* optional */
[ : input operands ] /* optional */
[ : list of clobbered registers ] /* optional */
);
备注:本文遵从linux系统的统一风格,以[ ]来表示其对应的内容为可选项。
由代码模板可以看到,基本语法规则由5部分组成,下面分别进行说明。
1)关键字asm和volatile
asm为gcc关键字,表示接下来要嵌入汇编代码。为避免keyword asm与程序中其它部分产生命名冲突,gcc还支持__asm__关键字,与asm的作用等价。
volatile为可选关键字,表示不需要gcc对下面的汇编代码做任何优化。同样出于避免命名冲突的原因,__volatile__也是gcc支持的与volatile等效的关键字。
BTW: C语言中也经常用到volatile关键字来修饰变量(不熟悉的同学,请参考这里)
__asm__ __volatile__ ( "movl %eax, %ebx\n\t"
"movl %ecx, 2(%edx, %ebx, $8)\n\t"
"movb %ah, (%ebx)"
);
还有时候,根据程序上下文,嵌入的汇编代码中可能会出现一些类似于魔数(Magic Number )的操作数,比如下面的代码:
int a=10, b;
asm ("movl %1, %%eax; /* NOTICE: 下面会说明此处用%%eax引用寄存器eax的原因
movl %%eax, %0;"
:"=r"(b) /* output 该字段的语法后面会详细说明,此处可无视,下同 */
:"r"(a) /* input */
:"%eax" /* clobbered register */
);
我们看到,movl指令的操作数(operand)中,出现了%1、%0,这往往让新手摸不着头脑。其实只要知道下面的规则就不会产生疑惑了: asm ( "cpuid"
: "=a" (out_var1), "=b" (out_var2), "=c" (out_var3)
: "a" (op)
);
可见,我们可以为每个output operand指定其约束。2. 常用约束(commonly used constraints)
前面介绍output operands和input operands字段过程中,我们已经知道这些operands通常需要指明各自的constraints,以便更明确地完成我们期望的功能(试想,如果不明确指定约束而由gcc自行决定的话,一旦代码执行结果不符合预期,调试将变得很困难)。
下面开始介绍一些常用的约束项。
1)寄存器操作数约束(register operand constraint, r)
当操作数被指定为这类约束时,表明汇编指令执行时,操作数被将存储在指定的通用寄存器(General Purpose Registers, GPR)中。例如:
asm ("movl %%eax, %0\n" : "=r"(out_val));
该指令的作用是将%eax的值返回给%0所引用的C语言变量out_val,根据"=r"约束可知具体的操作流程为:先将%eax值复制给任一GPR,最终由该寄存器将值写入%0所代表的变量中。"r"约束指明gcc可以先将%eax值存入任一可用的寄存器,然后由该寄存器负责更新内存变量。
通常还可以明确指定作为“中转”的寄存器,约束参数与寄存器的对应关系为:
a : %eax, %ax, %al
b : %ebx, %bx, %bl
c : %ecx, %cx, %cl
d : %edx, %dx, %dl
S : %esi, %si
D : %edi, %di
例如,如果想指定用%ebx作为中转寄存器,则命令为:asm ("movl %%eax, %0\n" : "=b"(out_val));
2)内存操作数约束(Memory operand constraint, m)
当我们不想通过寄存器中转,而是直接操作内存时,可以用"m"来约束。例如:
asm volatile ( "lock; decl %0" : "=m" (counter) : "m" (counter));
该指令实现原子减一操作,输入、输出操作数均直接来自内存(也正因如此,才能保证操作的原子性)。
3)关联约束(matching constraint)
在有些情况下,如果命令的输入、输出均为同一个变量,则可以在内联汇编中指定以matching constraint方式分配寄存器,此时,input operand和output operand共用同一个“中转”寄存器。例如:
asm ("incl %0" :"=a"(var):"0"(var));
该指令对变量var执行incl操作,由于输入、输出均为同一变量,因此可用"0"来指定都用%eax作为中转寄存器。注意"0"约束修饰的是input operands。
4)其它约束
除上面介绍的3中常用约束外,还有一些其它的约束参数(如"o"、"V"、"i"、"g"等),感兴趣的同学可以参考这里。
#define _syscall0(type, name) \
type name(void) \
{ \
long __res; \
__asm__ volatile ( "int $0x80" \
: "=a" (__res) \
: "0" (__NR_##name)); \
__syscall_return(type, __res); \
}
对于系统调用fork来说,上述宏展开为:
pid_t fork(void)
{
long __res;
__asm__ volatile ( "int $0x80"
: "=a" (__res)
: "0" (__NR_fork));
__syscall_return(pid_t, __res);
}
根据前面对inline assembly语法及使用方法的说明,我们不难理解这段代码的含义。将这段内联汇编翻译更可读的伪码形式为:
pid_t fork(void)
{
long __res;
%eax = __NR_fork /* __NR_fork为内核分配给系统调用fork的调用号 */
int $0x80 /* 触发中断,内核根据%eax的值可知,引起中断的是fork system call */
__res = %eax /* 中断返回值保持在%eax中 */
__syscall_return(pid_t, __res);
}
【参考资料】=============== EOF ================