(1)优化:对于特别重要代码进行优化,出于性能的考虑;
(2)C语言需要借助汇编指令来实现特殊功能。比如:C语言中访问系统寄存器就需要借助CSR指令;
asm asm-qualifiers(AssemblerInstructions)
关键字 | 含义 |
---|---|
asm | 这是内嵌汇编的关键字,表明这是一个GNU扩展 |
asm-qualifiers | 修饰词,比如:volatile、inline |
AssemblerInstructions | 要内嵌的汇编语句,如果是多条汇编语句指令,需要使用"\n\t"来换行 |
(1)基础内嵌汇编指令支持带参数;
(2)gcc编译器不会去解析内嵌汇编指令,当做一个字符串处理;
#同时内嵌多条汇编指令
asm( "pushl %eax\n\t"
"movl $0,%eax\n\t"
"popl %eax");
# 也可以将多条的内嵌汇编语句拆开写,效果一样
asm("movl %eax,%ebx");
asm("xorl %ebx,%edx");
asm("movl $0,_booga);
asm关键字 修饰词(
指令部
:输出部
:输入部
:损坏部
:GotoLables(goto修饰时才有该部))
关键字 | 含义 |
---|---|
asm关键字 | 扩展汇编指令的关键字:__asm__ |
指令部 | 要内嵌的汇编指令,可以是一条或者多条 |
输出部 | 用于描述在指令部中可以被修改的C语言变量以及约束条件 |
输入部 | 用于描述在指令部中只能被读取访问的C语言变量以及约束条件 |
损坏部 | 告诉编译器内嵌汇编可能带来的影响 |
修饰词 | 含义 |
---|---|
volatile | 用于关闭gcc优化,可参考博客:《C语言中volatile关键字详解以及常见的面试问题》 |
inline | 用于内联,gcc会把汇编代码编译成尽可能短的代码 |
goto | 用于在汇编代码里跳转到C语言的标签处 |
操作符/修饰符 | 含义 |
---|---|
= | 被修饰的操作数是只写属性 |
+ | 被修饰的操作数具有可读可写属性 |
& | 被修饰的操作数只能作为输出,这个操作数在输入参数的指令执行完成之后才能写入 |
输出部通常用“=”或者“+”修饰符;输入部分则不能用“=”或者“+”约束条件,否则编译器会报错,因为输入部是用来描述只能读取的C语言变量,不能具有写属性;
操作符/修饰符 | 含义 |
---|---|
p | 内存地址 |
m | 内存变量 |
r | 通用寄存器 |
o | 内存地址,基地址寻址 |
i | 立即数 |
V | 内存变量,不允许偏移的内存操作数 |
n | 立即数 |
关键字 | 含义 |
---|---|
memory | 告诉编译器,内嵌汇编代码改变了内存中的值,执行完汇编代码后重新加载该值 |
cc | 告诉编译器,内嵌汇编代码修改了状态寄存器的相关标志位 |
asm volatile(
"add %0, %1, %2"
: "=r"(res)
: "r"(i), "r"(j)
);
(1)%0对于"=r"(res),%1对应"r"(i),%2对应"r"(j),内嵌汇编的功能:把i+j的结果写到res中;
(2)"r"修饰词,表示该变量需要使用一个通用寄存器;
总结:用%+数字来引用后面输入部和输出部的参数;
asm volatile(
"add %[result], %[input_i], %[input_j]"
: [result] "=r"(res)
: [input_i] "r"(i), [input_j] "r"(j)
);
在输出部和输入部定义变量时就绑定符号,然后在指令部就可以通过符号来引用变量,提高代码的可读性;
asm goto(
"addi %0, %0, -1\n"
"beqz %0, %1[label]\n"
:
: "r"(a)
: "memory"
: label);
return 0;
label:
printf("11111\n");
(1)输出部必须是空的。goto是用于跳转功能,在满足某个条件下进行跳转,没有输出数据的必要;
(2)相较于其他情况,goto修饰的情况下多了标签部,表明最后要跳转的标签处;
(3)上面内嵌汇编的功能:当变量a是1时,则跳转到标签label处;
//读取csr寄存器的宏
#define read_csr(csr) \
({ \
register unsigned long __v; \
__asm__ __volatile__ ("csrr %0, " #csr \
: "=r" (__v) : \
: "memory"); \
__v; \
})
unsigned long val;
val = read_csr(mstatus);
//将上面的代码按宏定义展开
val = ({ register unsigned long __v; \
__asm__ __volatile__ ("csrr %0, " "mstatus" : "=r" (__v) : : "memory");\
__v; });
//用ATOMIC_OP宏定义内嵌汇编的函数,摘抄自linux源码
#define ATOMIC_OP(op, asm_op, I, asm_type, c_type, prefix) \
static __always_inline \
void arch_atomic##prefix##_##op(c_type i, atomic##prefix##_t *v) \
{ \
__asm__ __volatile__ ( \
" amo" #asm_op "." #asm_type " zero, %1, %0" \
: "+A" (v->counter) \
: "r" (I) \
: "memory"); \
}
#define ATOMIC_OPS(op, asm_op, I) \
ATOMIC_OP (op, asm_op, I, w, int, ) \
ATOMIC_OP (op, asm_op, I, d, s64, 64)
ATOMIC_OPS(add, add, i)
//将上面的宏展开
static __always_inline void arch_atomic_add(int i, atomic_t *v)
{
__asm__ __volatile__ ( "amoadd.w " zero, %1, %0"
: "+A" (v->counter) :
"r" (i)
: "memory");
}