关于int全区变量读写的原子性
关于int变量的读写是否原子性网上有非常多讨论,貌似不同平台不同,这里自己做实如今arm9平台測试。
这里要注意原子性并不是指一条汇编才原子,实际上即使一次赋值编译成几条汇编依旧能够是原子的,仅仅要保证该内存不产生中间值,仅仅有原值和目标值两种状态则就是原子的。对一个int变量赋值是否要进入临界区呢?
下面基于arm920t cpu Sourcery G++ arm-none-eabi-gcc 编译器測试int原子性:
1、正常四字节对齐的int变量和非四字节对齐的char变量
typedef struct {
char c1;
char c2;
// atomic_t i1;
int i1;
} str_t;
volatile str_t Gstr ;
int main(void)
{
Gstr.c1 = 1;
Gstr.c2 = 2;
Gstr.i1 = 0x12345678;
while (1);
return 0;
}
int main(void)
{
8000: e52db004 push {fp} ; (str fp, [sp, #-4]!)
8004: e28db000 add fp, sp, #0
Gstr.c1 = 1;
8008: e59f1030 ldr r1, [pc, #48] ; 8040
800c: e3a03001 mov r3, #1
8010: e1a02003 mov r2, r3
8014: e1a03001 mov r3, r1
8018: e5c32000 strb r2, [r3]
Gstr.c2 = 2;
801c: e59f101c ldr r1, [pc, #28] ; 8040
8020: e3a03002 mov r3, #2
8024: e1a02003 mov r2, r3
8028: e1a03001 mov r3, r1
802c: e5c32001 strb r2, [r3, #1]
Gstr.i1 = 0x12345678;
8030: e59f3008 ldr r3, [pc, #8] ; 8040
8034: e59f2008 ldr r2, [pc, #8] ; 8044
8038: e5832004 str r2, [r3, #4]
while (1);
803c: eafffffe b 803c
8040: 00010060 .word 0x00010060
8044: 12345678 .word 0x12345678
从以上汇编看,在对齐的int写操作是原子的(
8038: e5832004 str r2, [r3, #4]
),仅一条str赋值指令。
char型能够通过strb对字节操作的指令一次完毕,不管是否对齐都是单指令完毕,故也是原子的。(strb的内存操作能够以字节对齐)
2、非四字节对齐的int型变量赋值
typedef struct { char c1; int i1; } __attribute__((__packed__)) str_t; volatile str_t Gstr ; int main(void) { Gstr.c1 = 1; Gstr.i1 = 0x12345678; while (1); return 0; } Gstr.i1 = 0x12345678; 801c: e59f3024 ldr r3, [pc, #36] ; 80488020: e5932000 ldr r2, [r3] 8024: e20210ff and r1, r2, #255 ; 0xff 8028: e59f201c ldr r2, [pc, #28] ; 804c 802c: e1812002 orr r2, r1, r2 8030: e5832000 str r2, [r3] 8034: e5932004 ldr r2, [r3, #4] 8038: e3c220ff bic r2, r2, #255 ; 0xff 803c: e3822012 orr r2, r2, #18 8040: e5832004 str r2, [r3, #4] while (1); 8044: eafffffe b 8044 8048: 00010068 .word 0x00010068 804c: 34567800 .word 0x34567800
可见当int变量非四字节对齐时,将无法单指令完毕全部赋值,分两步赋值,这样就产生了中间值,即非原子。
ldr str指令要求操作地址是4字节对齐的。
(PS:从一个非对齐的int的赋值看,转成汇编须要这么多的操作,
所以平时一些要求高效率的代码要考虑内存对齐问题,默认编译器都是会定义对齐内存的
)
3、非四字节对齐int变量读取。
typedef struct {
char c1;
int i1;
} __attribute__((__packed__)) str_t;
volatile str_t Gstr ;
int rd;
int main(void)
{
rd = Gstr.i1;
while (1);
return 0;
}
rd = Gstr.i1;
8008: e59f3024 ldr r3, [pc, #36] ; 8034
800c: e5932000 ldr r2, [r3]
8010: e1a02422 lsr r2, r2, #8
8014: e5933004 ldr r3, [r3, #4]
8018: e20330ff and r3, r3, #255 ; 0xff
801c: e1a03c03 lsl r3, r3, #24
8020: e1833002 orr r3, r3, r2
8024: e1a02003 mov r2, r3
8028: e59f3008 ldr r3, [pc, #8] ; 8038
802c: e5832000 str r2, [r3]
while (1);
8030: eafffffe b 8030
8034: 00010054 .word 0x00010054
8038: 0001005c .word 0x0001005c
从编译结果看,
非对齐int读取也是非原子的,i1被分为两部分,i1的内存被訪问两次,这样中间有可能被改动:
800c: e5932000 ldr r2, [r3]
8014: e5933004 ldr r3, [r3, #4] 读r3和r3+4 都是i1的内存,相当于分两次訪问同一变量就有可能被改动内存。
总结:int类型在对齐时读写是原子的(编译默认是对齐的),在非对齐时读写不是原子的。
可參考linux中的atomic.h查看原子操作的实现。能够自己实现一个atomic函数集,当希望一个变量的操作原子性时,使用atomic来操作该变量就可以。