Linux内核同步原语之per-cpu变量

refer from http://blog.csdn.net/npy_lp/article/details/7269498 



避免对同一数据的并发访问(通常由中断、对称多处理器、内核抢占等引起)称为同步。 

——题记

    内核源码:linux-2.6.38.8.tar.bz2

    目标平台:ARM体系结构

 

    当创建一个per-cpu变量时,系统中的每一个处理器都会拥有该变量的独有副本。由于每个处理器都是在自己的副本上工作,所以对per-cpu变量的访问几乎不需要加锁。

    per-cpu变量只为来自不同处理器的并发访问提供保护,对来自异步函数(中断处理程序和可延迟函数)的访问,以及内核抢占并不提供保护,因此在这些情况下还需要另外的同步原语。

    1、静态创建

    (1)、定义

    使用DEFINE_PER_CPU宏静态地创建per-cpu变量。 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/linux/percpu-defs.h */  
  2. #define DEFINE_PER_CPU(type, name)                  \  
  3.     DEFINE_PER_CPU_SECTION(type, name, "")  
  4.   
  5. #define DEFINE_PER_CPU_SECTION(type, name, sec)             \  
  6.     __PCPU_ATTRS(sec) PER_CPU_DEF_ATTRIBUTES            \  
  7.     __typeof__(type) name  

    其中,__PCPU_ATTRS宏的定义如下: 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/linux/percpu-defs.h */  
  2. #define __PCPU_ATTRS(sec)                       \  
  3.     __percpu __attribute__((section(PER_CPU_BASE_SECTION sec))) \  
  4.     PER_CPU_ATTRIBUTES  
  5.   
  6. /* linux-2.6.38.8/include/linux/compiler.h */  
  7. # define __percpu   __attribute__((noderef, address_space(3)))  
  8. /* linux-2.6.38.8/include/asm-generic/percpu.h */  
  9. #ifndef PER_CPU_BASE_SECTION  
  10. #ifdef CONFIG_SMP  
  11. #define PER_CPU_BASE_SECTION ".data..percpu"  
  12. #else  
  13. #define PER_CPU_BASE_SECTION ".data"  
  14. #endif  
  15. #endif  
  16.   
  17. #ifndef PER_CPU_ATTRIBUTES  
  18. #define PER_CPU_ATTRIBUTES  
  19. #endif  

    PER_CPU_DEF_ATTRIBUTES宏的定义为空: 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/asm-generic/percpu.h */  
  2. #ifndef PER_CPU_DEF_ATTRIBUTES  
  3. #define PER_CPU_DEF_ATTRIBUTES  
  4. #endif  

    在CONFIG_SMP未配置时,DEFINE_PER_CPU宏展开后的样子如下所示: 

[cpp] view plain copy
  1. __attribute__((noderef, address_space(3))) __attribute__((section(".data"))) __typeof__(type) name;  

    __typeof__等价于typeof,用来获取type的数据类型(typeof的使用方法可参考博文《例解GNU C之typeof》)。

    __attribute__((noderef, address_space(3)))属性用于sparse程序。

    __attribute__((section(".data")))属性表示把定义的变量存储在可执行程序的.data段。

    整个语句的核心意思是定义一个数据类型为type,名字为name的变量。

    (2)、使用

    1)、调用get_cpu_var函数获得当前处理器上的per-cpu变量,并且禁止内核抢占。 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/linux/percpu.h */  
  2. #define get_cpu_var(var) (*({               \  
  3.     preempt_disable();   /* 禁止内核抢占 */       \  
  4.     &__get_cpu_var(var); }))  

    a、单处理器版本的定义 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/asm-generic/percpu.h */  
  2. #define __get_cpu_var(var)  (*VERIFY_PERCPU_PTR(&(var)))  
  3.   
  4. #define VERIFY_PERCPU_PTR(__p) ({           \  
  5.     __verify_pcpu_ptr((__p));           \  
  6.     (typeof(*(__p)) __kernel __force *)(__p);   \  
  7. })  
  8.   
  9. /* linux-2.6.38.8/include/linux/percpu-defs.h */  
  10. #define __verify_pcpu_ptr(ptr)  do {                    \  
  11.     const void __percpu *__vpp_verify = (typeof(ptr))NULL;      \  
  12.     (void)__vpp_verify;                     \  
  13. while (0)  

    __get_cpu_var的核心代码等价于: 

[cpp] view plain copy
  1. *(typeof(*(&(var))) *)(&(var));  

    b、多处理器版本的定义 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/asm-generic/percpu.h */  
  2. #define __get_cpu_var(var) (*this_cpu_ptr(&(var)))  
  3.   
  4. #ifdef CONFIG_DEBUG_PREEMPT  
  5. #define this_cpu_ptr(ptr) SHIFT_PERCPU_PTR(ptr, my_cpu_offset)  
  6. #else  
  7. #define this_cpu_ptr(ptr) __this_cpu_ptr(ptr)  
  8. #endif  
  9.   
  10. #ifndef __this_cpu_ptr  
  11. #define __this_cpu_ptr(ptr) SHIFT_PERCPU_PTR(ptr, __my_cpu_offset)  
  12. #endif  
  13.   
  14. #ifndef SHIFT_PERCPU_PTR  
  15. /* Weird cast keeps both GCC and sparse happy. */  
  16. #define SHIFT_PERCPU_PTR(__p, __offset) ({              \  
  17.     __verify_pcpu_ptr((__p));                   \  
  18.     RELOC_HIDE((typeof(*(__p)) __kernel __force *)(__p), (__offset)); \  
  19. })  
  20. #endif  
  21.   
  22. /* linux-2.6.38.8/include/linux/compiler-gcc.h */  
  23. #define RELOC_HIDE(ptr, off)                    \  
  24.   ({ unsigned long __ptr;                   \  
  25.     __asm__ ("" : "=r"(__ptr) : "0"(ptr)); /* 把ptr的值赋给__ptr */  \  
  26.     (typeof(ptr)) (__ptr + (off)); })  

    其中,__my_cpu_offset的定义如下: 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/asm-generic/percpu.h */  
  2. #ifndef __my_cpu_offset  
  3. #define __my_cpu_offset per_cpu_offset(raw_smp_processor_id())  
  4. #endif  
  5.   
  6. #define per_cpu_offset(x) (__per_cpu_offset[x])  
  7.   
  8. /* linux-2.6.38.8/mm/percpu.c */  
  9. unsigned long __per_cpu_offset[NR_CPUS] __read_mostly;  //NR_CPUS为系统中处理器的数量  
  10.   
  11. /* linux-2.6.38.8/arch/arm/include/asm/smp.h */  
  12. #define raw_smp_processor_id() (current_thread_info()->cpu) //获取当前处理器的编号(0,1,...,NR_CPUS-1)  

    2)、调用put_cpu_var函数重新激活内核抢占。 

[cpp] view plain copy
  1. #define put_cpu_var(var) do {               \  
  2.     (void)&(var);                   \  
  3.     preempt_enable();               \  
  4. while (0)  

    3)、调用per_cpu函数获取指定处理器上的per-cpu变量。 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/asm-generic/percpu.h */  
  2. #ifdef CONFIG_SMP  
  3. #define per_cpu(var, cpu) \  
  4.     (*SHIFT_PERCPU_PTR(&(var), per_cpu_offset(cpu)))  
  5. #else  
  6. #define per_cpu(var, cpu)   (*((void)(cpu), VERIFY_PERCPU_PTR(&(var))))  
  7. #endif  

    注意,这里的per_cpu函数既没有禁止内核抢占,也没有提供其他形式的锁保护。

    2、动态创建

    (1)、分配和释放

    调用alloc_percpu宏动态地创建type数据类型的per-cpu变量,并返回它的地址。 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/linux/percpu.h */  
  2. #define alloc_percpu(type)  \  
  3.     (typeof(type) __percpu *)__alloc_percpu(sizeof(type), __alignof__(type))  
  4.   
  5. /* linux-2.6.38.8/mm/percpu.c */  
  6. void __percpu *__alloc_percpu(size_t size, size_t align)  
  7. {  
  8.     return pcpu_alloc(size, align, false);  
  9. }  

    调用free_percpu函数来释放per-cpu变量。 

[cpp] view plain copy
  1. /* linux-2.6.38.8/mm/percpu.c */  
  2. void free_percpu(void __percpu *ptr)  
  3. {  
  4.     void *addr;  
  5.     struct pcpu_chunk *chunk;  
  6.     unsigned long flags;  
  7.     int off;  
  8.   
  9.     if (!ptr)  
  10.         return;  
  11.   
  12.     addr = __pcpu_ptr_to_addr(ptr);  
  13.   
  14.     spin_lock_irqsave(&pcpu_lock, flags);  
  15.   
  16.     chunk = pcpu_chunk_addr_search(addr);  
  17.     off = addr - chunk->base_addr;  
  18.   
  19.     pcpu_free_area(chunk, off);  
  20.   
  21.     /* if there are more than one fully free chunks, wake up grim reaper */  
  22.     if (chunk->free_size == pcpu_unit_size) {  
  23.         struct pcpu_chunk *pos;  
  24.   
  25.         list_for_each_entry(pos, &pcpu_slot[pcpu_nr_slots - 1], list)  
  26.             if (pos != chunk) {  
  27.                 schedule_work(&pcpu_reclaim_work);  
  28.                 break;  
  29.             }  
  30.     }  
  31.   
  32.     spin_unlock_irqrestore(&pcpu_lock, flags);  
  33. }  

    (2)、使用 

[cpp] view plain copy
  1. /* linux-2.6.38.8/include/linux/percpu.h */  
  2. #define get_cpu_ptr(var) ({             \  
  3.     preempt_disable();              \  
  4.     this_cpu_ptr(var); })  
  5.   
  6.   
  7. #define put_cpu_ptr(var) do {               \  
  8.     (void)(var);                    \  
  9.     preempt_enable();               \  
  10. while (0)  
  11.   
  12. #ifdef CONFIG_SMP  
  13. #define per_cpu_ptr(ptr, cpu)   SHIFT_PERCPU_PTR((ptr), per_cpu_offset((cpu)))  
  14. #else  
  15. #define per_cpu_ptr(ptr, cpu)   ({ (void)(cpu); VERIFY_PERCPU_PTR((ptr)); })  
  16. #endif  


你可能感兴趣的:(Linux内核同步原语之per-cpu变量)