start_kernel()->setup_per_cpu_areas()
复制后的结果图如下:
代码如下:
void __init setup_per_cpu_areas(void)
{
unsigned long size, i;
char *ptr;
//取得cpu数量
unsigned long nr_possible_cpus = num_possible_cpus();
/* Copy section for each CPU (we discard the original) */
size = ALIGN(PERCPU_ENOUGH_ROOM, PAGE_SIZE);
//分配内存
ptr = alloc_bootmem_pages(size * nr_possible_cpus);
//__per_cpu_start __per_cpu_end分别是.data.percpu的起始地址和结束地址
for_each_possible_cpu(i)
{
//保存每一个cpu的percpu变量的起始地址和__per_cpu_start的差值 将来通过
//__per_cpu_offset[i]来定位各个cpu的变量
__per_cpu_offset[i] = ptr - __per_cpu_start;
//将.data.percpu中的数据复制到各个cpu 的percpu地址中
memcpy(ptr, __per_cpu_start, __per_cpu_end - __per_cpu_start);
ptr += size;
}
}
1)静态定义使用
声明一个percpu变量
DEFINE_PER_CPU(type, name) 如: DEFINE_PER_CPU(int , vartest)=0 定义一个int型的vartest变量 初始化为0
取得pervpu变量的值 会禁止开启抢占
var = get_cpu_var(name) 如:var = get_cpu_var(vartest) 会禁止内核抢占
put_cpu_var(name) 如: put_cpu_var(vartest) 开启内核抢占
取得pervpu变量的值(自己指定cpuid) 不会禁止开启内核抢占
var = per_cpu(var, cpu) 如: var = per_cpu(vartest,0)
2)动态定义使用
进行申请空间
ptr = alloc_percpu(type) 如: intptr = alloc_percpu(int)
进行释放空间
free_percpu(ptr) 如:free_percpu(intptr)
取得percpu的变量地址 此时访问是不会禁止内核抢占的
ptrval = per_cpu_ptr(ptr,cpuid) 如: ptrintvar = per_cpu_ptr(intptr,0)
如下支持内核抢占
get_cpu()
ptrval = per_cpu_ptr(ptr,cpuid) 如: ptrintvar = per_cpu_ptr(intptr,0)
put_cpu()
1) DEFINE_PER_CPU
#define DEFINE_PER_CPU(type, name) \
DEFINE_PER_CPU_SECTION(type, name, "")
最终展开如下:
#define DEFINE_PER_CPU_SECTION(type, name, sec) \
__attribute__((section(".data.percpu"))) \
__typeof__(type) per_cpu__##name
上面的宏在.data.percpu数据段中添加了一个变量 type per_cpu_name
2)per_cpu()
#define per_cpu(var, cpu) \
(*SHIFT_PERCPU_PTR(&per_cpu_var(var), per_cpu_offset(cpu)))
其中&per_cpu_var(var) 获得变量var在.data.percpu数据段中的地址
per_cpu_offset(cpu)获得cpu 的percpu起始地址相对于.data.percpu起始地址的偏移值就是__per_cpu_offset[cpu]的值
__per_cpu_offset[cpu]的含义看最此文章上面的图
#define SHIFT_PERCPU_PTR(__p, __offset) RELOC_HIDE((__p), (__offset))
由上面的解释以知道__p和__offset的含义, 那个RELOC_HIDE()就是将两个值相加得到 在此cpu中变量的地址,如何理解:
比如cpu0 的percpu的地址偏移量为A,.data.percpu数据段的起始地址为B, 变量var在.data.percpu的地址为C
那么变量var在cpu0 中的地址为 (A+B) + (C-B) = A+C,其中 A+B为cpu0的percpu起始地址,C-B为变量var的地址相对于.data.percpu起始地址的偏移值