percpu基础知识

(1)将.data.percpu数据段中的数据复制到每个cpu的percpu地址

start_kernel()->setup_per_cpu_areas()

复制后的结果图如下:

percpu基础知识_第1张图片

代码如下:

void __init setup_per_cpu_areas(void)
{
	unsigned long size, i;
	char *ptr;

	//取得cpu数量
	unsigned long nr_possible_cpus = num_possible_cpus();

	/* Copy section for each CPU (we discard the original) */
	size = ALIGN(PERCPU_ENOUGH_ROOM, PAGE_SIZE);

	//分配内存
	ptr = alloc_bootmem_pages(size * nr_possible_cpus);

    //__per_cpu_start  __per_cpu_end分别是.data.percpu的起始地址和结束地址
	for_each_possible_cpu(i) 
	{
	    //保存每一个cpu的percpu变量的起始地址和__per_cpu_start的差值 将来通过
	    //__per_cpu_offset[i]来定位各个cpu的变量
		__per_cpu_offset[i] = ptr - __per_cpu_start;

		//将.data.percpu中的数据复制到各个cpu 的percpu地址中
		memcpy(ptr, __per_cpu_start, __per_cpu_end - __per_cpu_start);
		ptr += size;
	}
}

 (2)percpu的定义和使用

1)静态定义使用
声明一个percpu变量
DEFINE_PER_CPU(type, name) 如: DEFINE_PER_CPU(int , vartest)=0 定义一个int型的vartest变量 初始化为0

取得pervpu变量的值 会禁止开启抢占
var = get_cpu_var(name)  如:var = get_cpu_var(vartest)  会禁止内核抢占 
put_cpu_var(name) 如: put_cpu_var(vartest)   开启内核抢占

取得pervpu变量的值(自己指定cpuid) 不会禁止开启内核抢占
var = per_cpu(var, cpu)  如: var = per_cpu(vartest,0)  

2)动态定义使用
进行申请空间
ptr = alloc_percpu(type) 如: intptr = alloc_percpu(int)

进行释放空间
free_percpu(ptr)  如:free_percpu(intptr)

取得percpu的变量地址 此时访问是不会禁止内核抢占的 
ptrval = per_cpu_ptr(ptr,cpuid) 如: ptrintvar = per_cpu_ptr(intptr,0)

如下支持内核抢占
get_cpu()
ptrval = per_cpu_ptr(ptr,cpuid) 如: ptrintvar = per_cpu_ptr(intptr,0)
put_cpu()

(3)部分宏的解释

1)  DEFINE_PER_CPU

#define DEFINE_PER_CPU(type, name)                    \
           DEFINE_PER_CPU_SECTION(type, name, "")

最终展开如下:

#define DEFINE_PER_CPU_SECTION(type, name, sec)    \
        __attribute__((section(".data.percpu")))   \
        __typeof__(type) per_cpu__##name 
上面的宏在.data.percpu数据段中添加了一个变量 type  per_cpu_name

2)per_cpu()

#define per_cpu(var, cpu) \
    (*SHIFT_PERCPU_PTR(&per_cpu_var(var), per_cpu_offset(cpu)))
其中&per_cpu_var(var) 获得变量var在.data.percpu数据段中的地址
per_cpu_offset(cpu)获得cpu 的percpu起始地址相对于.data.percpu起始地址的偏移值就是__per_cpu_offset[cpu]的值
__per_cpu_offset[cpu]的含义看最此文章上面的图
    
#define SHIFT_PERCPU_PTR(__p, __offset)     RELOC_HIDE((__p), (__offset))    
由上面的解释以知道__p和__offset的含义, 那个RELOC_HIDE()就是将两个值相加得到 在此cpu中变量的地址,如何理解:
比如cpu0 的percpu的地址偏移量为A,.data.percpu数据段的起始地址为B, 变量var在.data.percpu的地址为C
那么变量var在cpu0 中的地址为 (A+B) + (C-B)  = A+C,其中 A+B为cpu0的percpu起始地址,C-B为变量var的地址相对于.data.percpu起始地址的偏移值  

你可能感兴趣的:(linux内核)