Linux设备驱动程序第三版学习(11)- 分配内存

一、kmalloc函数内幕
   kmalloc的使用已经比较熟悉了,它的函数原型是:

   1:  #include <linux/slab.h>
   2:  void *kmalloc(size_t size, int flags);

其中size表示要分配的块的大小, flags是分配标志。下面分别详细说明这两个参数:
* size参数
   实际上内核能分配的最小内存大小不是任意的,而是一些预定义的、固定大小的字节数组。linux创建一系列的内存对象池,每个池中的内存块大小事固定一致的。所以实际上申请到的内存大小可能会比size多一些,最多的时候会是2*size大小。另外,kmalloc能处理的最小内存块是32或64,取决于体系结构使用的页面大小。kmalloc不应该分配大于128KB的内存。
* flags参数
   最常用的标志是GFP_KERNEL, GFP_ATOMIC。其次是__GFP_DMA和__GFP_HIGHMEM。其中GFP的意思就是get free page。GFP_KERNEL和GFP_ATOMIC的区别在于前者使用在进程上下文中,后者使用在进程上下文之外,例如中断上下文。所以前者可能在没有空闲内存时使进程休眠,而后者是不能休眠的。

二、后备高速缓存(lookaside cache)
      linux高速缓存管理通过slab分配器来实现,通过slab实现的高速缓存具有kmem_cache_t类型。创建的函数如下,这个函数在2.6.32内核中和书中是不一样的,这里以2.6.32为准进行分析:

   1:  #include <linux/slab.h>
   2:  struct kmem_cache *kmem_cache_create (const char *name, size_t size, size_t align, unsigned long flags,
                             void (*ctor)(void *))

函数中各参数意义如下:
  * name: 使用在/proc/slabinfo中用来识别这个高速缓存的字符串。 在/proc目录下使用cat slabinfo可以查看现有的高速缓存。
  * size: 在高速缓存中的每个内存对象的大小
  * align: 确保已分配的对象进行某种特殊的对齐
  * flags: 分配标志位。主要有以下位掩码(其中标志为DEBUG的只有在CONFIG_SLAB_DEBUG被设置才可用):            

   1:  #define SLAB_DEBUG_FREE        0x00000100UL    /* DEBUG: Perform (expensive) checks on free */
   2:  #define SLAB_RED_ZONE        0x00000400UL    /* DEBUG: Red zone objs in a cache */
   3:  #define SLAB_POISON        0x00000800UL    /* DEBUG: Poison objects */
   4:  #define SLAB_HWCACHE_ALIGN    0x00002000UL    /* Align objs on cache lines */
   5:  #define SLAB_CACHE_DMA        0x00004000UL    /* Use GFP_DMA memory */
   6:  #define SLAB_STORE_USER        0x00010000UL    /* DEBUG: Store the last owner for bug hunting */
   7:  #define SLAB_PANIC        0x00040000UL    /* Panic if kmem_cache_creat() fails*/

  * ctor是内存对象的构造函数

高速缓存被创建完了以后,可以调用kmem_cache_alloc函数从中分配内存,释放一个内存对象则要调用kmem_cache_free函数。而释放一个高速缓存则要调用kmem_cache_destroy函数。注意这里高速缓存和内存对象的区别。另外还要注意的是:如果高速缓存中分配的内存对象还没有全部释放的情况下,此时释放高速缓存会失败,也就是会导致内存泄漏。所以设备驱动程序必须检查kmem_cache_destroy的返回状态。

三、get_free_page和相关函数
   当需要分配大块内存时,不应该使用kmalloc,而应该使用get_free_page进行整页分配。相关函数如下:

   1:  get_zeroed_page(unsigned int flags); //分配一个页面,返回指向页面的指针,并将该页清零
   2:  __get_free_page(unsigned int flags); //分配一个页面,返回指向页面的指针,但不清零
   3:  __get_free_pages(unsigned int flags, unsigned int order); /*分配连续的页面,返回指向该内存区域的第一个字节的指针,不清零*/

释放内存页面的函数如下:

   1:  void free_page(unsigned long addr);
   2:  void free_pages(unsigned long addr, unsigned long order);

四、vmalloc及其辅助函数
   vmalloc用来分配虚拟地址空间的连续区域,尽管物理上可能不连续,但是内核认为它们在地址上是连续的。相关函数如下:

   1:  #include <linux/vmalloc.h>
   2:  void *vmalloc(unsigned long size);
   3:  void vfree(void *addr);
   4:  void *ioremap(unsigned long offset, unsigned long size);
   5:  void iounmap(void *addr);

五、per-CPU变量,以下内容摘自http://blogold.chinaunix.net/u/12325/showart.php?id=1274548 

1. 简介
   2.6内核的特性,每个处理器都拥有自己的变量副本。
2. 优势
   每个处理器访问自己的副本,无需加锁,可以放入自己的cache中,极大地提高了访问与更新效率。常用于计数器。
3. 使用
   相关头文件:<linux/percpu.h>
   (1) 编译期间分配 
        声明:
        DEFINE_PER_CPU(type, name);
        避免进程在访问一个per-CPU变量时被切换到另外一个处理器上运行或被其它进程抢占:
          get_cpu_var(变量)++; 
          put_cpu_var(变量);
        访问其他处理器的变量副本用这个宏:
          per_cpu(变量,int cpu_id);

   (2) 动态分配与释放
        动态分配per-CPU变量:
          void * alloc_percpu(type);
          void * __alloc_percpu(size_t size, size_t align); //可以做特定的内存对齐
        释放动态分配的per-CPU变量:
          free_percpu();
        访问动态分配的per-CPU变量的访问通过per_cpu_ptr完成:
          per_cpu_ptr(void * per_cpu_var, int cpu_id);

        要想阻塞抢占,使用get_cpu()与put_cpu()即可:
          int cpu = get_cpu();
          ptr = per_cpu_ptr(per_cpu_var, cpu);
          put_cpu();

   (3) 导出Per-CPU变量给模块 
        EXPORT_PER_CPU_SYMBOL(per_cpu_var);
        EXPORT_PER_CPU_SYMBOL_GPL(per_cpu_var);

要在模块中访问这样一个变量,应该这样做声明:
DECLARE_PER_CPU(type, name);
4. 注意
   在某些体系结构上,per-CPU变量可使用的地址空间是受限的,要尽量保持这些变量比较小。
5. Per-CPU变量的实现
   每个CPU都有对应的专有的数据区,在start_kernel()中调用setup_per_cpu_areas()进行分配和初始化。通过数据区的首地址与偏移量信息访问Per-CPU变量。

你可能感兴趣的:(linux)