1.前言
本文所述关于内存管理的系列文章主要是对陈莉君老师所讲述的内存管理知识讲座的整理。
本讲座主要分三个主题展开对内存管理进行讲解:内存管理的硬件基础、虚拟地址空间的管理、物理地址空间的管理.
本文将主要以X86架构为例来介绍伙伴算法和slab分配
2.伙伴算法概述
- 块链表
Linux的伙伴算法将所有的空闲页面分成MAX_ORDER+1(MAX_ORDER默认大小为11)个块链表
每个链表中的一个节点指向一个含有2的幂次个页面的块,即页块或简称块
图 伙伴算法结构实例图
0:每个页块的大小为1个页
1:每个页块的大小为2个页
。。。
MAX_ORDER:每个页块的大小为2的MAX_ORDER次方个页
- 伙伴
大小相同、物理地址连续的两个页块称为伙伴
- 伙伴算法工作原理
首先在大小满足要求的块链表中查找是否有空闲块,若有则直接分配,否则在更大的块的块链表中查找;
逆过程是块的释放,此时会把满足伙伴关系的块合并,组成一个更大的块,并插入到相应的块链表中
3.与伙伴算法有关的数据结构
每个页框对应一个struct page实例
每个内存区关联一个struct zone区域,该结构中用free_area数组对空闲页框进行管理
4.物理内存管理机制
- 伙伴算法
负责大块连续物理内存的分配和释放,以页框为基本单位,避免外部碎片
- slab缓存
负责小块物理内存的分配,并且它也作为一个缓存,主要针对内核中经常分配并释放的对象
- per-CPU页框缓存
内核经常请求和释放单个页框,该缓存包含预先分配的页框,用于满足本地CPU发出的单一页框请求
5.伙伴算法分配原理
- 伙伴算法的分配原理
如果分配阶为i的页框块,那么先从第i条页框块链表中查找是否存在这么大小的空闲块。如果有则分配,否则在第i+1条链表中继续查找,直到找到为止
- 伙伴算法分配举例
如果申请大小为8个(分配阶为3)页的页块,但却在页块大小为32(分配阶为5)的链表中找到空闲块,则先将这32个页面对半等分,前一半作为分配使用,另一半作为新元素插入下级大小为16(分配阶为4)的链表中;
继续将前一半大小为16的页块等分,一半分配,另一半插入大小为8(分配阶为3)的链表中
6. 页框分配的实现
5节描述的伙伴算法通过__rmqueue()主要调用如下两个函数:
- __rmqueue_smallest()
在指定的内存分配区上,从说请求分配阶order对应的链表开始查找所需大小的空闲块,如果不成功者从高一阶的链表上继续查找
- expand()
如果所得到的内存块大于说请求的内存块,则按照伙伴算法的分配原理将大的页框块分裂为小的页框块
7.物理内存分配器
基于伙伴算法、每CPU高速缓存和slab高速缓存形成两种内存分配器
- 分区页框分配器(zoned page frame allocator)
处理对连续页框的内存分配请求。分区页框分配器分为两大部分:前端的管理区分配器和伙伴系统
管理区分配器负责搜索一个能满足请求页框大小的管理区;
在每个管理区中,具体的页框分配工作由伙伴系统负责,为了达到更好的性能,单个页框的申请直接由每cpu页框高速缓存完成
图 分区页框分配器示例图
- slab分配器
将各种分配对象分区放进高速缓存,即每个高速缓存都对同类型分配对象的一种“储备”
8. 页框分配函数的关系图
图 页框分配函数的关系
- 内核有6个稍有差别的函数或宏来请求物理页框,他们将核心的分配函数__alloc_pages_nodemask封装满足不同的分配需求
- 绿色函数返回线性地址,蓝色函数返回页块的首页框描述符的地址
- __alloc_pages_nodemask是对分区页框分配器的具体体现
9. malloc的最终具体
进程调用malloc()->
获得一块虚拟内存->
内存访问,如果还未分配物理内存->
发生缺页异常->
内核调用__alloc_pages为进程分配物理页框,并将物理内存和虚拟内存的映射关系写入页表