内存管理
对于一个进程来说,内存是最基本也是最重要的资源。
本章内容包括:存储器分配(allocation)、内存操控(manipulation)、内存释放(release)。
-
本小结总结了8.1~8.2的内容
进程地址空间
linux将它的物理内存虚拟化,进程并不能直接在物理内存上寻址,而是由linux内核为每个进程维护一个特殊的虚拟地址空间(virtual address space)。
页和页面调度
- 虚拟空间由许多页组成,系统的体系结构以及机型决定了页的大小(4K-32位系统 && 8K-64位系统).
- 每个页都只有有效和无效这两种状态.
- 有效:一个页面与一个物理页或者一些二级存储介质相关联,例如一个交换分区或者一个在硬盘上的文件。
- 无效:页面没有关联,代表它没有被分配。
- 一个进程不能访问一个处在二级存储中的页,除非这个页和物理内存中页相关联。
共享和写时复制
允许不同的虚拟地址空间共享(share)物理内存上的数据。共享的数据可能是只读的,或者是可读可写的。(一个物理页可能被分配给不同的进程,即进程共享这个页)
当某个进程试图写某个共享页时可能有两种情况:
- 内核允许这个操作
- 内存管理单元(MMU)会截取这次写操作并产生一个异常,然后内存会创造一份这个页的拷贝以供该进程进行写操作,这种方法叫写时拷贝(COW, copy-on-write)。读时可以共享读,只有进程在对共享页写时才能获得一份新的拷贝。
存储器区域
内核将具有某些相同特征的页组织成块(blocks),例如读写权限。
每个进程都有以下存储器区域:
- 文本段(text segment)
- 堆栈段(stack)
- 数据段(data segment),又叫堆(heap)
- BSS段(bss segment)
动态内存分配
所有内存管理系统的基础都是动态内存的分配,使用以及最终的返回。
- 动态内存是在进程运行时才分配的,而不是在编译时就分配好的。
C中获取动态内存的接口
1.malloc( ):
得到一个size大小的内存区域,并返回一个指向这部分内存首地址的指针。(其中的内容是未定义的,并非全部是0)
#include
void *malloc(size_t size);
malloc的使用:
char *p;
p = malloc(2048);
if (!p)
perror("malloc");
注:C会自动地把返回值由void指针转变为需要的类型,但是C++需要自己强转:
char *name;
name = (char *) malloc(512);
if (!name)
perror("malloc");
2.xmalloc( ):
当malloc( )返回NULL时就打印错误和终止程序:
/* like malloc( ), but terminates on failure */
void *xmalloc(size_t size)
{
void *p;
p = malloc(size);
if (!p) {
perror("xmalloc");
exit(EXIT_FAILURE);
}
return p;
}
3.calloc( ):
用于分配动态数组,
#include
void *calloc(size_t nr, size_t size);
调用calloc( )成功时会返回一个指针,指向一块可以存储下整个数组的内存(nr个元素,每个为size个字节).
- 与malloc(nr * size)相同(可能比请求的多,但不会少).
- 但与malloc( )不同的是,calloc将分配的区域全部用0进行初始化。
- calloc( )可能比memset更快,因为内核可以提供本已清0的内存块。
4.realloc( ):
C语言提供了一个接口来改变(变大或变小)已经得到的动态内存的大小:
#include
void *realloc(void *ptr, size_t size);
成功调用realloc( )将ptr指向的内存区域的大小变为size字节。
- 如果realloc( )不能在已有的空间上增加到size大小,那么就会另外申请一块size大小的空间,将原本的数据拷贝到新空间中,然后再将旧的空间释放。
- 注意: 当realloc( )失败时,ptr指向的内存区域并没有改变!
动态内存的释放
自动内存分配,当栈不在使用,空间被自动释放。而动态内存需要显式地释放。
- 当被malloc( ), calloc( )或者realloc( )分配到的内存不再使用时必须通过free( )归还给系统。
#include
void free(void *ptr);
- free( )有一个变种cfree( ),除非要考虑向下兼容的问题,不然我们不应该使用cfree( ),在此就略过了。
- 如果有块动态内存没有被显示地释放,那么这类编程错误叫做内存泄露(memory leak)。
- 另一个常见的错误是:释放后再使用。
对齐
数据的对齐(alignment)是指数据地址和由硬件确定的内存块之间的关系。
- 在编写可移植的代码的时候,对齐的问题一定要注意,所有的类型都应该保持自然对齐。
在大多数情况下, 编译器和C库会自动处理对齐的问题。在Linux中,malloc( )等函数返回的都是(8字节对齐(32位系统), 16字节对齐(64位系统))。
但是对于更大的边界,例如页面,需要动态的对齐。最基本的工作是将直接块I/O或是其它软硬件通信的缓冲区对齐
- posix_memalign( )
/* one or the other -- either suffices */
#define _XOPEN_SOURCE 600
#define _GNU_SOURCE
#include
int posix_memalign(void **memptr, size_t alignment, size_t size);
调用posix_memalign( ), 成功时会返回size字节的动态内存,并保证是按照alignment进行对齐的。参数alignment必须是2的幂,以及void指针大小的倍数。返回的内存块的地址保存在memptr里,函数返回0。
- 由posix_memalign( )获得的内存通过free( )释放。
- 还有valloc( )和memalign( )两个函数,但是为了移植性考虑,应该优先选择posix_memalign( )。
其他对齐问题
复杂的数据结构的对齐问题将会比标准类型的更复杂。另外,在对不同类型的指针进行赋值以及强制类型转换的时候,对齐的问题也很重要。
非标准类型。非标准和复杂的数据类型的对比比简单的自然对齐有着更多的要求:
- 一个结构的对齐要求和它的成员中最大的那个类型是一样的。
- 结构体中也引入了对填充的需求,例如一个char(1字节对齐)后跟着一个int(可能4字节对齐),编译器会自动地插入3个字节作为填充来保证int以4字节对齐。
- 一个联合的对齐和联合里最大的类型一致。
- 一个数组的对齐和数组里的元素类型一致。
使用指针和强转时也可能有对齐错误。例如以下代码:
char greeting[] = "ahoy matey";
char *c = greeting[1];
unsigned long badnews = *(unsigned long *)c;
当c被强转后再进行读取将会导致对齐错误。小者是性能损失,大者是整个程序崩溃。