linux系统编程-内存管理day01

内存管理

  • 对于一个进程来说,内存是最基本也是最重要的资源。

  • 本章内容包括:存储器分配(allocation)内存操控(manipulation)内存释放(release)

  • 本小结总结了8.1~8.2的内容

进程地址空间

linux将它的物理内存虚拟化,进程并不能直接在物理内存上寻址,而是由linux内核为每个进程维护一个特殊的虚拟地址空间(virtual address space)。

页和页面调度

  • 虚拟空间由许多页组成,系统的体系结构以及机型决定了页的大小(4K-32位系统 && 8K-64位系统).
  • 每个页都只有有效无效这两种状态.
    • 有效:一个页面与一个物理页或者一些二级存储介质相关联,例如一个交换分区或者一个在硬盘上的文件。
    • 无效:页面没有关联,代表它没有被分配。
  • 一个进程不能访问一个处在二级存储中的页,除非这个页和物理内存中页相关联。

共享和写时复制

允许不同的虚拟地址空间共享(share)物理内存上的数据。共享的数据可能是只读的,或者是可读可写的。(一个物理页可能被分配给不同的进程,即进程共享这个页)
当某个进程试图写某个共享页时可能有两种情况:

  1. 内核允许这个操作
  2. 内存管理单元(MMU)会截取这次写操作并产生一个异常,然后内存会创造一份这个页的拷贝以供该进程进行写操作,这种方法叫写时拷贝(COW, copy-on-write)。读时可以共享读,只有进程在对共享页写时才能获得一份新的拷贝。

存储器区域

内核将具有某些相同特征的页组织成块(blocks),例如读写权限。
每个进程都有以下存储器区域:

  • 文本段(text segment)
  • 堆栈段(stack)
  • 数据段(data segment),又叫堆(heap)
  • BSS段(bss segment)

动态内存分配

所有内存管理系统的基础都是动态内存的分配,使用以及最终的返回。

  • 动态内存是在进程运行时才分配的,而不是在编译时就分配好的。
C中获取动态内存的接口

1.malloc( ):
得到一个size大小的内存区域,并返回一个指向这部分内存首地址的指针。(其中的内容是未定义的,并非全部是0)

#include 
void *malloc(size_t size);

malloc的使用:

char *p;
p = malloc(2048);
if (!p)
  perror("malloc");

注:C会自动地把返回值由void指针转变为需要的类型,但是C++需要自己强转:

char *name;
name = (char *) malloc(512);
if (!name)
  perror("malloc");

2.xmalloc( ):
当malloc( )返回NULL时就打印错误和终止程序:

/* like malloc( ), but terminates on failure */
void *xmalloc(size_t size)
{
  void *p;
  p = malloc(size);
  if (!p) {
    perror("xmalloc");
    exit(EXIT_FAILURE);
  }
  return p;
}

3.calloc( ):
用于分配动态数组,

#include 
void *calloc(size_t nr, size_t size);

调用calloc( )成功时会返回一个指针,指向一块可以存储下整个数组的内存(nr个元素,每个为size个字节).

  • 与malloc(nr * size)相同(可能比请求的多,但不会少).
  • 但与malloc( )不同的是,calloc将分配的区域全部用0进行初始化。
  • calloc( )可能比memset更快,因为内核可以提供本已清0的内存块。

4.realloc( ):
C语言提供了一个接口来改变(变大或变小)已经得到的动态内存的大小:

#include 
void *realloc(void *ptr, size_t size);

成功调用realloc( )将ptr指向的内存区域的大小变为size字节。

  • 如果realloc( )不能在已有的空间上增加到size大小,那么就会另外申请一块size大小的空间,将原本的数据拷贝到新空间中,然后再将旧的空间释放。
  • 注意: 当realloc( )失败时,ptr指向的内存区域并没有改变!
动态内存的释放

自动内存分配,当栈不在使用,空间被自动释放。而动态内存需要显式地释放。

  • 当被malloc( ), calloc( )或者realloc( )分配到的内存不再使用时必须通过free( )归还给系统。
#include 
void free(void *ptr);
  • free( )有一个变种cfree( ),除非要考虑向下兼容的问题,不然我们不应该使用cfree( ),在此就略过了。
  • 如果有块动态内存没有被显示地释放,那么这类编程错误叫做内存泄露(memory leak)
  • 另一个常见的错误是:释放后再使用。
对齐

数据的对齐(alignment)是指数据地址和由硬件确定的内存块之间的关系。

  • 在编写可移植的代码的时候,对齐的问题一定要注意,所有的类型都应该保持自然对齐。

在大多数情况下, 编译器和C库会自动处理对齐的问题。在Linux中,malloc( )等函数返回的都是(8字节对齐(32位系统), 16字节对齐(64位系统))。
但是对于更大的边界,例如页面,需要动态的对齐。最基本的工作是将直接块I/O或是其它软硬件通信的缓冲区对齐

  1. posix_memalign( )
/* one or the other -- either suffices */
#define _XOPEN_SOURCE 600
#define _GNU_SOURCE
#include 
int posix_memalign(void **memptr, size_t alignment, size_t size);

调用posix_memalign( ), 成功时会返回size字节的动态内存,并保证是按照alignment进行对齐的。参数alignment必须是2的幂,以及void指针大小的倍数。返回的内存块的地址保存在memptr里,函数返回0。

  • 由posix_memalign( )获得的内存通过free( )释放。
  • 还有valloc( )和memalign( )两个函数,但是为了移植性考虑,应该优先选择posix_memalign( )。
其他对齐问题

复杂的数据结构的对齐问题将会比标准类型的更复杂。另外,在对不同类型的指针进行赋值以及强制类型转换的时候,对齐的问题也很重要。
非标准类型。非标准和复杂的数据类型的对比比简单的自然对齐有着更多的要求:

  • 一个结构的对齐要求和它的成员中最大的那个类型是一样的。
  • 结构体中也引入了对填充的需求,例如一个char(1字节对齐)后跟着一个int(可能4字节对齐),编译器会自动地插入3个字节作为填充来保证int以4字节对齐。
  • 一个联合的对齐和联合里最大的类型一致。
  • 一个数组的对齐和数组里的元素类型一致。

使用指针和强转时也可能有对齐错误。例如以下代码:

char greeting[] = "ahoy matey";
char *c = greeting[1];
unsigned long badnews = *(unsigned long  *)c;

当c被强转后再进行读取将会导致对齐错误。小者是性能损失,大者是整个程序崩溃。

你可能感兴趣的:(linux系统编程-内存管理day01)