C程序内存分配_Linux程序设计

3.1.1 C程序内存分配
1.C 程序结构
下面列出 C 语言可执行程序的基本情况(Linux 2.6 环境/GCC4.0)。
[root@localhost Ctest]# ls test -l //test 为一个可执行程序
-rwxr-xr-x 1 root root 4868 Mar 26 08:10 test
[root@localhost Ctest]# file test //此文件基本情况
test: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), for GNU/Linux 2.2.5,
dynamically linked (uses shared libs), not stripped
[root@localhost Ctest]# size test //此二进制可执行文件结构情况
//代码区 静态数据/全局初始化数据区 未初始化数据区 十进制总和 十六进制总和 文件名
text data bss dec hex filename
906 284 4 1194 4aa test
可以看出,此可执行程序在存 储时(没有调入到内存)分为代码区(text)、数 据区( data)
和未初始化数据区(bss)3 个部分。
(1)代码区 (text segment)。存放 CPU 执行的机器指令(machine instructions)。通常,
代码区是可共享的(即另外的 执行程序可以调用它),因为对于频繁被执行的程序,只需要在
内存中有一份代码即可。代码区通常是只读的,使其只读的原因是防止程序意外地修改了它
的 指令。另外,代码区还规划了局部变量的相关信息。
(2)全局初始化数据区/静态数据区(initialized data segment/data segment)。该区包含了
在程序中明确被初始化的全局变量、静态变量(包括全局静态变量和局部静态变量)和常量
数 据(如字符串常量)。例如,一个不在任何函数内的声明(全局数据):
int maxcount = 99;
使得变量 maxcount 根据其初始值被存储到初始化数据区中。
static mincount=100;
这声明了一个静态数据,如果是在 任何函数体外声明,则表示其为一个全局静态变量,
如果在函数体内(局部),则表示其为一个局部静态变量。另外,如果在函数名前加上 static,
则表示此函数只能在当前文件中被调用。
(3)未初始化数据区。亦称 BSS 区(uninitialized data segment),存入的是全局未初始化
变量。BSS 这个叫法是根据一个早期的汇编运算符而来,这个汇编运算符标志着一个块的开
始。 BSS 区的数据在程序开始执行之前被内核初始化为 0 或者空指针(NULL)。例如一个不
在任何函数内的声明:
long sum[1000];
将变量 sum存储到未初始化数据区。
图 3-1 所示为可执行代码存储时结构和运行时结构的对照图。一个正在运行着的 C 编译程序
占用的内存分为代码区、初始化数据区、未初始化数据区、堆区和 栈区 5 个部分。

可执行代码
(代码区)
已初始化全局变量、静态变量
和常量数据(数据区)
堆区
(向上增长)
栈区
(向 下增长)
未初始化全局变量
(BSS区,用零初始化)
可执行代码
(代码区)
已初始化全局变量、静态变量
和 常量数据(数据区)
未初始化变量
(BSS区,用零初始化)
高地址
低地址
存储时三个区域
(用size查 看)
运行时的五
个区域
存储时的 3 个区域
(用 size 查看)
运行时的 5 个区域

图 3-1 C 程序的内存布局
(1)代码区(text segment)。代码区指令根据程序设计流程依次执行,对于顺序指令,
则 只会执行一次(每个进程),如果反复,则需要使用跳转指令,如果进行递归,则需要借助
栈来实现。
代码区的指令中包括操作码和要操作的对 象(或对象地址引用)。如果是立即数(即具体
的数值,如 5),将直接包含在代码中;如果是局部数据,将在栈区分配空间,然后引用该数
据 地址;如果是 BSS 区和数据区,在代码中同样将引用该数据地址。

 

(2)全局初始化数据区/静态数据区(Data Segment)。只初始化一次。
(3)未初始化数据区(BSS)。在运行时改变其值。
(4) 栈区(stack)。由编译器自动分配释放,存放函数的参数值、局部变量的值等。其
操作方式类似于数据结构中的栈。每当一个函数被调用,该函数返 回地址和一些关于调用的
信息,比如某些寄存器的内容,被存储到栈区。然后这个被调用的函数再为它的自动变量和
临时变量在栈区上分配空间, 这就是 C 实现函数递归调用的方法。每执行一次递归函数调用,
一个新的栈框架就会被使用,这样这个新实例栈里的变量就不会和该函数的另一个实例 栈里
面的变量混淆。
(5)堆区(heap)。用于动态内存分配。堆在内存中位于 bss 区和栈区之间。一般由程序
员分配和释 放,若程序员不释放,程序结束时有可能由 OS 回收。
之所以分成这么多个区域,主要基于以下考虑:
l 一个进程在运行过程中,代码是根据流程依次执行的,只需要访问一次,当然跳转
和递归有可能使代码执行多次,而数据一般都需要访问多次,因此单独开 辟空间以
方便访问和节约空间。
l 临时数据及需要再次使用的代码在运行时放入栈区中,生命周期短。
l 全局数据和静态数据有可能在整个程序执行过程中都需要访问,因此单独存储管理。
l 堆区由用户自由分配,以便管理。
下面通过一段简单 的代码来查看 C 程序执行时的内存分配情况。相关数据在运行时的位
置如注释所述。 //main.cpp
int a = 0; //a 在全局已初始化数据区
char *p1; //p1 在 BSS 区(未初始化全局变量)
main()
{
int b; //b 在栈区
char s[] = "abc"; //s 为数组变量,存储在栈区,
//“abc”为字符串常量,存储在已初始化数据区
char *p1,p2; //p1、p2 在栈区
char *p3 = "123456"; //123456/0 在已初始化数据区,p3 在栈区
static int c =0; //C 为全局(静态)数据,存在于已初始化数据区
//另外,静态数据会自动初始化
p1 = (char *)malloc(10); //分配得来的 10 个字节的区域在堆区
p2 = (char *)malloc(20); //分配得来的 20 个字节的区域在堆区
free(p1);
free(p2);
}
2.内存分配方式
在 C 语言中,对象可以使用静态或动态的方式分配内存空间。
l 静态分配:编译器在处理程序源代码时分配。
l 动态分配:程序在执行时调用 malloc 库函数申请分配。
静态内存分配是在程序执行之前进行的因而效率比较高,而动态内存分配则可以灵活的
处理未知数目的。
静 态与动态内存分配的主要区别如下:
l 静态对象是有名字的变量,可以直接对其进行操作;动态对象是没有名字的变量,
需要通过指针间接地 对它进行操作。
l 静态对象的分配与释放由编译器自动处理;动态对象的分配与释放必须由程序员
显式地管理,它通过 malloc()和 free 两个函数(C++中为 new 和 delete 运算符)来
完成。
以下是采用静态分配方式的例子。
int a=100;
此行代码指示编译器分配足够的存储区以存放一个整型值,该存储区与名字 a 相关联,
并用数值 100 初始化该存储区。
以下是采用动态分配方式的例子。
p1 = (char *)malloc(10*sizeof(int)); //分配得来得 10*4 字节的区域在堆区
此行代码分配了 10 个 int 类型的对象,然后返回对象在内存中的地址,接着这个地址被
用来初始化指 针对象 p1,对于动态分配的内存唯一的访问方式是通过指针间接地访问,其释
放方法为:
free(p1);

你可能感兴趣的:(数据结构,c,linux,汇编,存储,编译器)