可执行程序在存储时(没有调到内存),分为代码区(text)、数据区(data)和未初始化数据区(bss)3个部分
①代码区(text segment) 存放CPU执行的机器指令。通常,代码区是可共享的(即另外的执行程序可以调用它),因为对于频繁的被执行程序,只需要在内存中有一份代码即可。代码区通常是只读的,使其只读的原因是防止程序意外的修改它的指令。另外代码区还规划了局部变量的相关信息
②全局初始化数据区/静态数据区(innitialized data segment)。该区域包含了在程序中明确被初始化的全局变量,静态变量(包括全局静态变量和局部静态变量)和常量数据(如字符串常量)。
③未初始化数据区(BSS区,uninitialized data segment) 存入的是全局未初始化变量。BSS区的数据在程序开始执行前被内核初始化为0或者空指针(NULL)
如图一个正运行着的c编译程序占用的内存分为代码区、初始化数据区、未初始化数据区、堆区和栈区5个部分。
①代码区 代码区指令根据程序设计流程一次执行,对于顺序指令,则只会执行一次(每个进程),如果反复,则需要跳转指令,如果进行递归,需要借助栈来实现。 代码区的指令中包括操作码和要操作的对象(或对象地址引用)。如果是立即数,将直接包含在代码中,如果是局部数据,将在栈去分配空间,然后引用该数据地址。如果是在BSS区和数据区,在代码中同样将引用改地址数据。
②全局初始化数据/静态数据区 只初始化一次。已初始化数据是在程序中声明,并且具有初值的变量,这些变量需要占用存储器的空间,在程序执行他们需要位于可读写的内存区域内,并且有初值,给程序运行时读写,在程序中一般为已经为初始化的全局变量,已经初始化的静态局部变量
③未初始化数据区(BSS) 在运行时改变其值.未初始化数据在程序中声明,但是没有初始化的变量,这些变量在程序运行前不需要占用存储器的空间。与读写数据段类似,它也属于静态数据区。但是该段中数据没有经过初始化。未初始化数据段只有在运行的初始化阶段才会产生,因此它的大小不会影响目标文件的大小。在程序中一般是没有初始化的全局变量和没有初始化的静态局部变量
④栈区 由编译器自动分配释放,存放行数的参数值,局部变量的值等等。其操作方式类似于数据结构中的栈。每当一个函数被调用,该函数返回地址和一些关于调用的信息,比如寄存器的内容,被存储到栈区。然后这个被调用的函数再为它的自动变量和临时变量在栈区分配空间,这就是C实现函数递归调用的方法。每执行一次递归函数调用每一个新的栈框架就会被使用,这样这个新实例栈里面的变量就不会和该函数的另一个实例栈里面的变量混淆。
⑤堆区 用于动态内存分配。堆在内存中位于BSS区和栈区之间,一般由程序员分配和释放,不释放的话,程序结束时有可能由OS回收。
之所以分为5个区域,主要基于以下考虑:一个进程在运行过程中,代码是根据流程一次执行的,只要访问一次,当然跳转和递归有可能使代码执行多次,而数据一般都需要访问多次,因此单独开辟空间可以方便访问和节约空间。
临时数据及需要再次使用的代码在运行时放入栈区中生命周期短。
全局数据和静态数据有可能在整个程序执行过程中都需要访问,因此单独存储管理。
堆区由用户自由分配,方便管理
下面是网上一个典型的例子来帮助理解C程序内存分配:
内存分配方式:
在C语言中,对象可以使用静态或动态的方式分配内存空间。
静态分配:编译器在处理程序源代码时分配。
动态分配:程序在执行时调用malloc库函数申请分配。
静态内存分配是在程序执行之前进行的,因而效率比较高,而动态内存分配则可以灵活处理数据。
静态与动态内存分配的主要区别如下:
静态对象是有名字的变量,可以直接对其进行操作;动态对象是没有名字的变量,需要通过指针间接地对它进行操作。
注:这里我的理解有 如果我们在程序中有写malloc,它是静态对象还是动态对象(这是针对“动态对象是没有名字的变量”)
解答:我的理解有问题,malloc出来的就是在堆中开辟内存空间,是没有名字的。
如:p1 = (char *)malloc(sizeof(int)); //此行代码分配了一个int类型大小的区域在堆区(对象),然后返回对象在内存中的地址,接着这个地址被用来初始化指针对象p1,对于动态分配的内存唯一的访问方式是通过指针间接地访问。
静态对象的分配与释放由编译器自动处理;动态对象的分配与释放必须由程序员显式地管理,它通过malloc()和free()两个函数(C++中为new和delete运算符)来完成。
1.申请方式
(1)栈(satck):由系统自动分配。例如,声明在函数中一个局部变量int b;系统自动在栈中为b开辟空间。
(2)堆(heap):需程序员自己申请(调用malloc,realloc,calloc),并指明大小,并由程序员进行释放。容易产生memory leak.
eg:char p;
p = (char *)malloc(sizeof(char));
但是,p本身是在栈中。
2.申请大小的限制
(1)栈:在windows下栈是向底地址扩展的数据结构,是一块连续的内存区域(它的生长方向与内存的生长方向相反)。栈的大小是固定的。如果申请的空间超过栈的剩余空间时,将提示overflow。
(2)堆:堆是高地址扩展的数据结构(它的生长方向与内存的生长方向相同),是不连续的内存区域。这是由于系统使用链表来存储空闲内存地址的,自然是不连续的,而链表的遍历方向是由底地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。
3.系统响应:
(1)栈:只要栈的空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。
(2)堆:首先应该知道操作系统有一个记录空闲内存地址的链表,但系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统,会在这块内存空间中的首地址处记录本次分配的大小,这样,代码中的free语句才能正确的释放本内存空间。另外,找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。
说明:对于堆来讲,对于堆来讲,频繁的new/delete势必会造成内存空间的不连续,从而造成大量的碎片,使程序效率降低。对于栈来讲,则不会存在这个问题,
4.申请效率
(1)栈由系统自动分配,速度快。但程序员是无法控制的
(2)堆是由malloc分配的内存,一般速度比较慢,而且容易产生碎片,不过用起来最方便。
5.堆和栈中的存储内容
(1)栈:在函数调用时,第一个进栈的主函数中后的下一条语句的地址,然后是函数的各个参数,参数是从右往左入栈的,然后是函数中的局部变量。注:静态变量是不入栈的。
当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是主函数中的下一条指令,程序由该点继续执行。
(2)堆:一般是在堆的头部用一个字节存放堆的大小。
6.存取效率
(1)堆:char *s1=”hellow tigerjibo”;是在编译是就确定的
(2)栈:char s1[]=”hellow tigerjibo”;是在运行时赋值的;用数组比用指针速度更快一些,指针在底层汇编中需要用edx寄存器中转一下,而数组在栈上读取。
补充:
栈是机器系统提供的数据结构,计算机会在底层对栈提供支持:分配专门的寄存器存放栈的地址,压栈出栈都有专门的指令执行,这就决定了栈的效率比较高。堆则是C/C++函数库提供的,它的机制是很复杂的,例如为了分配一块内存,库函数会按照一定的算法(具体的算法可以参考数据结构/操作系统)在堆内存中搜索可用的足够大小的空间,如果没有足够大小的空间(可能是由于内存碎片太多),就有可能调用系统功能去增加程序数据段的内存空间,这样就有机会分到足够大小的内存,然后进行返回。显然,堆的效率比栈要低得多。
7.分配方式:
(1)堆都是动态分配的,没有静态分配的堆。
(2)栈有两种分配方式:静态分配和动态分配。静态分配是编译器完成的,比如局部变量的分配。动态分配由alloca函数进行分配,但是栈的动态分配和堆是不同的。它的动态分配是由编译器进行释放,无需手工实现。