Linux中的BSS段、数据段、堆栈段和代码段

进程（执行的程序）会占用一定数量的内存，它或是用来存放从磁盘载入的程序代码，或是存放取自用户输入的数据等等。不过进程对这些内存的管理方式因内存用途不一而不尽相同，有些内存是事先静态分配和统一回收的，而有些却是按需要动态分配和回收的。对任何一个普通进程来讲，它都会涉及到5种不同的数据段。

Linux进程的5个段

BSS段：BSS段（bss segment）通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

----------------

bss段在可执行文件中不占用位置。程序运行前才开辟并清零。
比如int a[100]，在可执行文件中没有记录100个0，而只是记录了a符号和a所用内存的大小。

bss段的大小,记录在段表里里,记录的是所有未初始化变量总共的大小,bss段只在段表里有个记录,但实现并不存在这个段.

每个未初始化的变量的大小放在了符号表里了呀
static int g;
static short int h;
int main(){}
你看下面符号表中的4 ,2分别就是g,h的大小

用readelf -s 或 objdump -t 查看符号表
用readelf -S 或 objdump -h 查看段表
不过感觉readelf的格式要好看一些

------------------

数据段：数据段（data segment）通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

代码段：代码段（code segment/text segment）通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定，并且内存区域通常属于只读, 某些架构也允许代码段为可写，即允许修改程序。在代码段中，也有可能包含一些只读的常数变量，例如字符串常量等。

堆（heap）：堆是用于存放进程运行中被动态分配的内存段，它的大小并不固定，可动态扩张或缩减。当进程调用malloc等函数分配内存时，新分配的内存就被动态添加到堆上（堆被扩张）；当利用free等函数释放内存时，被释放的内存从堆中被剔除（堆被缩减）

栈(stack)：栈又称堆栈，是用户存放程序临时创建的局部变量，也就是说我们函数括弧“{}”中定义的变量（但不包括static声明的变量，static意味着在数据段中存放变量）。除此以外，在函数被调用时，其参数也会被压入发起调用的进程栈中，并且待到调用结束后，函数的返回值也会被存放回栈中。由于栈的先进后出特点，所以栈特别方便用来保存/恢复调用现场。从这个意义上讲，我们可以把堆栈看成一个寄存、交换临时数据的内存区。它是由操作系统分配的，内存的申请与回收都由OS管理。

PS：

全局的未初始化变量存在于.bss段中，具体体现为一个占位符；

全局的已初始化变量存于.data段中；

函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的，其内容由操作系统初始化（清零）；而.data却需要占用，其内容由程序初始化，因此造成了上述情况。

bss段（未手动初始化的数据）并不给该段的数据分配空间，只是记录数据所需空间的大小。
data（已手动初始化的数据）段则为数据分配空间，数据保存在目标文件中。数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到，然后链接器得到这个大小的内存块，紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。

/*******************************************************************/

在计算机领域，堆栈是一个不容忽视的概念，但是很多人甚至是计算机专业的人也没有明确堆栈其实是两种数据结构。堆栈都是一种数据项按序排列的数据结构，只能在一端(称为栈顶(top))对数据项进行插入和删除。

一、预备知识—程序的内存分配
    一个由C/C++编译的程序占用的内存分为以下几个部分
   1、栈区（stack）— 由编译器自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中的栈。
   2、堆区（heap） — 一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式倒是类似于链表。
   3、全局区（静态区）（static）—，全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。 - 程序结束后由系统释放。
4、文字常量区 —常量字符串就是放在这里的。程序结束后由系统释放。
   5、程序代码区—存放函数体的二进制代码。

二、例子程序
这是一个前辈写的，非常详细
//main.cpp
int a = 0; 全局初始化区
char *p1; 全局未初始化区

int main()
   {
       int b;                   //栈
       char s[] = "abc";   //栈
       char *p2;              //栈
       char *p3 = "123456"; //123456\0在常量区，p3在栈上。
       static int c =0；          //全局（静态）初始化区
       p1 = (char *)malloc(10);
       p2 = (char *)malloc(20);

       return 0;
   }
   分配得来得10和20字节的区域就在堆区。
   strcpy(p1, "123456"); //123456\0放在常量区，编译器可能会将它与p3所指向的"123456"优化成一个地方。

   1.申请方式
   stack:
   由系统自动分配。例如，声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间
   heap:
   需要程序员自己申请，并指明大小，在c中malloc函数
   如p1 = (char *)malloc(10);
   在C++中用new运算符
   如p2 = new char[20];//(char *)malloc(10);
   但是注意p1、p2本身是在栈中的。

   2.申请后系统的响应
   栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。
   堆：首先应该知道操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序，另外，对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的delete语句才能正确的释放本内存空间。另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。

   3.申请大小的限制
   栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在 WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。
   堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

   4.申请效率的比较
   栈由系统自动分配，速度较快。但程序员是无法控制的。
   堆是由new分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.
   另外，在WINDOWS下，最好的方式是用VirtualAlloc分配内存，他不是在堆，也不是在栈,而是直接在进程的地址空间中保留一快内存，虽然用起来最不方便。但是速度快，也最灵活

5.堆和栈中的存储内容
   栈：在函数调用时，第一个进栈的是主函数中函数调用后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。
   当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是主函数中的下一条指令，程序由该点继续运行。
   堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。

   6.存取效率的比较

   char s1[] = "aaaaaaaaaaaaaaa";
char *s2 = "bbbbbbbbbbbbbbbbb";
   aaaaaaaaaaa是在运行时刻赋值的；
   而bbbbbbbbbbb是在编译时就确定的；
   但是，在以后的存取中，在栈上的数组比指针所指向的字符串(例如堆)快。
   比如：
   #include
   void main()
   {
       char a = 1;
       char c[] = "1234567890";
       char *p ="1234567890";
       a = c[1];
       a = p[1];
       return;
   }
   对应的汇编代码
   10: a = c[1];
   00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
   0040106A 88 4D FC mov byte ptr [ebp-4],cl
   11: a = p[1];
   0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
   00401070 8A 42 01 mov al,byte ptr [edx+1]
   00401073 88 45 FC mov byte ptr [ebp-4],al
第一种在读取时直接就把字符串中的元素读到寄存器cl中，而第二种则要先把指针值读到edx中，在根据edx读取字符，显然慢了。

7.小结：
   堆和栈的区别可以用如下的比喻来看出：
   使用栈就象我们去饭馆里吃饭，只管点菜（发出申请）、付钱、和吃（使用），吃饱了就走，不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作，他的好处是快捷，但是自由度小。
   使用堆就象是自己动手做喜欢吃的菜肴，比较麻烦，但是比较符合自己的口味，而且自由度大。

堆和栈的区别主要分：
   操作系统方面的堆和栈，如上面说的那些，不多说了。
   还有就是数据结构方面的堆和栈，这些都是不同的概念。这里的堆实际上指的就是（满足堆性质的）优先队列的一种数据结构，第1个元素有最高的优先权；栈实际上就是满足先进后出的性质的数学或数据结构。
   虽然堆栈，堆栈的说法是连起来叫，但是他们还是有很大区别的，连着叫只是由于历史的原因。

Linux中的BSS段、数据段、堆栈段和代码段

你可能感兴趣的:(linux/c)