改善C++ 程序的150个建议学习之建议27:区分内存分配的方式

第3章 说一说“内存管理”的那点事儿
       在C++的世界里,“烫”和“屯”是我们遇到得最多的两个汉字(限于VC用户)。可能有人不禁要问:这是为什么呢?答案是:在VC中,栈空间未初始化的字符默认是-52,补码是0xCC。两个0xCC ,即0xCCCC在GBK编码中就是“烫”;堆空间未初始化的字符默认是-51,两个-51在GBK编码中就是“屯”。 二者都是未初始化的内存。C++赋予了我们直接面对内存、操作内存的能力,但是内存管理却一直以来被认为是C++语言的一大难点。因为在C++语言中,缺少GC(垃圾回收器),内存管理需要程序员手动完成,并且还要为可能的失误承担后果。

正如下面的“代码故事”:

#include
#include
/*
在经历过无数的"烫烫烫烫烫","屯屯屯屯屯屯"之后,我们都知道了:内存原来是可以驾驭的...
*/
int main()
{
/*
原来内存管理是这样的,即便结果完美无缺,但却危机四伏...
*/
const char *src="Hello Csdn!";
char *dest=(char*) malloc(strlen(src));
memcpy(dest,src,strlen(src)+1);
printf("%s\n",dest);
return 0;
}
/*
代码结束了,故事也到此为止。但是我们要做的还很多。希望我们能少遇到一点烫和屯...
*/
所以,我们要说说内存管理那点事儿,争取早日练就内存管理的高深技艺。

建议27:区分内存分配的方式

在C/C++语言中,用内存管理的水平去划分高手与菜鸟已经成为一种不成文的约定:可以从中获得更好的性能、更大自由的被称作C++高手,而程序经常面临着莫名其妙的崩溃,一遍遍的调试,费时又费力的则可能是菜鸟级别的。而这一切都源于那让人又爱又恨的C++内存管理的灵活性。其中,多样的内存分配方式就是其灵活性的最好例证之一。一个程序要运行,就必须先将可执行的程序加载到计算机内存里,程序加载完毕后,就可以形成一个运行空间,并按照图3-1所示的那样进行布局。

改善C++ 程序的150个建议学习之建议27:区分内存分配的方式_第1张图片

代码区(Code Area)存放的是程序的执行代码;

数据区(Data Area)存放的是全局数据、常量、静态变量等;

堆区(Heap Area)存放的则是动态内存,供程序随机申请使用;

栈区(Stack Area)则存放着程序中所用到的局部数据。

这些数据可以动态地反应程序中对函数的调用状态,通过其轨迹也可以研究其函数机制。其中,除了代码区不是我们能在代码中直接控制的,剩余三块都是我们编码过程中可以利用的。在C++中,数据区又被分成自由存储区、全局/静态存储区和常量存储区,再加上堆区、栈区,也就是说内存被分成了5个区。这5种不同的分区各有所长,适用于不同的情况。

栈(Stack)区
在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元将自动被释放。栈内存分配运算内置于处理器的指令集中,效率很高,但是所分配的内存容量有限。
堆(Heap)区
堆就是那些由new分配的内存块,其释放编译器不会管它,而是由我们的应用程序控制它,一般一个new就要对应一个delete。如果程序员没有释放掉,那么在程序结束后,操作系统就会自动回收。
自由存储区
自由存储区是那些由malloc等分配的内存块,它和堆十分相似,不过它是用free来结束自己生命的。
全局/静态存储区
全局变量和静态变量被分配到同一块内存中,在以前的C语言中,全局变量又分为初始化的和未初始化的,在C++里面没有作此区分,它们共同占用同一块内存区。
常量存储区
这是一块比较特殊的存储区,里面存放的是常量,不允许修改。上述5种分区中,最常用的就是堆与栈,容易混淆的也是堆与栈。在BBS论坛里,代码区,数据区
,堆区,栈区几乎到处都能看到堆与栈的争论。堆与栈的区分问题,似乎是每一个C++程序员成长路上都会遇到的永恒话题。那么堆与栈之间到底有什么分别与联系呢?这就是接下来我要阐述的问题。
首先,还是分析下面的代码片段:
const int COUNT = 10;
void Function()
{
string* pStr = new string[COUNT]; 
}
你是否相信就这么简单的一个函数,它却涉及了5种内存分区中的3种呢?COUNT是一个常量,被安置在了常量存储区,不可修改;pStr是局部变量,理所应当地放入栈里;而通过new string[COUNT]获得的则是一块堆空间。多么精妙,多么不可思议!当然,上述代码片段只是一个示例,是经不起推敲的,因为它会引起内存泄露(缺少与new对应的delete去释放内存)。似乎脱离了主题,还是言归正传,说说堆与栈的区别。总的来说,二者的区别主要有以下几个方面:
管理方式不同
对于栈来讲,它是由编译器自动管理的,无须我们手工控制;对于堆来说,它的释放工作由程序员控制,容易产生memory leak。
空间大小不同
一般来讲在32位系统下,堆内存可以达到4GB的空间,从这个角度来看堆内存几乎是没有什么限制的。但是对于栈来讲,一般都是有一定空间大小的。
碎片问题
对于堆来讲,频繁的new/delete势必会造成内存空间的不连续,从而产生大量的碎片,使程序效率降低。对于栈来讲,则不存在这个问题,其原因还要从栈的特殊数据结构说起。
栈是一个具有严明纪律的队列,其中的数据必须遵循先进后出的规则,相互之间紧密排列,绝不会留给其他数据可插入之空隙,所以永远都不可能有一个内存块从栈中间弹出,它们必须严格按照一定的顺序一一弹出。
生长方向
对于堆来讲,其生长方向是向上的,也就是向着内存地址增加的方向增长;对于栈来讲,
它的生长方向是向下的,是向着内存地址减小的方向增长的。
分配方式
堆都是动态分配的,没有静态分配的堆。栈有两种分配方式:静态分配和动态分配。静态分配是编译器完成的,比如局部变量的分配。动态分配由alloca函数完成,但是栈的动态分配和堆是不同的,它的动态分配是由编译器进行释放的,无须我们手工实现。
分配效率
栈是机器系统提供的数据结构,计算机会在底层对栈提供支持:它会分配专门的寄存器存放栈的地址,而且压栈出栈都会有专门的指令来执行,这就决定了栈的效率比较高。堆则是C/C++函数库提供的,它的机制很复杂,例如为了分配一块内存,库函数会按照一定的算法(具体的算法可以参考数据结构/操作系统)在堆内存中搜索可用的足够大小的空间,如果没有足够大小的空间(可能是由于内存碎片太多),则可能调用系统功能去增加程序数据段的内存空间,这样就有机会分到足够大小的内存了,然后返回。显然,堆的效率比栈要低得多。

堆和栈相比,由于堆使用了大量new/delete,容易造成大量的内存碎片,而且它没有专门的系统支持,效率很低,另外它还可能引发用户态和核心态的切换,以及内存的申请,代价会变得很高。所以栈在程序中是应用最广泛的,就算是函数的调用也会利用栈去完成,函数调用过程中的参数、返回的地址、EBP和局部变量都是采用栈的方式存放的。所以,我们推荐大家尽量多用栈,而不是用堆。虽然栈有如此多的好处,但是由于和堆相比它不是那么灵活,有时候会分配大量的内存空间,在遇到这种情况时还是用堆好一些。

请记住:内存分配具有多种不同的方式,它们各具特点,适用于不同的情形。所以,要在合适的地方采用合适的方式完成内存的分配。

你可能感兴趣的:(c/c++/mfc/qt,c++,内存分配)