文章首发
前言
大家好,我是只讲技术干货的会玩code,今天是【重学C++】的第一讲,我们来学习下C++的内存管理。
与java、golang等自带垃圾回收机制的语言不同,C++并不会自动回收内存。我们必须手动管理堆上内存分配和释放,这往往会导致内存泄漏和内存溢出等问题。而且,这些问题可能不会立即出现,而是运行一段时间后,才会暴露出现,排查也很困难。因此,了解和掌握C++中的内存管理技巧和工具是非常重要的,可以提高程序性能、减少错误和增加安全性。
内存分区
在C++中,将操作系统分配给程序的内存空间按照用途划分了代码段、数据段、栈、堆几个不同的区域,每个区域都有其独特的内存管理机制。
代码区
代码区是用于存储程序代码的区域,代码段在程序真正执行前就被加载到内存中,在程序执行期间,代码区内存不会被修改和释放。
由于代码区是只读的,所以会被多个进程共享。在多个进程同时执行同一个程序时,操作系统只需要将代码段加载到内存中一次,然后让多个进程共享这个内存区域即可。
数据段
数据段用于存储静态全局变量、静态局部变量和静态常量等静态数据。在程序运行期间,数据段的大小固定不变,但其内容可以被修改。按照变量是否被初始化。数据段可分为已初始化数据段和未初始化数据段。
栈
C++中函数调用以及函数内的局部变量的使用,都是通过栈这个内存分区实现的。栈分区由操作系统自动分配和释放,是一种"后进先出"的一种内存分区。每个栈的大小是固定的,一般只有几MB,所以如果栈变量太大,或者函数调用嵌套太深,容易发生栈溢出(stack overflow)。
先来一段示例代码,看看C++是如何使用栈进行使用栈来进行函数调用的。
#include
void inner(int a) {
std::cout << a << std::endl;
}
void outer(int n) {
int a = n + 1;
inner(a);
}
int main() {
outer(4);
}
每当程序调用一个函数时,该函数的参数、局部变量和返回地址等信息会被压入栈中。当函数执行完毕,再将这些信息从栈中弹出。根据之前压入的外层调用者压入栈的返回地址,返回到外层调用者未执行的代码继续执行。
本地变量是直接存储在栈上的,当函数执行完成后,这些变量占用的内存就会被释放掉了。前面例子中的本地变量是简单类型,在C++中称为POD类型。对于带有构造和析构函数的非POD类型变量,栈上的内存分配同样有效。编译器会在合适的时机,插入对构造函数和析构函数的调用。
这里有个问题,当函数执行发生异常时,析构函数还会被调用吗?
答案是会的,C++对于发生异常时对析构函数的调用称为"栈展开"。通过下面这段代码演示栈展开。
#include
#include
class Obj {
public:
std::string name_;
Obj(const std::string& name):name_(name){std::cout << "Obj() " << name_ << std::endl;};
~Obj() {std::cout << "~Obj() " << name_ << std::endl;};
};
void bar() {
auto o = Obj{"bar"};
throw "bar exception";
}
int main() {
try {
bar();
} catch (const char* e) {
std::cout << "catch Exception: " << e << std::endl;
}
}
执行代码的结果是:
Obj() bar
~Obj() bar
catch Exception: bar exception
可以发现,发生异常时,bar
函数中的本地变量o
还是能被正常析构。
栈展开的过程实际上是异常发生时,匹配catch子句的过程。
- 程序抛出异常,停止当前执行的调用链,开始寻找与异常匹配的catch子句。
- 如果异常发生在try中,则会首先检查与该try块匹配的catch子句。如果异常所在函数体没有try捕获异常。则会直接进入下一步。
- 如果第二步未找到匹配的catch,则会在外层的try块中查找,直到找到为止。
- 如果到了最外层还没有找到匹配的catch,也就是说异常得不到处理,程序会调用标准库函数terminate终止函数的执行。
在这期间,栈上所有的对象都会被自动析构。
堆
堆是C++中用来存储动态分配内存的内存分区,堆内存的分配和释放需要手动管理,可以通过new/delete或malloc/free等函数进行分配和释放。堆内存的大小通常是不固定的,当我们需要动态分配内存时,就可以使用堆内存。
堆内存由程序员手动分配和释放,因此使用堆内存需要注意内存泄漏和内存溢出等问题。当程序员忘记释放已分配的内存时,会导致内存泄漏问题。而当申请的堆内存超过了操作系统所分配给进程的内存限制时,会导致内存溢出问题。
C++程序绝大多数的内存泄露,都是由于忘记调用delete/free来释放堆上的资源。
还是上代码
#include
#include
class Obj {
public:
std::string name_;
Obj(const std::string& name):name_(name){std::cout << "Obj() " << name_ << std::endl;};
~Obj() {std::cout << "~Obj() " << name_ << std::endl;};
};
Obj* makeObj() {
Obj* obj = nullptr;
try {
obj = new Obj{"makeObj"};
...
} catch(...) {
delete obj;
throw;
}
return obj;
}
Obj* foo() {
Obj* obj = nullptr;
try {
obj = makeObj();
...
} catch(...) {
delete obj;
}
return obj;
}
int main() {
Obj* obj = foo();
...
delete obj;
}
可以看到,由makeObj
函数创建的堆变量obj
, 在每个获取该变量的上层调用中,都需要关心对该变量的处理。这无疑极大得增加了开发者的心智负担。
RAII
想在堆上创建对象,又不想处理这么复杂的内存释放操作。C++没有像java、golang其他语言创建一套垃圾回收机制,而是采用了一种特有的资源管理方式 --- RAII(Resource Acquisition Is Initialization,资源获取即初始化)。
RAII利用栈对象在作用域结束后会自动调用析构函数的特点,通过创建栈对象来管理资源。在栈对象构造函数中获取资源,在栈对象析构函数中负责释放资源,以此保证资源的获取和释放。
下面给出一个通过RAII来自动释放堆内存的例子
#include
class AutoIntPtr {
public:
AutoIntPtr(int* p = nullptr) : ptr(p) {}
~AutoIntPtr() { delete ptr; }
int& operator*() const { return *ptr; }
int* operator->() const { return ptr; }
private:
int* ptr;
};
void foo() {
AutoIntPtr p(new int(5));
std::cout << *p << std::endl; // 5
}
int main() {
foo();
}
上面例子中,AutoIntPtr
类封装了一个动态分配的int
类型的指针,它的构造函数用于获取资源(ptr = p),析构函数用于释放资源(delete ptr)。当AutoIntPtr
超出作用域时,自动调用析构函数来释放所包含的资源。
基于RAII,C++11引入了std::unique_ptr
和std::shared_ptr
等智能指针用于内存管理类,使得内存管理变得更加方便和安全。这些内存管理类可以自动进行内存释放,避免了手动释放内存的繁琐工作。值得一提的是,上面的AutoIntPtr
就是一个简化版的智能指针了。
在实际开发中,RAII的应用很广。不仅仅用于自动释放内存。还可以用来关闭文件、释放数据库连接、释放同步锁等。
总结
本文介绍了C++中的内存管理机制,包括内存分区、栈、堆和RAII技术等内容。通过学习本文,我们可以更好地掌握C++的内存管理技巧,避免内存泄漏和内存溢出等问题。