作者:@阿亮joy.
专栏:《吃透西嘎嘎》
座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根
从C语言的角度来看内存,可以将内存简单地划分为栈区、堆区、静态区和常量区。
而从操作系统的角度来说,将内存划分为内核空间、栈区、内存映射段、堆区、数据段(静态区)和代码段(常量区)。
那为什么操作系统要把内存划分为一个个区域呢(分段)?其实这样子划分,是为了更好地管理数据,提高效率。因为不同的数据有着不同的性质。那有什么性质呢?我们一起来看看。
- 栈区:保存局部变量。栈上的内容只在函数的范围内存在,当函数运行结束这些内容也会自动被销毁。其特点是效率高,但空间大小有限。
- 堆:由 malloc 系列函数或 new 操作符分配的内存。其生命周期由 free 或delete 决定。在没有释放之前一直存在,直到程序结束。其特点是使用灵活,空间比较大,但容易出错。
- 数据段(静态区):保存自动全局变量和 static 变量(包括 static 全局和局部变量)。静态区的内容在整个程序的生命周期内都存在,由编译器在编译的时候分配。
- 代码段(常量区):存储可执行代码(二进制指令代码)和只读常量,这个区域的数据是被硬件保护的,不可以修改里面的数据。
注:栈区是向下增长的,堆区是向上增长的。局部变量和堆区的数据不会提前创建,而是随着栈帧的创建而创建,只有全局数据和静态数据、常量会被提前创建。栈可以通过函数_alloca进行动态分配,不过注意,所分配空间不能通过free或delete进行释放。堆无法静态分配,只能动态分配。
int globalVar = 1;
static int staticGlobalVar = 1;
void Test()
{
static int staticVar = 1;
int localVar = 1;
int num1[10] = { 1, 2, 3, 4 };
char char2[] = "abcd";
const char* pChar3 = "abcd";
int* ptr1 = (int*)malloc(sizeof(int) * 4);
int* ptr2 = (int*)calloc(4, sizeof(int));
int* ptr3 = (int*)realloc(ptr2, sizeof(int) * 4);
free(ptr1);
free(ptr3);
}
1. 选择题:
选项 : A.栈 B.堆 C.数据段(静态区) D.代码段(常量区)
globalVar在哪里?____ staticGlobalVar在哪里?____
staticVar在哪里?____ localVar在哪里?____
num1 在哪里?____
char2在哪里?____ *char2在哪里?___
pChar3在哪里?____ *pChar3在哪里?____
ptr1在哪里?____ *ptr1在哪里?____
2. 填空题:
sizeof(num1) = ____;
sizeof(char2) = ____; strlen(char2) = ____;
sizeof(pChar3) = ____; strlen(pChar3) = ____;
sizeof(ptr1) = ____;
3. sizeof 和 strlen 区别?
大家可以想一想上面的题目的答案是什么,我把参考答案写在下面,供大家参考。
C C C A A A A A D A B
40 5 4 4/8 4 4/8
- sizeof 是操作符,计算类型、变量或者表达式的大小,单位是字节;而 strlen 是一个库函数,求
'\0'
之前字符出现的个数,也就是求字符串的长度。- 提示:sizeof(数组名),计算的是整个数组的大小。
大家可以根据下图,再想想以上的问题为什么是这个答案。在这里,我只解释一下易错的题目。为什么 *char2 在栈区,而 *pChar3 在数据段呢?字符数组 char2 是在栈区开辟空间的,那么该数组存储的数据也在栈区上。pChar3 存的是存在代码段中“abcd”
的首元素地址,那么 *pChar3 就是字符 a,其是存在代码段的。
64 位操作系统虚拟进程地址空间有 2^24 TB,那我们的硬件能跟上吗?其实虚拟进程地址空间并不是硬件上真正的内存,操作系统会对虚拟进程空间进行分页。分页之后会有页表和物理内存,将虚拟内存和物理内存建立映射关系。
void Test ()
{
int* p1 = (int*) malloc(sizeof(int));
free(p1);
// 1.malloc/calloc/realloc的区别是什么?
int* p2 = (int*)calloc(4, sizeof (int));
int* p3 = (int*)realloc(p2, sizeof(int)*10);
// 这里需要free(p2)吗?不需要
free(p3 );
}
【面试题】
- malloc/calloc/realloc的区别?
- malloc的实现原理? glibc中malloc实现原理
C语言内存管理方式在 C++ 中可以继续使用,但有些地方就无能为力,而且使用起来比较麻烦,因此 C++ 又提出了自己的内存管理方式:通过new和delete操作符进行动态内存管理。
void Test()
{
// 动态申请一个int类型的空间,不会初始化
int* ptr4 = new int;
// 释放空间
delete ptr4;
ptr4 = nullptr;
// 动态申请一个int类型的空间, 并初始化为10
int* ptr5 = new int(10);
delete ptr5;
ptr5 = nullptr;
// 动态申请10个int的空间,不会初始化
int* ptr6 = new int[10];
delete[] ptr6;
ptr6 = nullptr;
// 动态申请10个int的空间,前四个初始化为1 2 3 4,后六个初始化为0
int* ptr7 = new int[10]{ 1,2,3,4 };
delete[] ptr7;
ptr7 = nullptr;
}
注意:申请和释放单个元素的空间,使用new和delete操作符,申请和释放连续的空间,使用new[]和delete[],要匹配起来使用。对于内置类型,new 和 delete 相比于malloc 和 free,除了用法上的区别,没有其他区别。
注:对于自定义类型,new/delete 和 malloc/free 最大区别是 new/delete除了开空间,还会调用自定义类型的构造函数和析构函数,而 malloc/free 不会调用自定义类型的构造函数和析构函数。
有了 new 和delete,那么之前我们写的链表就可以这样子玩了。
#include
using namespace std;
struct ListNode
{
ListNode* _next;
int _val;
ListNode(int val = 0)
:_next(nullptr)
,_val(val)
{}
};
int main()
{
ListNode* n1 = new ListNode(1);
ListNode* n2 = new ListNode(2);
ListNode* n3 = new ListNode(3);
ListNode* n4 = new ListNode(4);
n1->_next = n2;
n2->_next = n3;
n3->_next = n4;
ListNode* cur = n1;
while (cur != nullptr)
{
cout << cur->_val << ' ';
cur = cur->_next;
}
cout << endl;
return 0;
}
相比于C语言构建链表,C++ 构建链表是不是相当的简单,相当的好玩?
new 和 delete 最常见的错误就是不匹配使用。如果不匹配使用,可能会发生意想不到的错误,也有可能不会发生错误。
不匹配使用会不会报错,这取决于 new 和 delete 的底层实现。而其底层实现取决于编译器,所以同一段代码在不同的编译器可能会报错,也可能不会报错。但是不报错并不意味着程序没有问题。
注:以下例子均在 VS2022 上运行。
下图的代码是正确的代码,调用了十次构造函数和析构函数。那如果将 delete[] 改成 delete,会发生什么呢?我们来看一下。
通过下图可以看到,程序直接崩溃挂掉了,并不是内存泄漏。因为内存泄漏不会一下子就会是程序挂掉。
申请对象数组,会调用构造函数10次,delete 由于没有使用 [],此时只会调用一次析构函数,但往往会引发程序崩溃。
我们将自定义类型 A 的析构函数屏蔽掉,再来看看程序会不会直接崩溃掉。
好像程序没有报错哦。那为什么会这个样子呢?那我们就需要了解底层机制的实现了。如果写上 [],编译器认为你申请了多个空间,它会在前面多申请一个空间来存储你申请空间的个数,释放这些内存的时候往前找出申请空间的个数,然后再来释放申请的内存空间。
所以 deletep[ ] 省略 [ ] 时,就会报错,因为释放的位置不对。而如果屏蔽掉自己写的析构函数,那么编译器会自动生成析构函数。编译器自己生成析构函数的话,就不会在前面多开一个字节来存储申请空间的个数,也不会去调用析构函数,所以程序就没有报错。
所以,下面的代码也会有问题。
在前面,我们已经说到了 new/delete 和 malloc/free的一些区别。其实它们还有另一个区别就是:申请空间失败后,处理的手段是不同的。如果 malloc 申请空间失败了,就会返回空指针;而 new 申请空间失败了,会抛出异常。
可以看到,malloc 申请失败,是返回空指针的;而 new 申请失败,会抛出异常。
所以,检查 new 的返回值是没什么意义的,我们只需要写捕获异常就行了。
- new的原理
调用operator new函数申请空间
在申请的空间上执行构造函数,完成对象的构造- delete的原理
在空间上执行析构函数,完成对象中资源的清理工作
调用operator delete函数释放对象的空间- new T[N]的原理
调用operator new[]函数,在operator new[]中实际调用operator new函数完成N个对 象空间的申请在申请的空间上执行N次构造函数- delete[]的原理
在释放的对象空间上执行N次析构函数,完成N个对象中资源的清理
调用operator delete[]释放空间,实际在operator delete[]中调用operator delete来释 放空间
new和delete是用户进行动态内存申请和释放的操作符,operator new 和operator delete是系统提供的全局函数,new在底层调用operator new全局函数来申请空间,delete在底层通过operator delete全局函数来释放空间。
/*
operator new:该函数实际通过malloc来申请空间,当malloc申请空间成功时直接返回;
申请空间失败,尝试执行空 间不足应对措施,如果改应对措施用户设置了,则继续申请,
否则抛异常。
*/
void* __CRTDECL operator new(size_t size) _THROW1(_STD bad_alloc)
{
// try to allocate size bytes
void* p;
while ((p = malloc(size)) == 0)
if (_callnewh(size) == 0)
{
// report no memory
// 如果申请内存失败了,这里会抛出bad_alloc 类型异常
static const std::bad_alloc nomem;
_RAISE(nomem);
}
return (p);
}
// operator delete: 该函数最终是通过free来释放空间的
void operator delete(void* pUserData)
{
_CrtMemBlockHeader* pHead;
RTCCALLBACK(_RTC_Free_hook, (pUserData, 0));
if (pUserData == NULL)
return;
_mlock(_HEAP_LOCK); /* block other threads */
__TRY
/* get a pointer to memory block header */
pHead = pHdr(pUserData);
/* verify block type */
_ASSERTE(_BLOCK_TYPE_IS_VALID(pHead->nBlockUse));
_free_dbg(pUserData, pHead->nBlockUse);
__FINALLY
_munlock(_HEAP_LOCK); /* release other threads */
__END_TRY_FINALLY
return;
}
/*
free的实现
*/
#define free(p) _free_dbg(p, _NORMAL_BLOCK)
operator new 底层也是调用 malloc 函数来申请空间,其将 malloc 函数封装起来,申请空间失败时抛异常,而不是返回空指针,以符合 C++ 面向对象的原则。
通过上述两个全局函数的实现知道,operator new 实际也是通过malloc来申请空间,如果malloc申请空间成功就直接返回,否则执行用户提供的空间不足应对措施,如果用户提供该措施就继续申请,否则就抛异常。operator delete 最终是通过free来释放空间的。
注:下面的代码没有内存泄漏,但是也不要这么写。因为clas A的成员变量是内置类型,没有资源需要释放。
定位new表达式是在已分配的原始内存空间中调用构造函数初始化一个对象。
使用格式:
new (place_address) type或者new (place_address) type(initializer-list) place_address必须是一个指针,initializer-list是类型的初始化列表 。
使用场景:
定位new表达式在实际中一般是配合内存池使用。因为内存池分配出的内存没有初始化,所以如果是自定义类型的对象,需要使用new的定义表达式进行显示调构造函数进行初始化。
#include
using namespace std;
class A
{
public:
A(int a = 0)
: _a(a)
{
cout << "A():" << this << endl;
}
~A()
{
cout << "~A():" << this << endl;
}
private:
int _a;
};
int main()
{
A* p1 = new A;
//A* p2 = new A[10];
delete p1;
p1 = nullptr;
A* p3 = (A*)malloc(sizeof(A));
if (p3 == nullptr)
{
perror("malloc fail");
exit(-1);
}
// 定位new -- 对p3指向的空间显式调用构造函数初始化
new(p3)A(1);
// 显式调用析构函数
p3->~A();
free(p3);
//delete p3;
p3 = nullptr;
return 0;
}
那定位 new 有什么意义呢?这就涉及计算机的池化技术,池化技术可以提高效率。定位new可以对用自己的内存池申请的空间显式调用构造函数初始化。这个东西博主以后在涉猎,现在能力还不行。
malloc/free和new/delete的共同点是:都是从堆上申请空间,并且需要用户手动释放。不同的地方是:
- malloc和free是函数,new和delete是操作符
- malloc申请的空间不会初始化,new可以初始化
- malloc申请空间时,需要手动计算空间大小并传递,new只需在其后跟上空间的类型即可, 如果是多个对象,[]中指定对象个数即可
- malloc的返回值为void*,在使用时必须强转,new不需要,因为new后跟的是空间的类型
- malloc申请空间失败时,返回的是空指针,因此使用时必须判空,new不需要,但是new需 要捕获异常
- 申请自定义类型对象时,malloc/free只会开辟空间,不会调用构造函数与析构函数,而new在申请空间后会调用构造函数完成对象的初始化,delete在释放空间前会调用析构函数完成 空间中资源的清理
什么是内存泄漏:内存泄漏指因为疏忽或错误造成程序未能释放已经不再使用的内存的情况。内存泄漏并不是指内存在物理上的消失,而是应用程序分配某段内存后,因为设计错误,失去了对 该段内存的控制,因而造成了内存的浪费。
内存泄漏的危害:长期运行的程序出现内存泄漏,影响很大,如操作系统、后台服务等等,出现 内存泄漏会导致响应越来越慢,最终卡死。
注:内存泄漏是内存丢了还是指针丢了呢?内存泄漏是指针丢了,无法释放申请的空间。程序结束后,申请的内存会归还给操作系统。
void MemoryLeaks()
{
// 1.内存申请了忘记释放
int* p1 = (int*)malloc(sizeof(int));
int* p2 = new int;
// 2.异常安全问题
int* p3 = new int[10];
Func(); // 这里Func函数抛异常导致 delete[] p3未执行,p3没被释放.
delete[] p3;
}
C/C++程序中一般我们关心两种方面的内存泄漏:
- 堆内存泄漏(Heap leak)
堆内存指的是程序执行中依据须要分配通过malloc / calloc / realloc / new等从堆中分配的一 块内存,用完后必须通过调用相应的 free或者delete删掉。假设程序的设计错误导致这部分 内存没有被释放,那么以后这部分空间将无法再被使用,就会产生Heap Leak。- 系统资源泄漏
指程序使用系统分配的资源,比方套接字、文件描述符、管道等没有使用对应的函数释放掉,导致系统资源的浪费,严重可导致系统效能减少,系统执行不稳定。
- 工程前期良好的设计规范,养成良好的编码规范,申请的内存空间记着匹配的去释放。ps:这个理想状态。但是如果碰上异常时,就算注意释放了,还是可能会出问题。需要下一条智能指针来管理才有保证。
- 采用RAII思想或者智能指针来管理资源。
- 有些公司内部规范使用内部实现的私有内存管理库。这套库自带内存泄漏检测的功能选项。
- 出问题了使用内存泄漏工具检测。ps:不过很多工具都不够靠谱,或者收费昂贵。
总结:
内存泄漏非常常见,解决方案分为两种:1、事前预防型。如智能指针等。2、事后查错型。如泄漏检测工具。
本篇博客主要讲解了C / C+的内存管理,如果大家觉得有收获的话,可以点个三连支持一下!谢谢大家!❣️