每一个不曾起舞的日子都是对生命的辜负
1. C/C++内存分布
2. C语言中动态内存管理
3. C++中动态内存管理
4. operator new与operator delete函数
5. new和delete的实现原理
6. 定位new表达式(placement-new)
7. 常见面试题
在此之前,我们问一个这样的问题:代码是存放在哪里的?是栈、堆、还是静态区或者常量区呢?事实上这个问题的答案与这几个选项无关,代码是存在文件里的。 那我们所提到的栈、堆等存储空间又是怎么回事呢?对于代码来说,只有在代码正在运行的情况下,其不同种类的变量将会由编译器存放在相应的存储空间上,这时才是对于栈、堆、静态区等存储空间的利用。
既然上面的了解了,那我们就可以讨论一下相关问题(运行时的存储位置)
int globalVar = 1;
static int staticGlobalVar = 1;
void Test()
{
static int staticVar = 1;
int localVar = 1;
int num1[10] = { 1, 2, 3, 4 };
char char2[] = "abcd";
const char* pChar3 = "abcd";
int* ptr1 = (int*)malloc(sizeof(int) * 4);
int* ptr2 = (int*)calloc(4, sizeof(int));
int* ptr3 = (int*)realloc(ptr2, sizeof(int) * 4);
free(ptr1);
free(ptr3);
}
1. 选择题:
选项: A.栈 B.堆 C.数据段(静态区) D.代码段(常量区)
globalVar在哪里?____ staticGlobalVar在哪里?____
staticVar在哪里?____ localVar在哪里?____
num1 在哪里?____
char2在哪里?____ *char2在哪里?___
pChar3在哪里?____ *pChar3在哪里?____
ptr1在哪里?____ *ptr1在哪里?____
2. 填空题:
sizeof(num1) = ____;
sizeof(char2) = ____; strlen(char2) = ____;
sizeof(pChar3) = ____; strlen(pChar3) = ____;
sizeof(ptr1) = ____;
那我们就分析一下这几个问题:
选择题:
globalvar: 对于全局变量来说,其与static修饰的静态变量一样,存储在数据段也就是静态区,因此选项为C
staticGlobalVar: 既是全局又是static修饰的变量,因此也为C
staticVar: static修饰的局部变量,也存在静态区,C
localVar: 对于主函数中的此变量,是在主函数开辟的栈帧中存储的,因此是存在栈上的,选项为A
num1: 是数组名,因此也在主函数的栈上,选项为A。
再看一下后六个:
char2: char2是数组,因此在主函数创建的栈上面,A。
*char2: 对于右面的字符串来说,属于常量区,因此这个常量字符串的地址也在常量区,由于
*char2
与其类型不匹配,*char2
为char类型,字符串为const
类型,这时候强转中间就会在栈上产生char类型的临时变量,再将这个临时变量赋给*char2
,因此也在栈上,A。pChar3: 对于
pchar3
,const
修饰的是*pchar3
而不是pchar3
,即pchar3
可以修改,那么pchar3
仍然在栈上。(即常变量也在栈上)*pChar3:
pchar3
是在栈中并且存放的是地址,而这个地址指向的是常量区的常量字符串,也就是*pchar3
,因此选项为D。ptr1: ptr1是在栈上定义的指针变量,因此在栈上
*ptr1:
*ptr1
是ptr1在栈上指向的内容,也就是由栈指向堆,因此*prt1
在堆上,B。
填空题:对于填空题来说,事实上都是很简单的内容,因此这里提供答案:
sizeof(num1) = 40;
sizeof(char2) = 5; strlen(char2) = 4;
sizeof(pChar3) = 4/8 ; strlen(pChar3) = 4;
sizeof(ptr1) = 4/8;
void Test ()
{
int* p1 = (int*) malloc(sizeof(int));
free(p1);
// 1.malloc/calloc/realloc的区别是什么?
int* p2 = (int*)calloc(4, sizeof (int));
int* p3 = (int*)realloc(p2, sizeof(int)*10);
// 这里需要free(p2)吗?
free(p3 );
}
对于第一个问题,我们直接转到之前的文章即可:C语言动态内存管理
对于第二个问题,我们知道realloc的原理是释放旧空间,开辟新空间,因此realloc时,p2原本的位置已经被释放掉了,因此不需要free(p2)。
【面试题】
glibc中malloc的实现原理
C语言内存管理方式在C++中可以继续使用,但有些地方就无能为力,而且使用起来比较麻烦,因此C++又提出了自己的内存管理方式:通过new和delete操作符进行动态内存管理。
void Test()
{
// 动态申请一个int类型的空间
int* ptr4 = new int;
// 动态申请一个int类型的空间并初始化为10
int* ptr5 = new int(10);
// 动态申请10个int类型的空间
int* ptr6 = new int[3];
delete ptr4;
delete ptr5;
delete[] ptr6;
}
我们发现,new的方式既可以给其初始化也可以不初始化。需要对单一开辟的初始化,就加上(n)n为具体数字,如果想对开辟的数组初始化,就需要{}
初始化盛夏的则会初始化成0
注意:申请和释放单个元素的空间,使用new和delete操作符,申请和释放连续的空间,使用new[]和delete[],注意:匹配起来使用。
因此,对于内置类型来说,new/delete相比malloc/free除了用法上没有区别。
class A
{
public:
A(int a = 0)
: _a(a)
{
cout << "A():" << this << endl;
}
~A()
{
cout << "~A():" << this << endl;
}
private:
int _a;
};
struct ListNode
{
ListNode* _next;
int _val;
ListNode(int val)
:_next(nullptr)
,_val(val)
{}
};
int main()
{
//自定义类型
//new和delete相比malloc/free,除了空间管理还会调用构造函数和析构函数
A* p1 = new A;
A* p2 = (A*)malloc(sizeof(A));
delete p1;
free(p2);
ListNode* n1 = new ListNode(1);
ListNode* n2 = new ListNode(2);
ListNode* n3 = new ListNode(3);
ListNode* n4 = new ListNode(4);
n1->_next = n2;
return 0;
}
对于上述代码,存在两个类,A和ListNode,都属于自定义类型。我们依次讨论:
当我们运行new开辟的p1时,会发现其调用了构造和析构函数。
而malloc出来的p2并没有调用,因此这就是在C++中需要new代替malloc的原因。
事实上,这便是通过new来进一步简化创建链表的操作:
即通过调用构造函数的初始化列表,就可以将链表节点创建出来。但对于malloc来说,就会很麻烦。(ListNode并不是结构体,而是类,即以类的对象为节点)
上述我们已经提到,对于new需要delete;对于new[]需要delete[],那如果我们用new但用的是delete[]或者用new[]却用delete会发生什么错误呢?
这里事实上在不同编译器上会有不同的情况发生,由于我用的是VS2019,因此在这里将粗略的谈一下以上两种情况是如何出错的。(不重要)
1. new和delete[]:
对于这个组合,我们先思考一下,为什么delete[]没有具体的数字就知道删掉对应开辟空间的数量呢?事实上,在我们delete[]时,其会在原本一排空间的前面自动开辟一个空间,而这个空间内部的值就是需要删掉空间的数量,即delete[]会将这个自动开辟的空间也一并删除,但对于new来说,仅仅开辟了一个空间,因此这样删除事实上增加了负担,但事实上不会报错。
2. new[]和delete:
事实上,这里的delete也相当于free,因此并不会产生内存泄漏,但是不建议这样使用。
对于这个不匹配,如果调用析构函数,就会对第二情况造成错误,我们只需要了解即可。
对于malloc开辟空间失败我们知道,其会返回空指针,即我们可以将此为判断开辟空间是否成功的标准;对于new失败,事实上其并不会返回空指针,而是抛异常。
也就是说,我们可以用判断是否是空指针来截止malloc开辟空间,对于new来说,什么都不用做,一旦开辟失败就会自动终止,并抛出异常,我们可以用以下代码进行演示:
int main()
{
try
{
while (1)
{
int* p1 = new int[1024 * 100];
if (p1)
{
cout << p1 << endl;
}
else
{
cout << "申请失败" << endl;
break;
}
}
}
catch (exception& e)
{
cout << e.what() << endl;
}
return 0;
}
new和delete是用户进行动态内存申请和释放的操作符,operator new 和operator delete是系统提供的全局函数,new在底层调用operator new全局函数来申请空间,delete在底层通过operator delete全局函数来释放空间。(此处的operator new不是new的重载,与前面的运算符重载不同,实质是一个函数)
我们可以通过画图理解:
/*
operator new:该函数实际通过malloc来申请空间,当malloc申请空间成功时直接返回;申请空间失败,尝试执行空间不足应对措施,如果改应对措施用户设置了,则继续申请,否则抛异常。
*/
void *__CRTDECL operator new(size_t size) _THROW1(_STD bad_alloc)
{
// try to allocate size bytes
void *p;
while ((p = malloc(size)) == 0)
if (_callnewh(size) == 0)
{
// report no memory
// 如果申请内存失败了,这里会抛出bad_alloc 类型异常
static const std::bad_alloc nomem;
_RAISE(nomem);
}
return (p);
}
/*
operator delete: 该函数最终是通过free来释放空间的
*/
void operator delete(void *pUserData)
{
_CrtMemBlockHeader * pHead;
RTCCALLBACK(_RTC_Free_hook, (pUserData, 0));
if (pUserData == NULL)
return;
_mlock(_HEAP_LOCK); /* block other threads */
__TRY
/* get a pointer to memory block header */
pHead = pHdr(pUserData);
/* verify block type */
_ASSERTE(_BLOCK_TYPE_IS_VALID(pHead->nBlockUse));
_free_dbg( pUserData, pHead->nBlockUse );
__FINALLY
_munlock(_HEAP_LOCK); /* release other threads */
__END_TRY_FINALLY
return;
}
/*
free的实现
*/
#define free(p) _free_dbg(p, _NORMAL_BLOCK)
通过上述两个全局函数的实现知道,operator new 实际也是通过malloc来申请空间,如果malloc申请空间成功就直接返回,否则执行用户提供的空间不足应对措施,如果用户提供该措施就继续申请,否则就抛异常。operator delete 最终是通过free来释放空间的。
如果申请的是内置类型的空间,new和malloc,delete和free基本类似,不同的地方是:new/delete申请和释放的是单个元素的空间,new[]和delete[]申请的是连续空间,而且new在申请空间失败时会抛异常,malloc会返回NULL。
new的原理
- 调用operator new函数申请空间
- 在申请的空间上执行构造函数,完成对象的构造
delete的原理
- 在空间上执行析构函数,完成对象中资源的清理工作
- 调用operator delete函数释放对象的空间
new T[N]的原理
- 调用operator new[]函数,在operator new[]中实际调用operator new函数完成N个对象空间的申请
- 在申请的空间上执行N次构造函数
delete[]的原理
- 在释放的对象空间上执行N次析构函数,完成N个对象中资源的清理
- 调用operator delete[]释放空间,实际在operator delete[]中调用operator delete来释放空间
定位new表达式是在已分配的原始内存空间中调用构造函数初始化一个对象。
new (place_address) type或者new (place_address) type(initializer-list)place_address必须是一个指针,initializer-list是类型的初始化列表。
使用场景:
定位new表达式在实际中一般是配合内存池使用。因为内存池分配出的内存没有初始化,所以如果是自定义类型的对象,需要使用new的定义表达式进行显示调构造函数进行初始化。
int main()
{
A* p1 = new A;
//A* p2 = new A[10];
A* p3 = (A*)malloc(sizeof(A));
if (p3 == nullptr)
{
perror("malloc fail");
exit(-1);
}
//定位new -- 对p3指向空间,显示调用构造初始化
new(p3)A(1);
p3->~A();
free(p3);
//delete p3;
delete p1;
return 0;
}
不难发现,除了定位之外,对于显示调用构造函数来说,也具有和delete一样的功能。
malloc/free和new/delete的共同点是:都是从堆上申请空间,并且需要用户手动释放。不同的地方是:
- malloc和free是函数,new和delete是操作符
- malloc申请的空间不会初始化,new可以初始化
- malloc申请空间时,需要手动计算空间大小并传递,new只需在其后跟上空间的类型即可,如果是多个对象,[]中指定对象个数即可
- malloc的返回值为void*, 在使用时必须强转,new不需要,因为new后跟的是空间的类型
- malloc申请空间失败时,返回的是NULL,因此使用时必须判空,new不需要,但是new需要捕获异常
- 申请自定义类型对象时,malloc/free只会开辟空间,不会调用构造函数与析构函数,而new在申请空间后会调用构造函数完成对象的初始化,delete在释放空间前会调用析构函数完成空间中资源的清理
什么是内存泄漏: 内存泄漏指因为疏忽或错误造成程序未能释放已经不再使用的内存的情况。内存泄漏并不是指内存在物理上的消失,而是应用程序分配某段内存后,因为设计错误,失去了对该段内存的控制,因而造成了内存的浪费。
内存泄漏的危害: 长期运行的程序出现内存泄漏,影响很大,如操作系统、后台服务等等,出现内存泄漏会导致响应越来越慢,最终卡死。
具体演示:
我们发现,VS的内存占比越来越大,这就是内存泄露导致的。
void MemoryLeaks()
{
// 1.内存申请了忘记释放
int* p1 = (int*)malloc(sizeof(int));
int* p2 = new int;
// 2.异常安全问题
int* p3 = new int[10];
Func(); // 这里Func函数抛异常导致 delete[] p3未执行,p3没被释放.
delete[] p3;
}
C/C++程序中一般我们关心两种方面的内存泄漏:
堆内存泄漏(Heap leak)
堆内存指的是程序执行中依据须要分配通过malloc / calloc / realloc / new等从堆中分配的一块内存,用完后必须通过调用相应的 free或者delete 删掉。假设程序的设计错误导致这部分内存没有被释放,那么以后这部分空间将无法再被使用,就会产生Heap Leak。
系统资源泄漏
指程序使用系统分配的资源,比方套接字、文件描述符、管道等没有使用对应的函数释放掉,导致系统资源的浪费,严重可导致系统效能减少,系统执行不稳定。
在vs下,可以使用windows操作系统提供的**_CrtDumpMemoryLeaks()** 函数进行简单检测,该函数只报出了大概泄漏了多少个字节,没有其他更准确的位置信息。
int main()
{
int* p = new int[10];
// 将该函数放在main函数之后,每次程序退出的时候就会检测是否存在内存泄漏
_CrtDumpMemoryLeaks();
return 0;
}
// 程序退出后,在输出窗口中可以检测到泄漏了多少字节,但是没有具体的位置
Detected memory leaks!
Dumping objects ->
{79} normal block at 0x00EC5FB8, 40 bytes long.
Data: < > CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD
Object dump complete.
此写代码时一定要小心,尤其是动态内存操作时,一定要记着释放。但有些情况下总是防不胜防,简单的可以采用上述方式快速定位下。如果工程比较大,内存泄漏位置比较多,不太好查时一般都是借助第三方内存泄漏检测工具处理的。
- 工程前期良好的设计规范,养成良好的编码规范,申请的内存空间记着匹配的去释放。ps:这个理想状态。但是如果碰上异常时,就算注意释放了,还是可能会出问题。需要下一条智能指针来管理才有保证。
- 采用RAII思想或者智能指针来管理资源。
- 有些公司内部规范使用内部实现的私有内存管理库。这套库自带内存泄漏检测的功能选项。
- 出问题了使用内存泄漏工具检测。ps:不过很多工具都不够靠谱,或者收费昂贵。
总结一下:
内存泄漏非常常见,解决方案分为两种:1、事前预防型。如智能指针等。2、事后查错型。如泄漏检测工具。
对于上述内容,最主要的是理解其中的具体情形,因此上面在演示内存泄漏的过程中也用动图演示给大家,切记不要死记硬背。