为操作系统内核分配的内存空间叫 内核空间,其它程序分配的空间就是 用户空间,不同的操作系统下两者占据内存的比例不同,而我们需要了解使用的就是 用户空间。
C++兼容C语言,它们的内存分布是相同的,在 用户空间 内申请或释放空间。只是C++因为面向对象这一特性的存在,增加了新的方法。
我们对比图片观察不同的数据存放在那个内存空间的那一块(对C语言内存管理不熟悉可查看该篇博客:【C语言】内存管理):
I / O映射方式
,用于装载一个共享的动态内存库。用户可使用系统接口创建共享的共享内存,做进程通信。接着我们对上图的代码分布情况做出如下解释(上图的代码放在解释后,有需要的可以自己复制运行一下)
全局变量,static修饰创建的静态变量一定存放在数据段,存放静态数据和全局数据的地方,这个没有异议。
localNum变量,num1数组 正常在栈上开的空间创建,也很好理解。
至于char2、pChar3、ptr1、ptr2和ptr3 ,我们需要明白一点,不论是数组还是指针,不论接收的是常量字符串还是程序员自己开辟的空间的地址,它们终究是在函数内,是在栈上创建的变量,用来存放数据罢了,它们作为变量的地址就在栈上。
在C语言中我们就应该知道,使用双引号括起来的数据为常量字符串,这样的字符串为只读常量,不能修改,存放在代码段(常量区),这是规定好的,我们理解记忆即可,但其中有一些比较迷惑人的地方需要解释一下:
使用数组和指针的形式接收常量字符串结果是不同的。
使用数组接收: 如上图的char char2[]="abcd";
,常量字符串存放在代码段,在赋值时,char2在栈上开辟一个相同大小的数组,通过拷贝将每个字符存放在数组中(包含最后的’\0’终止字符),所以我们可以修改数组char2中的数据。
使用指针接收:
程序员使用malloc、calloc、realloc 开辟的空间必然是放在堆上的,这样的空间,程序员自己申请也需要自己使用free 释放。空间在堆上开辟好后,分别使用指针接收这些空间的首地址,所以接收这些地址的指针变量是在栈上开辟,但它们所存储的地址却是在堆上。
代码如下:
int globalNum = 1;
static int staticGlobalNum = 1;
int main()
{
static int staticNum = 1;
int localNum = 1;
int num1[10] = { 1,2,3,4 };
char char2[] = "abcd";
const char* pChar3 = "abcd";
int* ptr1 = (int*)malloc(sizeof(int));
int* ptr2 = (int*)calloc(4, sizeof(int));
int* ptr3 = (int*)realloc(ptr2,sizeof(int) * 4);
free(ptr1);
free(ptr3);
return 0;
}
C语言动态开辟内存的方式即为malloc、calloc和realloc,最后由free释放开辟的空间,这是学习C必须要掌握的对象,而面试时也会经常问道相关的问题,我们通过下面两道面试题在来看一下
1.malloc/calloc/realloc的区别?
- malloc向堆区申请空间,参数为申请内存的大小
- calloc向堆区申请空间,第一个参数为申请空间的每一个字节的初始值,第二个参数为申请空间的大小
- realloc向堆区申请空间,第一个参数为要调整的地址,第二个参数为调整后新的空间的大小,若第一个参数为空,则realloc和malloc相同。
- 向堆申请的空间必须使用free释放,防止内存泄漏。
2.malloc的实现原理
(比较复杂,建议结合操作系统一起学习)
C语言管理内存的方法(malloc、calloc、realloc、free)在C++中可以继续使用,但有些地方就无能为力,而且使用起来比较麻烦,比如说自定义类型,因此C++提出了自己的内存管理方式:通过new和delete操作符进行内存管理。
我们以int
类型为类
动态申请一个int类型的空间
int* ptr1 = new int;//申请空间
delete ptr1;//释放空间
直接new后跟类型即可向堆申请空间。
动态申请一个int类型的空间并初始化为10
int* ptr2 = new int(10);//申请空间
delete ptr2;//释放空间
在类型后加小括号,在其内填写需要初始的值
动态申请10个int类型的空间
int* ptr3 = new int[10];//申请空间
delete[] ptr3;//释放空间
在类型后加中括号,其内填需要申请的同类型空间的个数
动态申请10个int连续的空间并初始化
在中括号后加小括号,在其内不添加任何值,默认初始化为0
int* ptr4_1 = new int[10]();//申请空间
delete[] ptr4_1;//释放空间
在中括号后加大括号,在其内填写数组的值,不足的部分默认为0
int* ptr4_2 = new int[10] {1,2,3,4};//申请空间
delete[] ptr4_2;//释放空间
注意:申请和释放单个元素的空间,使用new和delete操作符,申请和释放连续的空间,使用new[]和delete[],需要匹配起来使用,不能乱用。(原因请看 6.必须匹配的操作符 )
通过下面代码查看,创建空间是否成功
int main()
{
int* ptr1 = new int;
int* ptr2_1 = new int(10);
int* ptr2_2 = new int();
int* ptr3 = new int[4];
int* ptr4_1 = new int[4]();
int* ptr4_2 = new int[4]{ 1,2 };
printf("ptr1:%p %d\n", ptr1, *ptr1);
printf("ptr2_1:%p %d\n", ptr2_1,*ptr2_1);
printf("ptr2_2:%p %d\n", ptr2_2, *ptr2_2);
for (int i = 0; i < 4; i++)
{
printf("ptr3:%p %d\n", &ptr3[i], ptr3[i]);
}
for (int i = 0; i < 4; i++)
{
printf("ptr4_1:%p %d\n", &ptr4_1[i], ptr4_1[i]);
}
for (int i = 0; i < 4; i++)
{
printf("ptr4_2:%p %d\n", &ptr4_2[i], ptr4_2[i]);
}
delete[] ptr4_1;
delete[] ptr4_2;
delete[] ptr3;
delete ptr2_1;
delete ptr2_2;
delete ptr1;
return 0;
}
new 和 delete操作自定义类型和操作内置类型相同。
new/delete 和malloc/free对于自定义类型时,不同的是申请空间时:new会调用构造函数,释放空间时:delete会调用析构函数
class A
{
public:
A(int a = 0)
{
_a = a;
cout << "A(int a = 0)" << " " << _a << endl;
}
~A()
{
cout << "~A()" << endl;
}
private:
int _a;
};
int main()
{
A* ptr1 = new A(1);
delete ptr1;
A* ptr2 = new A;
delete ptr2;
A* ptr3 = new A[4];//调用四次构造函数
delete[] ptr3;//释放四次构造函数
A* ptr4 = new A[4]{ 1,2,3,4 };//为每次调用的构造函数传值
delete[] ptr4;
return 0;
}
对于malloc和free,什么都不会调用
class A
{
public:
A(int a = 0)
{
_a = a;
cout << "A(int a = 0)" << " " << _a << endl;
}
~A()
{
cout << "~A()" << endl;
}
private:
int _a;
};
int main()
{
A* ptr1 = (A*)malloc(sizeof(A));
if (ptr1 == nullptr)
{
perror("malloc fail!");
exit(-1);
}
free(ptr1);
A* ptr2 = (A*)malloc(sizeof(A)*4);
if (ptr1 == nullptr)
{
perror("malloc fail!");
exit(-1);
}
free(ptr2);
return 0;
}
优势:
new和delete 是用户进行动态内存申请和释放的操作符,operator new 和 operator delete 是系统提供的全局函数
我们编写如下代码,通过汇编查看
class A
{
public:
A(int a = 0)
{
_a = a;
cout << "A(int a = 0)" << " " << _a << endl;
}
~A()
{
cout << "~A()" << endl;
}
private:
int _a;
};
int main()
{
A* ptr = new A;
delete ptr;
return 0;
}
至于delete我使用的VS2019不方便查看,大家要明白它底层调用的是operator delete ,还有下面的一点。
接着我们看一下operator new 和 operator delete 是则么实现的:
operator new:
void* __CRTDECL operator new(size_t size) _THROW1(_STD bad_alloc)
{
// try to allocate size bytes
void* p;
while ((p = malloc(size)) == 0)
if (_callnewh(size) == 0)
{
// report no memory
// 如果申请内存失败了,这里会抛出bad_alloc 类型异常
static const std::bad_alloc nomem;
_RAISE(nomem);
}
return (p);
}
operator delete:
/*
free的实现
*/
#define free(p) _free_dbg(p, _NORMAL_BLOCK)
void operator delete(void* pUserData)
{
_CrtMemBlockHeader* pHead;
RTCCALLBACK(_RTC_Free_hook, (pUserData, 0));
if (pUserData == NULL)
return;
_mlock(_HEAP_LOCK); /* block other threads */
__TRY
/* get a pointer to memory block header */
pHead = pHdr(pUserData);
/* verify block type */
_ASSERTE(_BLOCK_TYPE_IS_VALID(pHead->nBlockUse));
_free_dbg(pUserData, pHead->nBlockUse);
__FINALLY
_munlock(_HEAP_LOCK); /* release other threads */
__END_TRY_FINALLY
return;
}
我们可以将operator new 和 operator delete 看作是对malloc和free 的封装,之所以要这么做是因为C++是面向对象的语言,当申请空间发生错误时不能像C那样去处理问题,直接返回个NULL,需要让用户更直观的看到问题的出现,需要增加异常 这个功能,如果了解一些Java的知识,想必对异常并不陌生,这正是面向对象的特点。
申请内置类型的空间,new和malloc,delete和free基本类似, 不同的地方有以下两点:
new的原理
delete的原理
new T[N]的原理
调用operator new[]函数 申请空间
operator new[] 中实际调用operator new函数完成N个对象的申请。
在申请的空间上执行N次构造函数
delete[]的原理
在释放的对象空间上执行N次析构函数,完成N个对象资源的清理
调用operator delete[] 释放空间
与operator new[]相同,operator delete[]中调用operator delete来释放空间。
我们使用操作符申请空间时,必须匹配使用,malloc/free、new/delete、new[]/delete[]
分别看一下,不匹配会发生什么
int main()
{
int* ptr1 = new int;
free(ptr1);
int* ptr2 = new int[10];
free(ptr2);
return 0;
}
我们执行上述代码,发现编译器并不会报错,因为new 也是通过malloc 来申请空间,通过free 释放的,对于内置类型,我们直接使用free 释放是没有问题的。
定义如下类,之后的代码会用下面的类来创建对象申请空间(没有用到的地方会说明):
class A
{
public:
A(int a = 0)
{
_a = a;
cout << "A(int a = 0)" << " " << _a << endl;
}
~A()
{
cout << "~A()" << endl;
}
private:
int _a;
};
int main()
{
A* ptr1 = new A;
free(ptr1);
return 0;
}
我们看到,这样的代码执行起来编译器也是不会报错的,只是没有执行析构函数,这种情况就要分类讨论了
无需要释放的资源 :就像这个A类,它执行不执行析构函数都是无所谓的,因为它对象内没有在额外申请空间,我们只需要释放掉它new出来的即可,这一点free是可以做到的。
有需要释放的资源 :我们将上面的代码修改一下,在来运行
class B
{
public:
B(int a = 4)
{
_pa = new int[a];
cout << "B(int a = 0)" << endl;
}
~B()
{
delete[] _pa;
cout << "~A()" << endl;
}
private:
int* _pa;
};
int main()
{
B* ptr = new B;
free(ptr);
return 0;
}
观察上面的代码,我们free 只是将ptr 指向的空间释放,而对象ptr 内 _pa 指向的空间却没有释放,这就造成内存泄漏 ,这是很严重的事情,而C/C++中,我们自己申请的内存需要我们自己释放,编译器是不会管的,也不会检查出内存泄漏 的,依然会正常运行。
所以delete 的顺序为先调用析构函数,释放对象内的资源,之后operator delete 释放掉对象的空间。
关于内存泄漏的危害我举个例子:如果一个程序一直在运行,而它存在内存泄漏,那它会一直消耗空间,直到程序无法运行,这是很严重的问题。
我们使用下面的代码来检测,一个程序可以开辟的最大空间(我使用的是VS2019)
int main()
{
int size = 0;
while (1)
{
int* ptr = (int*)malloc(sizeof(int)*2*1024);
size += 1;//每次开辟1KB的空间
if (ptr == nullptr)
{
break;
}
}
cout << size / 1024 << "MB" << endl;
return 0;
}
结论: new和malloc系列,底层实现机制有关联交叉。不匹配使用可能出现问题,也可能没有问题,所以大家一定要匹配使用。
拓展:
如果对java有一定了解,应该知道java是没有释放内存这一说的,因为它有一个垃圾回收的机制叫做GC,当我们new一个对象GC就会记录下来,使用过后需要释放该对象时,JVM(java虚拟机) 就会实现这一机制,释放空间。
至于C++为什么不搞这样的机制,因为C/C++是极度追求性能的,GC 这样的机制一定程度上会对性能造成影响,所以C++需要程序员自己释放,以此提高性能。
从学习语言的角度,有GC也并不就是一件好事,虽然用起来方便,但学习Java的每个人都要懂得GC 这个复杂的机制。
观察下面两段代码及运行结果:
代码1:
int main()
{
A* ptr = new A[4];
free(ptr);
return 0;
}
编译器报错无法正常运行。
代码2:
int main()
{
A* ptr = new A[4];
delete ptr;
return 0;
}
编译器报错无法正常运行。
这两段代码报错的原因和析构函数无关,就像上一段讲的,析构函数哪怕不调用,最坏是内存泄漏,编译还是可以执行的,不会突然报错,报错的原因在于new 开辟连续空间的机制
我们先来看正确的写法:
A* ptr = new A[4];
delete[] ptr;
使用new申请连续的空间时,我们在类型后的中括号内填入了数字4告诉编译器,需要申请4个A类型的空间,需要调用4次构造函数,而在delete时,却没有告诉编译器到底调用几次析构函数(释放多少空间编译器会记录,我们使用malloc为内置类型开辟连续的空间时,也没有告诉编译器需要free多大的空间就是证明),那编译器是怎么知道要调用几次析构函数的?
在new开辟空间时,编译器会在开辟的空间起始地址处向前在开辟4个字节的空间,用来存放需要调用的析构函数个数(只用来存储调用几次析构,释放空间的大小编译器会使用其他办法记录),若释放空间时,写法为
delete[]
,释放空间会包含这4个字节,也就是释放空间时,指针指向的起始位置为这四个字节的首地址, 也就知道了需要调用几个析构函数,若写法为delete/free
,则不会去理会起始位置前的这四个字节,指针指向的位置就是申请的空间的起始位置, 只是按照步骤走下去(delete调用一次析构然后释放空间,free直接释放空间),那4个存储数字的字节被保留下来,释放空间的指针位置不对,因此导致编译器报错。
这里还要说明一点,我们在定义A类时,我们自己写了析构函数,若我们自己没写,则使用new[]/fee、new[]/delete 是不会报错的
class A
{
public:
A(int a = 0)
{
_a = a;
cout << "A(int a = 0)" << " " << _a << endl;
}
//~A()
//{
// cout << "~A()" << endl;
//}
private:
int _a;
};
int main()
{
A* ptr1 = new A[4];
free(ptr1);
A* ptr2 = new A[4];
delete ptr2;
return 0;
}
如上,当我们将析构函数注释后,类内就只有编译器自己的默认析构函数,这时编译器会认为没有调用析构函数的必要, 也就不需要在开辟4个字节来存储需要调用析构函数的次数,编译器正常运行。
注意: 再次强调,因为C++的语法和底层比较复杂,哪怕我们知道了怎么开辟和释放空间编译器不会报错,但终究会造成问题,如自己的使用失误,误导他人等等,我们还是坚持遵守C++的语法,配套使用malloc/free、new/delete、new[]/delete[] ,不交叉使用。
定位new表达式是在已分配的原始内存空间中调用构造函数初始化一个对象。
new(place_address)type 或 new(place_address)type(initializer_list)
place_address必须时一个指针,initializer_list是类型的初始化列表
如下,我们使用malloc来申请一块自定义类型的空间,申请后,这块空间是没有办法自动调用构造函数的,只能通过定位new 来调用构造函数初始化,释放时则直接调用析构函数即可。
class A
{
public:
A(int a = 0)
{
_a = a;
cout << "A(int a = 0)" << " " << _a << endl;
}
~A()
{
cout << "~A()" << endl;
}
private:
int _a;
};
int main()
{
A* ptr = (A*)malloc(sizeof(A));
new(ptr)A(1);//定位new,传参
//new(ptr)A;//定位new,不传参
ptr->~A();//调用析构函数
return 0;
}
想必大家都有疑问,为什么要写的这么复杂,直接new一个对象出来不就好了
A* ptr = new A;
delete ptr;
凡是存在必然会有它一定的道理,我们一般使用new是向操作系统的堆来申请空间,但操作系统分配空间效率上会有些慢,所以有些地方如果需要频繁的申请内存就会有一个内存池,用来存储需要分配的空间并且效率要高于操作系统,同时内存池分配出的内存没有初始化,如果是自定义类型的对象, 需要使用new的定义表达式进行初始化。
接着我们来看一下内存池的工作流程:
当内存池内有内存时,我们直接向其申请,它就会分配给我们空间
当内存池内没有内存时,我们直接向其申请,它会先和操作系统申请,告诉操作系统自己没有内存了,操作系统就会返回其大量内存空间,使其短时间内不会在缺少内存,防止效率下滑。
下面是一道面试题,不建议大家去背,做到理解记忆最好
对于内存管理,C/C++几乎类似,只是C++在C的基础上做出了更适合面向对象的调整