【C语言】动态内存管理 - malloc等函数详解

目录

  • 1. 为什么存在动态内存分配
  • 2. 动态内存函数的介绍
    • 2.1 malloc和free
    • 2.2 calloc
    • 2.3 realloc
  • 3. 常见的动态内存错误
  • 4. 几个经典的笔试题
  • 5. C/C++程序的内存开辟
  • 6. 柔性数组
    • 6.1 柔性数组的特点和使用
    • 6.2 柔性数组的优势

1. 为什么存在动态内存分配

到目前为止,掌握的内存开辟方式有:

  • int val = 10//在栈空间上开辟4个字节
  • int arr[10]//在栈空间上开辟40个字节的连续空间

而这上述的方法都有两个特点:

  1. 开辟的空间大小是固定的
  2. 数组在申明的时候,必须指定数组的长度,它所需要的内存在编译时分配。

但是对于空间的需求,不仅仅是上述的情况。有时候我们需要的空间大小在程序运行的时候才能知道,那数组的编译时开辟空间的方式就不能满足了。

这时候就只能试试动态内存开辟了。

2. 动态内存函数的介绍

2.1 malloc和free

C语言提供了一个动态内存开辟的函数:

//返回类型:void*指针,参数要开辟空间的字节数
void* malloc(size_t size);
  • 这个函数向内存申请一块连续可用的空间,并返回指向这块空间的起始字节的地址。
  • 如果开辟成功,则返回一个指向开辟好空间的指针。
  • 如果开辟失败,则返回一个NULL指针,因此malloc的返回值一定要做检查。
  • 返回值的类型是 void* ,所以malloc函数并不知道开辟空间的类型,具体在使用的时候使用者自己来决定。
  • 如果参数 size 为0,malloc的行为是标准是未定义的,取决于编译器。

举个例子:

#include 
#include ;
#include 
int main()
{
	int arr[10] = { 0 };
	//开辟40个字节的空间
	int* pa = (int*)malloc(40);
	//如果为NULL表示开辟失败
	//打印错误信息结束程序
	if (pa == NULL)
	{
		printf("%s\n", strerror(errno));
		return 1;
	}
	//正常使用
	for(int i = 0; i < 10 ++i)
	{
		*(pa + i) = i;
		//等价于p[i]
	}
	for(int i = 0; i < 10 ++i)
	{
		printf("%d ", *(pa + i));
	}
	return 0;
}

代码中数组的开辟形式与动态内存开辟的形式有什么不同呢?

首先它们的存储区域是不一样的,内存分为栈区、堆区和静态区

栈区是用来存放局部变量、形式参数和临时性的变量等
堆区是用来存放malloc、calloc、realloc和free开辟和操作的空间。

int arr[10] = { 0 };这是在栈区上申请40个字节,通过int* pa = (int*)malloc(40);申请的空间则在堆区上,malloc申请的空间如果不够大,可以调整,而在栈区申请的空间大小不能随便乱动

上面代码中虽然最后没有free(释放)掉申请的空间,但是并不意味着内存空间会泄露,当程序退出的时候,系统会自动回收内存空间的。

内存泄漏:这块空间分配给你,你用完之后不还回,这时这块空间你不用了你也不还,别人也不用不上了,如果永远不还,就意味着永远也拿不到该空间,这就意味着这块空间丢了,也就是内存泄漏

和malloc相关的函数是free,专门是用来做动态内存的释放和回收的,函数原型如下:

void free (void* ptr);

free函数用来释放动态开辟的内存。

  • 如果参数 ptr 指向的空间不是动态开辟的,那free函数的行为是未定义的(error)。
  • 如果参数 ptr 是NULL指针,则函数什么事都不做。
int main()
{
	int* pa = (int*)malloc(40);
	if (pa == NULL)
	{
		printf("%s\n", strerror(errno));
		return 1;
	}
	//正常使用完后释放,相当于把该内存空间
	//还给操作系统了
	free(pa);
	//然后把pa赋值为空指针
	//这是因为虽然释放了该内存块
	//但是pa依然记得这块空间的起始地址
	//所以要让pa彻底“失忆”
	//不让它在指向这块空间
	pa = NULL;
	return 0;
}

2.2 calloc

除了malloc,还提供了一个函数叫 calloc, calloc 函数也用来动态内存分配。原型如下:

//返回类型:void*指针,参数:要开辟数据的个数,数据大小所占的字节数
void* calloc (size_t num, size_t size);
  • 函数的功能是为 num 个大小为 size 的元素开辟一块空间,并且把空间的每个字节初始化为0
  • 与函数 malloc 的区别只在于 calloc 会在返回地址之前把申请的空间的每个字节初始化为全0。

比如:

#include 
#include 
#include 
int main()
{
	//开辟40个字节的空间
	int* pa = (int*)calloc(10, sizeof(int));
	//如果为NULL表示开辟失败
	//打印错误信息结束程序
	if (pa == NULL)
	{
		printf("%s\n", strerror(errno));
		return 1;
	}
	for (int i = 0; i < 10; ++i)
	{
		printf("%d ", pa[i]);
	}
	free(pa);
	pa = NULL;
	return 0;
}

在这里插入图片描述

calloc = malloc + memset.

2.3 realloc

realloc函数的出现让动态内存管理更加灵活。

有时会我们发现过去申请的空间太小了,有时候我们又会觉得申请的空间过大了,那为了合理的时候内存,我们一定会对内存的大小做灵活的调整。那 realloc 函数就可以做到对动态开辟内存大小的调整。

函数原型如下:

void* realloc (void* ptr, size_t size);
  • ptr 是要调整的内存地址
  • size 调整之后新大小
  • 返回值为调整之后的内存起始位置。
  • 这个函数调整原内存空间大小的基础上,还会将原来内存中的数据移动到新的空间

比如说:

int main()
{
	int* pa = (int*)malloc(40);
	if (pa == NULL)
	{
		printf("%s\n", strerror(errno));
		return 1;
	}
	//赋值1~10
	for (int i = 0; i < 10; ++i)
	{
		*(pa + i) = i + 1;
	}
	//这时空间不够用了
	//使用realloc来扩容
	//把要调整空间的起始地址
	//和增添后的空间总大小传参
	//原来大小40,再增加40,所以是80
	realloc(pa, 80);
	//那么这个函数在内存中是怎么工作的?
	//下面解释
	return 0;
}

realloc在调整内存空间的是存在两种情况:

  • 情况1:原有空间之后有足够大的空间
  • 情况2:原有空间之后没有足够大的空间

画图解释两种情况:

【C语言】动态内存管理 - malloc等函数详解_第1张图片
第二种情况,返回的新地址可以直接在赋值给pa吗?

其实是不可以的,如果realloc函数扩容失败了,返回了一个空指针赋值给了pa,pa本来还是指向原来的空间,结果为NULL之后连原来的空间都找不到了,因此正确的做法为:

int* ret = (int*)realloc(pa, 80);
if (ret != NULL)
{
	pa = ret;
}
//使用..

free(pa);
pa = NULL;

做一个小转换就可以了,这样pa得到的才是有效的地址。

realloc(NULL, 40) == malloc(40)

如果频繁地开辟动态内存,会造成内存和内存之间存在空隙,也就是内存碎片化,如果这个碎片没有好好利用,就会导致内存的利用率和效率的下降。
效率下降是因为申请空间是在堆区上申请的,而堆区是操作系统管理的,所以使用malloc等函数申请空间是调用操作系统提供的接口,然后去堆区上申请空间,每次申请都要打断操作系统的执行,然后让操作系统帮我们去申请 ,而申请是需要浪费时间的,所以频繁的申请会导致效率的下降.

3. 常见的动态内存错误

  1. 对NULL指针的解引用操作
void test()
{
    int *p = (int *)malloc(INT_MAX/4);
    *p = 20;//如果p的值是NULL,就会有问题
    free(p);
    p = NULL;
}

合理的修改应该是对p进行判断:

#include 
#include 
#include 	
void test()
{
    int* p = (int*)malloc(INT_MAX / 4);
    if (p == NULL)
    {
        printf("%s\n", strerror(errno));
        //报错打印错误信息
        return 1;
        //然后结束程序
    }
    *p = 20;
    free(p);
    p = NULL;
}
  1. 对动态开辟空间的越界访问
void test()
{
	int i = 0;
	int* p = (int*)malloc(10 * sizeof(int));
	if (NULL == p)
	{
		exit(EXIT_FAILURE);
	}
	for (i = 0; i <= 10; i++)
	{
		*(p + i) = i; 
	}
	free(p);
	p = NULL;
}

一共就开辟了10个整形大小的空间,而循环访问到了第11个元素,即使是动态开辟的内存,也不能越界,因此循环条件该为 i< 10即可。

  1. 对非动态开辟使用free释放
void test()
{
    int a = 10;
    int* p = &a;
    free(p);//ok?
    p = NULL;
}

此时运行程序会崩溃,因为p所指向的空间是栈区上的,并不是动态开辟的,free所释放的空间一定是malloc、calloc和realloc所开辟的。

  1. 使用free释放一块动态开辟内存的一部分
void test()
{
    int* p = (int*)malloc(100);
    p++;
    free(p);//p不再指向动态内存的起始位置
    p = NULL;
}

当对指针p进行++操作后,p就改变了,不再指针这块空间的起始地址,因此最后释放p会导致程序崩溃。

  1. 对同一块动态内存多次释放
void test()
{
    int* p = (int*)malloc(100);
    free(p);
    free(p);//重复释放
    p = NULL;
}

这也会导致程序崩溃,第一次释放已经把p所指向的空间还给操作系统了,但是p存放的还是刚才那块空间的起始地址,是个野指针,结果又释放一次,这下给编译器整不会了,我都帮你释放了呀,你咋还让我释放,那我就报错。所以要么释放一次p,要么释放一次把p置为空指针,然后再释放一次也不会有什么影响。

  1. 动态开辟内存忘记释放(内存泄漏)
void test()
{
    int* p = (int*)malloc(100);
    
    int flag = 0;
    scanf("%d", &flag);
    if (flag == 1)
    {
        return;
    }
    free(p);
    p = NULL;
}
int main()
{
    test();
    return 0;
}

貌似逻辑没有什么问题,但是这段代码存在内存泄露的隐患,在test函数里,如果flag输入了一个1,那么函数调用直接结束,下面的释放和置空永远都没有机会执行,返回到主函数,test的栈空间销毁,那么p所指向的空间,程序就再也找不到了,那就意味着这块空间泄露了。

这里的泄露并不是说真实的物理内存不见了,而只是临时分配给程序的那部分空间不见了,程序关闭会自动回收。

忘记释放不再使用的动态开辟的空间会造成内存泄漏。

动态开辟的空间一定要释放,并且正确释放 。

4. 几个经典的笔试题

请问以下题目中运行Test 函数会有什么样的结果:

void GetMemory(char* p) 
{
    p = (char*)malloc(100);
}
void Test(void) 
{
    char* str = NULL;
    GetMemory(str);
    strcpy(str, "hello world");
    printf(str);
}
int main()
{
    Test();
    return 0;
}

首先调用Test函数,创建一个指针变量str并赋值为NULL,然后调用函数GetMemory,参数为str,那么形参也要创建也一个指针变量p来接收,p也是一个空指针,然后用malloc函数来开辟一块100个字节的空间,并把这块空间的起始地址交给p来维护,因为形参只能在本函数内部使用,出了函数形参p销毁,但是malloc开辟的空间并不会销毁。
该函数调用完毕后回到Test,因为是传值调用,并没有传str的地址,所以操作形参并不会改变实参,此时的str还是一个空指针,下面紧接着对空指针str进行字符串拷贝程序会崩溃,因为空指针没办法解引用操作,所以最后printf会打印空,至此程序结束,而GetMemory函数内部用malloc开辟的空间也找不到了,所以也就永远没办法进行释放,这就导致了内存泄漏。

简单来说上述代码有两个问题:1. 解引用空指针崩溃,存在内存泄漏。

修改:GetMemory取出str的地址传参,形参用二级指针接收,然后解引用一次找到str,用str来维护malloc开辟的空间,最后使用完毕释放str,置空。

-----------------分割线------------------

char* GetMemory(void) 
{
    char p[] = "hello world";
    return p;
}
void Test(void) 
{
    char* str = NULL;
    str = GetMemory();
    printf(str);
}
int main()
{
    Test();
    return 0;
}

首先调用Test函数,创建指针变量str并赋值为NULL,然后然后调用GetMemory函数,该函数内部创建数组p,然后返回p也就是数组首元素地址,出了函数数组p的空间就销毁了,此时把这块空间的地址赋值给str时,str的所指向的空间的内容是未知的,因为销毁后空间还给了操作系统,所以里面的内容如果被其它数据使用覆盖了,那么内容是未知的,也有可能没覆盖。所以如果没有被覆盖,可以打印出hello world,否者打印乱码。

因此该程序的问题是返回了局部变量的地址,出了作用域销毁后返回了一个野指针。
-----------------分割线------------------

void GetMemory(char** p, int num) 
{
    *p = (char*)malloc(num);
}
void Test(void) 
{
    char* str = NULL;
    GetMemory(&str, 100);
    strcpy(str, "hello");
    printf(str);
}
int main()
{
    Test();
    return 0;
}

这题和上面的第一题相似,只有一个问题就是使用完后没有free掉这块空间,这就导致函数调用完毕后再也无法找到str所指向的那块空间了,也就相当于内存泄漏。

修改:free(str); str = NULL;

-----------------分割线------------------

void Test(void) 
{
    char* str = (char*)malloc(100);
    strcpy(str, "hello");
    free(str);
    if (str != NULL)
    {
        strcpy(str, "world");
        printf(str);
    }
}
int main()
{
    Test();
    return 0;
}

当free掉这块空间后,此时str依然指向那块内存空间的起始地址,但也是一个野指针,str != NULL为真进入if语句后,对野指针指向的地址进行字符串拷贝,因为那块空间已经不属于我们了,会造成非法访问,所以程序会崩溃。

也是一个野指针问题。

修改:在free后要及时把该指针置空即可。


5. C/C++程序的内存开辟

【C语言】动态内存管理 - malloc等函数详解_第2张图片
其中内核空间的区域是用户程序不能读写的,这块空间是专门留给操作系统的。
数据段就是前面提到的静态区,里面存放全局变量和静态变量。


6. 柔性数组

也许从来没有听说过柔性数组(flexible array)这个概念,但是它确实是存在的。
C99 中,结构中的最后一个元素允许是未知大小的数组,这就叫做『柔性数组』成员。
例如:

typedef struct st_type
{
 int i;
 int a[];//柔性数组成员
}type_a;

6.1 柔性数组的特点和使用

  • 结构中的柔性数组成员前面必须至少一个其他成员。
  • sizeof 返回的这种结构大小不包括柔性数组的内存。
  • 包含柔性数组成员的结构用malloc ()函数进行内存的动态分配,并且分配内存应该大于结构的大小,以适应柔性数组的预期大小。
typedef struct t_type
{
 int i;
 int a[0];//柔性数组成员
}S;
int main()
{
	S a;
	printf("%d\n", sizeof(a));//输出的是4
	//只计算柔性数组前成员变量的大小	
	//能否像上面那样定义变量呢?
	//其实是不可以的
	//这样定义就是4个字节,只能存i
	//而数组a是没有空间的
	
	//正确的方法是通过malloc函数来创建
	//给数组a开辟40个字节
	S* ptr = (S*)malloc(sizeof(S) + 40);
	//这里sizeof计算的是变量i的大小
	//+40则是给数组a开辟的
	//这是ptr存放的就是所开辟空间的起始地址
	if(ptr == NULL)
	{
		return 1;
	}
	//给成员赋值
	ptr->i = 100;
    for (int i = 0; i < 10; ++i)
    {
        ptr->a[i] = i;
    }
    //如果空间不够用还可以增容
    S* ret = (S*)realloc(ptr, sizeof(S) + 80);
    if(ret != NULL)
    {
        ptr = ret;
        ret = NULL;
    }
    //....
    free(ptr);
    ptr = NULL;
}

6.2 柔性数组的优势

上述结构体成员也可以把柔性数组改为指针,修改一下以上代码:

typedef struct t_type
{
	int i;
	int* a;
}S;
int main()
{
    S* ps = (S*)malloc(sizeof(S));
    if (ps == NULL)
    {
        return 1;
    }
    ps->i = 10;
    ps->a = (int*)malloc(40);
    
    for (int i = 0; i < 10; ++i)
    {
        ps->a[i] = i;
    }
    //增容
    int* ret = (int*)realloc(ps->a, 80);
    if (ret == NULL)
    {
        return 1;
    }
    ps = ret;
    ret = NULL;
    free(ps->a);
    free(ps);
    ps = NULL;
    return 0;
}

一个是柔性数组成员,一个是指针这两种哪种方案比较好呢?

采用柔性数组的方法,两个成员变量一次malloc就搞定了,最后一次free就完事了。

第二种指针的方法需要两次malloc,两次free。

如果malloc的次数较多,那free的次数就要多,这个时候忘记free,就容易出现内存泄漏,指针的方法容易出错,其次malloc的次数越多,那形成内存碎片的可能性就越多,这些碎片越多使得内存的利用率就越低,而第一种情况就使得内存碎片的可能性降低了,并且有利于访问速度。


本篇完。

你可能感兴趣的:(C语言进阶,c语言)