浅析C++内存分配与释放操作过程

引言:C++中总共有三种方式可以分配内存,new operator, operator new,placement new。 

 一,new operator 

这就是我们最常使用的 new 操作符。查看汇编码可以看出:它不是一个函数,所以没有堆栈信息,而且它不能被重载。

请看下面一段代码:

#include 
class A
{
public:
	A(int x):m_x(x)
	{
		std::cout << "constructor of A" << std::endl;
	}
	~A()
	{
		std::cout << "destructor of A" << std::endl;
	}
private:
	int m_x;
};

int main(int argc, char* argv[])
{
	A *pa = new A(1);
	delete pa;
	return 0;
}

调用 A *pa = new A(1); 的过程共总分为三步

1,调用 void* operator new(size_t size)分配sizeof(A)大小的内存;

2,在第一步返回的地址上调用A的构造函数;

3,将第一步返回的地址赋值给pa;

与 new operator 对应的是 delete operator,它也是操作符,同样不能被重载。

调用 delete pa;的过程大致分为两步

1,在 pa 所指的地址上调用A类的析构函数;

2,调用void operator delete(void *pUserData)函数释放pa所指内存;

如果A类没有声明析构函数,编译器也没有不要合成析构函数,上述delete过程就只有第二步。

对基本数据类型也只有第二部。

现在思考一个问题:考虑上诉代码,下面的代码会有内存泄漏吗?

void *pvoid = pa;

delete pvoid;

上述问题可以表述为执行 delete pa 时释放的是sizeof(A)的内存吗?

答案是肯定的,因为不管是 delete pa 还是 delete pvoid 最后执行的都是 void operator delete(void *pUserData),

唯一的区别是delete pvoid 时不会调用A类的构造函数。


二,operator new

这个函数是 new opertor 必定会调用的,其定义为

void *__CRTDECL operator new(size_t size) _THROW1(_STD bad_alloc)
        {       // try to allocate size bytes
        void *p;
        while ((p = malloc(size)) == 0)
                if (_callnewh(size) == 0)
                {       // report no memory
                static const std::bad_alloc nomem;
                _RAISE(nomem);
                }


        return (p);
        }

其中 _RAISE 宏定义为 

#define _RAISE(x) throw x

可以看出,这个函数最终会调用C语言中的 malloc 函数,而且分配内存失败的话会抛出 std::bad_alloc 异常。

与之对应的是 operator delete,其定义为

void operator delete(
        void *pUserData
        )
{
        _CrtMemBlockHeader * pHead;

        RTCCALLBACK(_RTC_Free_hook, (pUserData, 0));

        if (pUserData == NULL)
            return;

        _mlock(_HEAP_LOCK);  /* block other threads */
        __TRY

            /* get a pointer to memory block header */
            pHead = pHdr(pUserData);

             /* verify block type */
            _ASSERTE(_BLOCK_TYPE_IS_VALID(pHead->nBlockUse));

            _free_dbg( pUserData, pHead->nBlockUse );

        __FINALLY
            _munlock(_HEAP_LOCK);  /* release other threads */
        __END_TRY_FINALLY

        return;
}

可以看出,这个函数会调用 _free_dgb。再看看C语言中的 free 函数定义

extern "C" _CRTIMP void __cdecl free(
        void * pUserData
        )
{
        _free_dbg(pUserData, _NORMAL_BLOCK);
}

所以,operator delete 最终的释放过程和 free 函数相同。

而且这两个函数都可以被重载

#include 
class A
{
public:
	A(int x):m_x(x)
	{
		std::cout << "constructor of A" << std::endl;
	}
	~A()
	{
		std::cout << "destructor of A" << std::endl;
	}
	void* operator new(size_t size)
	{
		std::cout << "operator new of A" << std::endl;
		return ::operator new(size);
	}
	void operator delete(void* pUserData)
	{
		std::cout << "operator delete of A" << std::endl;
		::operator delete(pUserData);
	}
private:
	int m_x;
};

int main(int argc, char* argv[])
{
	A *pa = new A(1);
	delete pa;
	return 0;
}

需要注意的是,重载的时候要能保证其原有的行为,而且重载时不管有没有加static,这两个函数都是static类型的。

现在思考两个问题:

1,如何保证一个类不能在堆上创建。(比如考虑到性能因素)

2,如何保证一个类对象不能被delete。(比如有时候全局作用域的单一实例不能被delete)

答案是只需将类的operator new 和 operator delete 重载为 非public 类型的就可以了。这样的话这两行代码

A *pa = new A(1);
delete pa;
根本不能通过编译。

顺便提另一个问题:如果保证一个类不能在栈上创建?

答案同样是是将该类的析构函数声明为非 public 类型的就可以了。

这样的话即便是创建该类的 global 对象也会导致编译失败。


三,placement new

这是一个全局函数,其定义为:

inline void *__CRTDECL operator new(size_t, void *_Where) _THROW0()
	{	// construct array with placement at _Where
	return (_Where);
	}

它同样可以被重载

class A
{
public:
	A(int x):m_x(x)
	{
		std::cout << "constructor of A" << std::endl;
	}
	~A()
	{
		std::cout << "destructor of A" << std::endl;
	}
	void *operator new(size_t size)
	{
		std::cout << "operator new of A" << std::endl;
		return ::operator new(size);
	}

	void* operator new(size_t size, void* p)
	{
		std::cout << "placement new of A" << std::endl;
		return ::operator new(size, p);
	}
	void operator delete(void* pUserData)
	{
		std::cout << "operator delete of A" << std::endl;
		::operator delete(pUserData);
	}

但需要注意的是,如果只重载了 void *operator new(size_t size) ,调用placement new 的时候将会调到编译错误。

同样,如果如果只重载了 void *operator new(size_t size, void*p), 执行new 操作 的时候也会调到编译错误。

placement new 的执行忽略了size_t参数,只返还第二个参数。其结果是允许用户把一个对象放到一个特定的地方,达到调用构造函数的效果。


和其他普通的new不同的是,它在调用时括号里多了另外一个参数。比如:

void *ptr = operator new(sizeof(A));	//operator new
A *pa = new(ptr)A(2);			//placement new
pa->~A();

括 号里的参数ptr是一个指针,它指向一个内存缓冲器,placement new 将在这个缓冲器上分配一个对象。

placement new 的返回值是这 个被构造对象的地址(比如括号中的传递参数)。

placement new是operator new重载的一个版本。它并不分配内存,只是返回指向已经分配好的某段内存的一个指针。因此不能删除它,也没有对应的delete函数。

但需要调用对象的析构函数。因此,最后应该需要执行pa->~A();

placement new主要适用于:

1,在对时间要求非常高的应用程序中,因为这些程序分配的时间是确定 的;

2,长时间运行而不被打断的程序;

3,执行一个垃圾收集器 (garbage collector)。


还有一点需要注意的是,看如下代码中:

class A
{
public:
	A(int x = 1):m_x(x){}
	~A()
	{
	}
private:
	int m_x;
};

int main(int argc, char* argv[])
{
	const int N = 8;
	void *ptr = operator new(sizeof(A) * N);
	A *pa = new(ptr)A[N];	
	return 0;
}
这是一段隐藏巨大错误的代码,很容易造成运行时内存错误。

因为使用placement new分配自定义对象的数组时,如果该类定义了析构函数(这点很重要),应该多分配4个字节用于存储元素个数。

所以上述main函数应该改成

int main(int argc, char* argv[])
{
	const int N = 8;
	void *ptr = operator new(sizeof(A) * N + sizeof(int));
	A *pa = new(ptr)A[N];	
	return 0;
}
下面是我调试时的截图。

ptr指向内存:

pa指向内存:

从中可以看出ptr所指内存的头4个字节存储元素个数。pa 实际指向 ptr + 4 的地址。

总结:

1,new 和 delete 最终都会调用C语言中的 malloc 和 free 过程。

2,想要将对象构造在指定的内存地址上时可以使用placement new,但使用时要格外小心。

3,只想分配指定大小的内存而不构造对象时,可以用operator new 取代 new operator。

4,可以重载类的operator new 来跟踪类对象在堆上创建的过程及总数。

5,在C++中应该尽量使用new operator,因为这个操作符自动检查需要分配的内存大小。


你可能感兴趣的:(内存分配)