C++ Primer学习笔记——$20 内存分配

题记:本系列学习笔记(C++ Primer学习笔记)主要目的是讨论一些容易被大家忽略或者容易形成错误认识的内容。只适合于有了一定的C++基础的读者(至少学完一本C++教程)。

 
作者: tyc611, 2007-03-03
   本文主要讨论C++的内存分配机制,operator new和operator delete函数的重载等内容。
   如果文中有错误或遗漏之处,敬请指出,谢谢!    C++中,内存分配和对象构造紧密相关,就像对象析构和内存回收一样。使用new表达式的时候,分配内存,并在该内存中构造一个对象;使用delete表达式的时候,调用析构函数撤销对象,并将对象所用内存还给系统。
 
   如用户程序要接管内存分配,就必须处理这两个任务。分配原始内存时,必须在内存中构造对象;在释放内存之前,必须保证适当地撤销这些对象。对未构造的内存中的对象进行赋值而不是初始化(严格地说,此时对象根本就不存在),其行为是未定义的。对许多类而言,这样做引起运行时崩溃。赋值涉及删除现存对象,如果没有现存对象,赋值操作符中的动作就会有灾难性效果。
 
C++中的内存分配
 
   C++提供下面两种方法分配和释放未构造的原始内存:
   1)allocator类,它提供可感知类型的内存分配。这个类支持一个抽象接口,以分配内存并随后使用该内存保存对象;
   2)标准库中的 operator new 和 operator delete ,它们分配和释放需要大小的原始的、未类型化的内存。
 
   C++还提供不同的方法在原始内存中构造和撤销对象:
   1)allocator类定义了名为construct和destroy的成员,其操作正如它们名字所指示的那样:construct成员在未构造内存中初始化对象,destroy成员在对象上运行适当的析构函数;
   2) 定位new表达式(placement new expression)接受指向未构造内存的指针,并在该空间中初始化一个对象或一个数组;
   3)可以直接调用对象的析构函数来撤销对象,运行析构函数并不释放对象所在的内存;
   4)算法uninitialized_fill和uninitialized_copy像fill和copy算法一样执行,除了它们在目的地构造对象而不是给对象赋值之外。
 
   注:现代的C++程序一般应该使用allocator类来分配内存,它更安全更灵活。但是,在构造对象的时候,用new表达式比allocator::construct成员更灵活。有几种情况下必须使用new。
 
allocator类
 
   allocator类是一个模板,它提供类型化的内存分配以及对象构造与撤销,头文件为<memory>。相关操作如下:
 
 allocator<T> a;  定义名为a的allocator对象,可以分配内存或构造T类型对象
 a.allocate(n)  分配原始的未构造内存以保存T类型的n个对象,返回指向首地址的指针
 a.deallocate(p, n)  释放内存,这段内存的起始地址为T*指针p,共有n个T类型的对象。在调用deallocate之前,调用在该内存中构造的任意对象的destroy是用户的责任
 a.construct(p, t)  在T*指针p所指内存中构造一个新元素。调用T类型的拷贝构造函数初始化该对象为t的副本
 a.destroy(p)  运行T*指针p所指对象的析构函数
 uninitialized_copy(b, e, b2)  从迭代器b和e标识的输入范围将元素拷贝到从迭代器b2开始的未构造的原始内存中。该函数在目的地构造元素,而不是给它们赋值。假定由b2指出的目的地足以保存输入范围中元素的副本
 uninitialized_fill(b, e, t)  将由迭代器b和e指出的范围中的对象初始化为t的副本。假定该范围是未构造的原始内存,使用拷贝构造函数构造对象
 uninitialized_fill(b, e, t, n)  将由迭代器b和e指出的范围中至多n个对象初始化为t的副本。假定范围内至少为n个元素大小,使用拷贝构造函数构造对象
 
   allocator类将内存分配和对象构造分开。当allocator对象分配内存的时候,它分配适当大小并排列成保存给定类型对象的空间。但是,它分配的内存是未构造的,allocator用户必须分别construct和destroy放置在该内存中的对象。
 
   我们拿vector类举例。为了获得可接受的性能,vector预先分配比所需元素空间更大的元素空间。每个将元素加到容器中的vector成员检查是否有可用空间以容纳另一元素。如果有,该成员在预分配内存中下一个可用位置初始化一个对象;如果没有空的元素空间可用,就重新分配vector;vector获取新的空间,将现存元素拷贝到该空间,增加新元素,并释放旧空间。vector所用存储开始是未构造内存,它还没有保存任何对象。将元素拷贝或增加到这个预分配空间的时候,必须使用allocator类的construct成员构造元素。
 
   为了更详细地说明,我们试着实现一个小型的vector demo,将之命名为Vector,以区别于标准类vector:
   template <typename T> class Vector {
   public:
      Vector(): elements(0), first_free(0), end(0) { }
      void push_back(const T&);
      // ...
   private:
      static std::allocator<T> alloc;  // object to get raw memory
      void reallocate();               // get more space and copy existing elements
      T* elements;                     // pointer to first element in the array
      T* first_free;                   // pointer to first free element in the array
      T* end;                          // pointer to one past the end of the array
   };
  
   注意,上面的alloc成员是static,因为我们只需要使用它的一些成员函数,其内部并不保存我们的数据。它唯一拥有的信息是它的分配类型T,而这与Vector模板的任何特定实例化类型都是一一对应的。
 
   类Vector中三个指针的含义如下图所示:
 
   成员push_back实现如下:
   template <typename T>
   void Vector<T>::push_back(const T& t)
   {
      if (first_free == end)
         reallocate();  // gets more space and copies existing elements ot it
      alloc.construct(first_free, t);
      ++first_free;
   }
 
   成员reallocate实现如下,这是Vector类最重要的一个成员:
   template <typename T>
   void Vector<T>::reallocate()
   {
      // compute size of current array and allocate space for twice as many elements
      std::ptrdiff_t size = first_free - elements;
      std::ptrdiff_t newcapacity = 2 * max(size, 1);
      // allocate space to hold newcapacity number of elements of type T
      T* newelements = alloc.allocate(newcapacity);
 
      // construct copies of the existing elements in the new space
      uninitialized_copy(elements, first_free, newelements);
 
      // destroy the old elements in reverse order
      for (T *p = first_free; p != elements; /* empty */ )
         alloc.destroy(--p);
      // deallocate cannot be called on 0 pointer
      if (elements)
         // deallocate the memory that held the elements
         alloc.deallocate(elements, end - elements);
 
      // make our data structure point to the new elements
      elements = newelements;
      first_free = elements + size;
      end = elements + newcapacity;
   }
 
operator new 函数 和 operator delete 函数
 
   首先,需要对new和delete表达式怎样工作有清楚的理解。当使用 new表达式
   string *sp = new string("initialized");  // 注意这里的new是操作符,不是函数
的时候,实际上发生三个步骤:首先,该表达式调用名为 operator new的标准库函数,分配足够大的原始的未类型化的内存,以保存指定类型的一个对象;接下来,运行该类型的一个构造函数,用指定初始化式构造对象;最后,返回指向新分配并构造的对象的指针。
   当使用 delete表达式
   delete sp;    // 注意这里的delete是操作符,不是函数
删除动态分配对象的时候,发生两个步骤:首先,对sp指向的对象运行适当的析构函数;然后,通过调用名为 operator delete的标准库函数释放该对象所用内存。
 
注意:标准库函数operator new和operator delete的命名容易让人误解。与其他operator函数不同,这些函数没有重载new或delete表达式(操作符),实际上,我们不能重定义new和delete表达式的行为。通过调用operator new函数执行new表达式获得内存,并接着在该内存中构造一个对象,通过执行delete表达式撤销一个对象,并接着调用operator delete函数,以释放内存。即,标准库函数operator new只是分配空间而不负责构造对象,operator delete函数只是释放空间而不负责撤销对象。
 
   operator new 和 operator delete函数有两个重载版本,每个版本支持相关的new表达式和delete表达式:
   void* operator new (size_t);        // allocate an object
   void* operator new [] (size_t);     // allocate an array
  
   void operator delete (void*);       // free an oject
   void operator delete [] (void*);    // free an array
 
   虽然operator new 和 operator delete函数的设计意图是供new表达式使用,但它们通常是标准库中的可用函数。可以使用它们获得未构造内存,它们有点类似allocator类的allocate和deallocate成员。例如,代替使用allocator对象,可以在Vector类中使用operator new 和 operator delete函数。在分配新空间时我们曾经编写:
   T* newelements = alloc.allocate(newcapacity);
这里可以改写为:
   T* newelements = static_cast<T*> (operator new[] (newcapacity * sizeof(T)));
类似地,在重新分配由Vector成员elements指向的旧空间的时候,我们曾经编写:
   alloc.deallocate(elements, end - elements);
这里可以改写为:
   operator delete[] (elements);
这些函数的表现与allocator类的allocate和deallocate成员类似,但在一个重要方面不同:它们在void*指针而不是类型化的指针上进行操作。
 
   一般而言,使用allocator类比直接使用operator new 和 operator delete函数更为类型安全。allocate成员分配类型化的内存,所以使用它的程序可以不必计算以字节为单位的所需内存量,它们也可以避免对operator new的返回值进行强制类型转换。类似地,deallocate释放特定类型的内存,也不必转换为void*。
 
定位new表达式和显式析构函数的调用
 
   标准库函数operator new 和 operator delete是allocator的allocate和deallocate成员的低级版本,它们都只分配但不初始化内存。
 
   allocator的成员construct和destroy也有两个低级选择,这些成员在由allocator对象分配的空间中初始化和撤销对象。
 
   类似于construct成员,有第三种new表达式,称为 定位new(placement new)。定位new表达式在已分配的原始内存中初始化一个对象,它与new的其他版本的不同之处在于,它不分配内存。相反,它接受指向已分配但未构造内存的指针,并在该内存中初始化一个对象。实际上,定位new表达式使我们能够在特定的、预分配的内存地址构造一个对象。
 
   定位new表达式的形式是:
   new ( place-address) type
   new ( place_address) type ( initializer_list)
其中 place_address必须是一个指针,而 initializer_list提供了(可能为空的)初始化列表,以便在构造新分配的对象时使用。
 
   可以使用定位new表达式代替Vector实现中的construct调用。原来的代码:
   alloc.construct (first_free, t);
可以改写为等价的定位new表达式代替:
   new (first_free) T(t);
 
   定位new表达式比allocator类的construct成员更灵活。定位new表达式初始化一个对象的时候,它可以使用任何构造函数,并直接建立对象。construct函数总是使用拷贝构造函数。
 
   正如定位new表达式是调用allocator类的construct成员的低级选择,我们可以使用析构函数的显式调用作为调用destroy函数的低级选择。
 
   在使用allocator对象的Vector版本中,通过使用destroy函数清除每个元素:
   for (T *p = first_free; p != elements; /* empty */ )
      alloc.destroy(--p);
可以改写为:
   for (T *p = first_free; p != elements; /* empty */ )
      (--p)->~T(); // call the destructor
 
类特定的new和delete
 
   默认情况下,new和delete表达式通过调用标准库定义的operator new和operator delete版本分析内存和释放内存。类也可以通过定义自己的名为operator new和operator delete成员来优化管理自身类型的内存分配和释放。
 
   编译器看到类类型的new或delete表达式的时候,它查看该类是否有operator new和operator delete成员,如果类定义(或继承)了自己的成员new和delete函数,则使用那些函数为对象分配和释放内存;否则,调用这些函数的标准库版本。
 
   当通过这种方式来优化new和delete的行为时,只需要定义operator new和operator delete的新版本,new和delete表达式自己负责对象的构造和撤销。如果类定义了这两个函数中的一个,它也应该定义另一个。
 
   类成员operator new函数必须具有返回类型为void*,并接受size_t类型的参数。在new表达式中调用operator new函数时,new表达式用以字节计算的分配内存量初始化函数的size_t参数。
   类成员operator delete函数必须具有返回类型void。它可以定义为接受单个void*类型形参,也可以定义为接受两个形参,即void*和size_t类型。在delete表达式中调用operator delete函数时,delete表达式用被delete的指针初始化void*形参,该指针可以为空指针。如果提供了size_t形参,就由编译器用第一个形参所指对象的字节大小自动初始化size_t形参。
   除非类是某继承层次的一部分,否则形参size_t不是必需的。当delete指向继承层次中类型的指针时,指针可以指向某基类对象,也可以指向派生类对象。派生类对象的大小一般比基类对象大。如果基类有virtual析构函数,则传给operator delete的大小将根据被删除指针所指对象的动态类型而变化;如果基类没有virtual析构函数,那么,通过基类指针删除指向派生类对象的指针的行为,跟往常一样是未定义的。
 
   operator new和operator delete函数隐式地为静态函数,不必显式地将它们声明为static,虽然这样做是合法的。成员new和delete函数必须是静态的,因为它们要么在构造对象之前使用(operator new),要么在撤销对象之后使用(operator delete),因此,这些函数没有成员数据可操纵。像任意其他静态成员函数一样,new和delete只能直接访问所属类的静态成员。
 
   也可以定义成员operator new[]和operator delete[]来管理类类型的数组。如果这些operator函数存在,编译器就使用它们代替全局版本。
 
   类成员operator new[]必须具有返回类型void*,并且接受第一个形参类型为size_t。new表达式用存储该数组所需的字节数自动初始化operatore new[]的size_t形参。
   类成员operator delete[]必须具有返回类型为void,并且第一个参数为void*类型。delete表达式用表示该数组的起始地址自动初始化operator delete[]的void*形参。类的operator delete[]也可以有两个形参,第二个形参为size_t类型。如果提供了这个附加形参,由编译器用数组所需存储量的字节数自动初始化这个形参。
 
   如果类定义了自己的成员new和delete,类的用户仍可以通过使用全局作用域操作符强制new或delete表达式使用全局的库函数。例如:
   Type *p = ::new Type;    // uses global operator new
   ::delete p;              // uses global operator delete
注意:在定义或调用new和delete时,它们始终应该配对出现。比如,要么都调用全局的,要么都调用类成员;定义一个应当同时定义另一个。
 
   示例代码如下:
 

#include <iostream>

class Foo {
public:
    void* operator new (std::size_t size) {
        std::cout << "Foo::operator new" << std::endl;
        return ::operator new(size);
    }
    void* operator new[] (std::size_t size) {
        std::cout << "Foo::operator new[]" << std::endl;
        return ::operator new[](size);
    }
    void operator delete (void* p) {
        std::cout << "Foo::operator delete" << std::endl;
        ::operator delete(p);
    }
    void operator delete[] (void* p) {
        std::cout << "Foo::operator delete[]" << std::endl;
        ::operator delete[](p);
    }    
};

int main () {
    std::cout << "> Class member" << std::endl;
    Foo *p = new Foo;
    delete p;
    Foo *pa = new Foo[5];
    delete [] pa;

    std::cout << "> Global" << std::endl;
    Foo *p2 = ::new Foo;
    ::delete p2;
    Foo *pa2 = ::new Foo[5];
    ::delete [] pa2;
    
    return 0;
}

运行结果为:
> Class member
Foo::operator new
Foo::operator delete
Foo::operator new[]
Foo::operator delete[]
> Global

Terminated with return code 0
Press any key to continue ...

 
   如果文中有错误或遗漏之处,敬请指出,谢谢!
参考文献:
[1] C++ Primer(Edition 4)
[2] Thinking in C++(Volume Two, Edition 2)
[3] International Standard:ISO/IEC 14882:1998

你可能感兴趣的:(C++,vector,delete,编译器,destructor,structure)