auto_ptr解析

(1)

auto_ptr是当前C++标准库中提供的一种智能指针,或许相对于boost库提供的一系列眼花缭乱的智能指针, 或许相对于Loki中那个无所不包的智能指针,这个不怎么智能的智能指针难免会黯然失色。诚然,auto_ptr有这样那样的不如人意,以至于程序员必须像使用”裸“指针那样非常小心的使用它才能保证不出错,以至于它甚至无法适用于同是标准库中的那么多的容器和一些算法,但即使如此,我们仍然不能否认这个小小的auto_ptr所蕴含的价值与理念。
  auto_ptr的出现,主要是为了解决“被异常抛出时发生资源泄漏”的问题。即如果我们让资源在局部对象构造时分配,在局部对象析构时释放。这样即使在函数执行过程时发生异常退出,也会因为异常能保证局部对象被析构从而保证资源被释放。auto_ptr就是基于这个理念而设计, 这最早出现在C++之父Bjarne Stroustrup的两本巨著TC++PL和D&E中,其主题为"resource acquisition is initialization"(raii,资源获取即初始化),然后又在Scott Meyer的<<More Effective C++>>中相关章节的推动下,被加入了C++标准库。
  下面我就列出auto_ptr的源代码,并详细讲解每一部分。因为标准库中的代码要考虑不同编译器支持标准的不同而插入了不少预编译判断,而且命名可读性不是很强(即使是侯捷老师推荐的SGI版本的stl,可读性也不尽如人意), 这里我用了Nicolai M. Josuttis(<<The C++ standard library>>作者)写的一个auto_ptr的版本,并做了少许格式上的修改以易于分析阅读。

 

namespace  std
{
 template
< class  T >
 
class  auto_ptr 
 {
 
private :
  T
*  ap; 
 
public :

  
//  constructor & destructor ----------------------------------- (1)
   explicit  auto_ptr (T *  ptr  =   0 throw () : ap(ptr){}

  
~ auto_ptr()  throw () 
  {
   delete ap;
  }

  
  
//  Copy & assignment --------------------------------------------(2)
  auto_ptr (auto_ptr &  rhs)  throw () :ap(rhs.release()) {}
  template
< class  Y >   
  auto_ptr (auto_ptr
< Y >&  rhs)  throw () : ap(rhs.release()) { }

  auto_ptr
&   operator =  (auto_ptr &  rhs)  throw () 
  {
   reset(rhs.release());
   
return   * this ;
  }
  template
< class  Y >
  auto_ptr
&   operator =  (auto_ptr < Y >&  rhs)  throw () 
  {
   reset(rhs.release());
   
return   * this ;
  }

  
//  Dereference----------------------------------------------------(3)
  T &   operator * ()  const   throw () 
  {
   
return   * ap;
  }
  T
*   operator -> ()  const   throw () 
  {
   
return  ap;
  }

  
//  Helper functions------------------------------------------------(4)
  
//  value access
  T *   get ()  const   throw () 
  {
   
return  ap;
  }

  
//  release ownership
  T *  release()  throw ()
  {
   T
*  tmp(ap);
   ap 
=   0 ;
   
return  tmp;
  }

  
//  reset value
   void  reset (T *  ptr = 0 throw () 
  {
   
if  (ap  !=  ptr) 
   {
    delete ap;
    ap 
=  ptr;
   }
  }

  
//  Special conversions-----------------------------------------------(5)
  template < class  Y >
  
struct  auto_ptr_ref
  {
   Y
*  yp;
   auto_ptr_ref (Y
*  rhs) : yp(rhs) {}
  };

  auto_ptr(auto_ptr_ref
< T >  rhs)  throw () : ap(rhs.yp) { }
  auto_ptr
&   operator =  (auto_ptr_ref < T >  rhs)  throw () 
  {  
   reset(rhs.yp);
   
return   * this ;
  }
  template
< class  Y >
  
operator  auto_ptr_ref < Y > ()  throw () 
  {
   
return  auto_ptr_ref < Y > (release());
  }
  template
< class  Y >
  
operator  auto_ptr < Y > ()  throw ()
  {
   
return  auto_ptr < Y > (release());
  }
 };
}


1 构造函数与析构函数
auto_ptr在构造时获取对某个对象的所有权(ownership),在析构时释放该对象。我们可以这样使用auto_ptr来提高代码安全性:
int* p = new int(0);
auto_ptr<int> ap(p);
从此我们不必关心应该何时释放p, 也不用担心发生异常会有内存泄漏。
这里我们有几点要注意:
1) 因为auto_ptr析构的时候肯定会删除他所拥有的那个对象,所有我们就要注意了,一个萝卜一个坑,两个auto_ptr不能同时拥有同一个对象。像这样:
int* p = new int(0);
auto_ptr<int> ap1(p);
auto_ptr<int> ap2(p);
因为ap1与ap2都认为指针p是归它管的,在析构时都试图删除p, 两次删除同一个对象的行为在C++标准中是未定义的。所以我们必须防止这样使用auto_ptr.
2) 考虑下面这种用法:
int* pa = new int[10];
auto_ptr<int> ap(pa);
因为auto_ptr的析构函数中删除指针用的是delete,而不是delete [],所以我们不应该用auto_ptr来管理一个数组指针。
3) 构造函数的explicit关键词有效阻止从一个“裸”指针隐式转换成auto_ptr类型。
4) 因为C++保证删除一个空指针是安全的, 所以我们没有必要把析构函数写成:
~auto_ptr() throw()
{
 if(ap) delete ap;
}

2 拷贝构造与赋值
与引用计数型智能指针不同的,auto_ptr要求其对“裸”指针的完全占有性。也就是说一个”裸“指针不能同时被两个以上的auto_ptr所拥有。那么,在拷贝构造或赋值操作时,我们必须作特殊的处理来保证这个特性。auto_ptr的做法是“所有权转移”,即拷贝或赋值的源对象将失去对“裸”指针的所有权,所以,与一般拷贝构造函数,赋值函数不同, auto_ptr的拷贝构造函数,赋值函数的参数为引用而不是常引用(const reference).当然,一个auto_ptr也不能同时拥有两个以上的“裸”指针,所以,拷贝或赋值的目标对象将先释放其原来所拥有的对象。
这里的注意点是:
1) 因为一个auto_ptr被拷贝或被赋值后, 其已经失去对原对象的所有权,这个时候,对这个auto_ptr的提领(dereference)操作是不安全的。如下:
int* p = new int(0);
auto_ptr<int> ap1(p);
auto_ptr<int> ap2 = ap1;
cout<<*ap1; //错误,此时ap1只剩一个null指针在手了
这种情况较为隐蔽的情形出现在将auto_ptr作为函数参数按值传递,因为在函数调用过程中在函数的作用域中会产生一个局部对象来接收传入的auto_ptr(拷贝构造),这样,传入的实参auto_ptr就失去了其对原对象的所有权,而该对象会在函数退出时被局部auto_ptr删除。如下:
void f(auto_ptr<int> ap){cout<<*ap;}
auto_ptr<int> ap1(new int(0));
f(ap1);
cout<<*ap1; //错误,经过f(ap1)函数调用,ap1已经不再拥有任何对象了。
因为这种情况太隐蔽,太容易出错了, 所以auto_ptr作为函数参数按值传递是一定要避免的。或许大家会想到用auto_ptr的指针或引用作为函数参数或许可以,但是仔细想想,我们并不知道在函数中对传入的auto_ptr做了什么, 如果当中某些操作使其失去了对对象的所有权, 那么这还是可能会导致致命的执行期错误。 也许,用const reference的形式来传递auto_ptr会是一个不错的选择。

2)我们可以看到拷贝构造函数与赋值函数都提供了一个成员模板在不覆盖“正统”版本的情况下实现auto_ptr的隐式转换。如我们有以下两个类
class base{};
class derived: public base{};
那么下列代码就可以通过,实现从auto_ptr<derived>到auto_ptr<base>的隐式转换,因为derived*可以转换成base*类型
auto_ptr<base> apbase = auto_ptr<derived>(new derived);

3) 因为auto_ptr不具有值语义(value semantic), 所以auto_ptr不能被用在stl标准容器中。
所谓值语义,是指符合以下条件的类型(假设有类A):
A a1;
A a2(a1);
A a3;
a3 = a1;
那么
a2 == a1, a3 == a1
很明显,auto_ptr不符合上述条件,而我们知道stl标准容器要用到大量的拷贝赋值操作,并且假设其操作的类型必须符合以上条件。


3 提领操作(dereference)
提领操作有两个操作, 一个是返回其所拥有的对象的引用, 另一个是则实现了通过auto_ptr调用其所拥有的对象的成员。如:
struct A
{
 void f();
}
auto_ptr<A> apa(new A);
(*apa).f();
apa->f();
当然, 我们首先要确保这个智能指针确实拥有某个对象,否则,这个操作的行为即对空指针的提领是未定义的。

4 辅助函数
1) get用来显式的返回auto_ptr所拥有的对象指针。我们可以发现,标准库提供的auto_ptr既不提供从“裸”指针到auto_ptr的隐式转换(构造函数为explicit),也不提供从auto_ptr到“裸”指针的隐式转换,从使用上来讲可能不那么的灵活, 考虑到其所带来的安全性还是值得的。
2) release,用来转移所有权
3) reset,用来接收所有权,如果接收所有权的auto_ptr如果已经拥有某对象, 必须先释放该对象。

5 特殊转换
这里提供一个辅助类auto_ptr_ref来做特殊的转换,按照标准的解释, 这个类及下面4个函数的作用是:使我们得以拷贝和赋值non-const auto_ptrs, 却不能拷贝和赋值const auto_ptrs. 我无法非常准确的理解这两句话的意义,但根据我们观察与试验,应该可以这样去理解:没有这些代码,我们本来就可以拷贝和赋值non-const的auto_ptr和禁止拷贝和赋值const的auto_ptr的功能, 只是无法拷贝和赋值临时的auto_ptr(右值), 而这些辅助代码提供某些转换,使我们可以拷贝和赋值临时的auto_ptr,但并没有使const的auto_ptr也能被拷贝和赋值。如下:
auto_ptr<int> ap1 = auto_ptr<int>(new int(0));
auto_ptr<int>(new int(0))是一个临时对象,一个右值,一般的拷贝构造函数当然能拷贝右值,因为其参数类别必须为一个const reference, 但是我们知道,auto_ptr的拷贝函数其参数类型为reference,所以,为了使这行代码能通过,我们引入auto_ptr_ref来实现从右值向左值的转换。其过程为:
1) ap1要通过拷贝 auto_ptr<int>(new int(0))来构造自己
2) auto_ptr<int>(new int(0))作为右值与现有的两个拷贝构造函数参数类型都无法匹配,也无法转换成该种参数类型
3) 发现辅助的拷贝构造函数auto_ptr(auto_ptr_ref<T> rhs) throw()
4) 试图将auto_ptr<int>(new int(0))转换成auto_ptr_ref<T>
5) 发现类型转换函数operator auto_ptr_ref<Y>() throw(), 转换成功,从而拷贝成功。
从而通过一个间接类成功的实现了拷贝构造右值(临时对象)
同时,这个辅助方法不会使const auto_ptr被拷贝, 原因是在第5步, 此类型转换函数为non-const的,我们知道,const对象是无法调用non-const成员的, 所以转换失败。当然, 这里有一个问题要注意, 假设你把这些辅助转换的代码注释掉,该行代码还是可能成功编译,这是为什么呢?debug一下, 我们可以发现只调用了一次构造函数,而拷贝构造函数并没有被调用,原因在于编译器将代码优化掉了。这种类型优化叫做returned value optimization,它可以有效防止一些无意义的临时对象的构造。当然,前提是你的编译器要支持returned value optimization。

  可见,auto_ptr短短百来行的代码,还是包含了不少"玄机"的。

 

(2)

标准auto_ptr智能指针机制很多人都知道,但很少使用它。这真是个遗憾,因为auto_ptr优雅地解决了C++设计和编码中常见的问题,正确地使用它可以生成健壮的代码。本文阐述了如何正确运用auto_ptr来让你的代码更加安全——以及如何避免对auto_ptr危险但常见的误用,这些误用会引发间断性发作、难以诊断的bug。

1.为什么称它为“自动”指针? auto_ptr只是众多可能的智能指针之一。许多商业库提供了更复杂的智能指针,用途广泛而令人惊异,从管理引用的数量到提供先进的代理服务。可以把标准C++ auto_ptr看作智能指针的Ford Escort(elmar注:可能指福特的一种适合家居的车型):一个简易、通用的智能指针,它不包含所有的小技巧,不像专用的或高性能的智能指针那么奢华,但是它可以很好的完成许多普遍的工作,它很适合日常性的使用。

auto_ptr所做的事情,就是动态分配对象以及当对象不再需要时自动执行清理。这里是一个简单的代码示例,没有使用auto_ptr所以不安全:

// 示例 1(a): 原始代码 //

void f()

{

T* pt( new T );

...代码...

delete pt;

}

如果f()函数只有三行并且不会有任何意外,这么做可能挺好的。但是如果f()从不执行delete语句,或者是由于过早的返回,或者是由于执行函数体时抛出了异常,那么这个被分配的对象就没有被删除,从而我们产生了一个经典的内存泄漏。

能让示例1(a)安全的简单办法是把指针封装在一个“智能的”类似于指针的对象里,这个对象拥有这个指针并且能在析构时自动删除这个指针所指的对象。因为这个智能指针可以简单的当成一个自动的对象(这就是说,它出了作用域时会自动毁灭),所以很自然的把它称之为“智能”指针:

// 示例 1(b): 安全代码, 使用了auto_ptr //

void f()

{

auto_ptr<T> pt( new T );

...代码...

} // 当pt出了作用域时析构函数被调用, 从而对象被自动删除

现在代码不会泄漏T类型的对象,不管这个函数是正常退出还是抛出了异常,因为pt的析构函数总是会在出栈时被调用。清理会自动进行。

最后,使用一个auto_ptr就像使用一个内建的指针一样容易,而且如果想要“撤销”资源,重新采用手动的所有权,我们只要调用release():

// 示例 2: 使用一个 auto_ptr //

void g()

{

T* pt1 = new T; // 现在,我们有了一个分配好的对象

// 将所有权传给了一个auto_ptr对象

auto_ptr<T> pt2( pt1 );

// 使用auto_ptr就像我们以前使用简单指针一样

*pt2 = 12; // 就像 "*pt1 = 12;"

pt2->SomeFunc(); // 就像 "pt1->SomeFunc();"

// 用get()来获得指针的值

assert( pt1 == pt2.get() );

// 用release()来撤销所有权

T* pt3 = pt2.release();

// 自己删除这个对象,因为现在

// 没有任何auto_ptr拥有这个对象

delete pt3;

} // pt2不再拥有任何指针,所以不要 // 试图删除它...ok,不要重复删除

最后,我们可以使用auto_ptr的reset()函数来重置auto_ptr使之拥有另一个对象。如果这个auto_ptr已经拥有了一个对象,那么,它会先删除已经拥有的对象,因此调用reset()就如同销毁这个auto_ptr,然后新建一个并拥有一个新对象:

// 示例 3: 使用reset() //

void h()

{

auto_ptr<T> pt( new T(1) );

pt.reset( new T(2) ); // 删除由"new T(1)"分配出来的第一个T

} // 最后,pt出了作用域, // 第二个T也被删除了



auto_ptr用法:

1.需要包含头文件<memory>

2.Constructor:explicit auto_ptr(X* p = 0) throw(); 将指针p交给auto_ptr对象托管

3.Copy constructor: auto_ptr(const auto_ptr&) throw(); template<class Y> auto_ptr(const auto_ptr<Y>& a) throw(); 指针的托管权会发生转移

4.Destructor: ~auto_ptr(); 释放指针p指向的空间

5.提供了两个成员函数 X* get() const throw();//返回保存的指针,对象中仍保留指针 X* release() const throw();//返回保存的指针,对象中不保留指针

auto_ptr实现关键点 1.利用特点”栈上对象在离开作用范围时会自动析构”

2.对于动态分配的内存,其作用范围是程序员手动控制的,这给程序员带来了方便但也不可避免疏忽造成的内存泄漏,毕竟只有编译器是最可靠的。

3.auto_ptr通过在栈上构建一个对象a,对象a中wrap了动态分配内存的指针p,所有对指针p的操作都转为对对象a的操作。而在a的析构函数中会自动释放p的空间,而该析构函数是编译器自动调用的,无需程序员操心。

多说无益,看一个最实用的例子:

#include <iostream>

#include <memory>

using namespace std;

class TC

{

public:

TC(){cout<<"TC()"<<endl;}

~TC(){cout<<"~TC()"<<endl;}

};

void foo(bool isThrow)

{

auto_ptr<TC> pTC(new TC); //方法2

//TC *pTC = new TC; //方法1

try

{

if(isThrow)

throw "haha";

}

catch(const char* e)

{

//delete pTC; //方法1

throw;

}

//delete pTC; //方法1

}

int main()

{

try

{

foo(true);

}

catch(...)

{

cout<<"caught"<<endl;

}

system("pause");

}

1.如果采用方案1,那么必须考虑到函数在因throw异常的时候释放所分配的内存。 这样造成的结果是在每个分支处都要很小心的手动 delete pTC;

2.如果采用方案2,那就无需操心何时释放内存,不管foo()因何原因退出, 栈上对象pTC的析构函数都将调用,因此托管在之中的指针所指的内存必然安全释放。

至此,智能指针的优点已经很明了了。

但是要注意使用中的一个陷阱,那就是指针的托管权是会转移的。 例如在上例中,如果 auto_ptr<TC> pTC(new TC); auto_ptr<TC> pTC1=pTC; 那么,pTC1将拥有该指针,而pTC没有了,如果再用pTC去引用,必然导致内存错误。

要避免这个问题,可以考虑使用采用了引用计数的智能指针,例如boost::shared_ptr等


auto_ptr不会降低程序的效率,但auto_ptr不适用于数组,auto_ptr根本不可以大规模使用。 shared_ptr也要配合weaked_ptr,否则会很容易触发循环引用而永远无法回收内存。理论上,合理使用容器加智能指针,C++可以完全避免内存泄露,效率只有微不足道的下降。

你可能感兴趣的:(delete,reference,编译器,initialization,optimization,Semantic)