compler moves this pointer while Upcasting derived ojbect pointe to parent pointe by static_cast

原文链接


在多继承的情况下,用static_cast去upcast子对象指针到父对象指针时候,This 指针会自动偏移到正确的那路父对象指针。 条件是static_cast时候,子对象的指针不可以是(void *)必须是(static_cast *). 原因是static_cast是编译时候处理的。


单继承(Single Inheritance,SI)对象模型


考虑下面的这个类:


[cpp] view plain copy
  1. class A  
  2. {  
  3. public:  
  4.     int m_a;  
  5.     int m_b;  
  6. };  
  7.   
  8. A a;  

class object a在内存中的布局如下所示:

compler moves this pointer while Upcasting derived ojbect pointe to parent pointe by static_cast_第1张图片

两个member data按照顺序排列,class object a的地址就是该内存空间的首地址。现在我们增加一个类:


[cpp] view plain copy
  1. class B : public A  
  2. {  
  3. public:  
  4.     int m_c;  
  5. };  
  6.   
  7. B b;  
  8. A* a = &b; // upcast  
  9. B* b2 = static_cast<B*>(a); // downcast  

class object b在内存中的布局如下图:

compler moves this pointer while Upcasting derived ojbect pointe to parent pointe by static_cast_第2张图片

先是A类的subobject内存布局,然后是B类的data member。C++标准保证“出现在派生类中的基类subobject保留其原样性不变”。因此无论class A的布局如何,都会完整地存在于class B的内存模型中,这主要考虑和C的兼容性。但有以下几点需要注意(请不要被下面3条所述细节困扰,如果实在不太清楚,可以略过,我们的重点在于SI的基础知识):


1)class A的因内存alignment而产生的padding bytes也必须出现在B的class A subobject中,这确保了基类subobject的严格原样性。

2)对于具有virtual function的类体系,vptr的放置根据不同编译器会有两种方式:头部和尾部。对于放在头部的编译器,如果这里给B类增加一个virtual destructor,从而让A无virtual机制而让B有virtual机制,class object b的头部就是vptr而不是class A subobject了。但这不会影响指针的相同性。

3)如果B是virtual继承于A,则事情另有变数。用Stanley B. Lippman的话说“任何规则一旦遇到virtual base class,就没辙了”。这里我们不讨论这个题外话。


&b、a和b2所指向的都是b的首地址。因此,在SI模型下,对象内存采用重叠的模型,基类和任何的派生类的指针,都指向该对象的首地址,因此这些指针的地址值都是一样的——所有基类subobject都共享相同首地址。


也就是说,在一个继承体系内,不论你用什么样的方式对一个指向了某对象的指针进行downcast或upcast,指针的地址值都是一样的。再加一层体系如下:


[cpp] view plain copy
  1. class C : public B  
  2. {  
  3. public:  
  4.     int m_d;  
  5. };  

compler moves this pointer while Upcasting derived ojbect pointe to parent pointe by static_cast_第3张图片


A、B、C这3个在同一体系下的类的指针无论怎样进行相互casting,得到的地址都一样。



多继承(Multiple Inheritance,MI)对象模型


MI机制是C++这门语言的特性之一,同时,也是复杂度的罪魁祸首之一!因为,在这里,编译器又背着我们做了一些事情,这也是C++饱受批评的主要原因。


请考虑下面的程序:


[cpp] view plain copy
  1. class A  
  2. {  
  3. public:  
  4.     int m_a;  
  5. };  
  6.   
  7. class B  
  8. {  
  9. public:  
  10.     int m_b;  
  11. };  
  12.   
  13. class C  
  14. {  
  15. public:  
  16.     int m_c;  
  17. };  
  18.   
  19. class D : public A, public B, public C  
  20. {  
  21. public:  
  22.     int m_d;  
  23. };  
  24.   
  25. A* a;  
  26. B* b;  
  27. C* c;  
  28. D d;  
  29. a = &d;  
  30. b = &d;  
  31. c = &d;  

类关系如图所示:


compler moves this pointer while Upcasting derived ojbect pointe to parent pointe by static_cast_第4张图片


这是一个最简单的MI体系,D继承自三个base class。我们再来看看它的内存模型:


compler moves this pointer while Upcasting derived ojbect pointe to parent pointe by static_cast_第5张图片


可以看到,和SI不同的是,MI采用了非重叠模型——每个base class subobject都有自己的首地址。这里,A、B和C subobject各自占据它们自己的首地址,唯一的例外就是D object——也就是这个模型的拥有者,它的首地址和class A subobject是相同的。因此,我们说:


assert( a == &d );

assert( b != &d );

assert( c != &d );


“哎!等等!”,我听到了你在打断我,“我们在上面的程序中已经写明


b = &d;

c = &d;


这里为什么你会这么写:


assert( b != &d );

assert( c != &d );


你确定断言不会crash吗?”。如果你这么问我,我很高兴,这表明你在跟着我。下面是我通过试验得到的数据:




这就是问题的关键所在——编译器背着我们做了一件事情:this指针调整!在MI的世界里,this指针调整非常频繁,而这种调整,主要发生在 派生类对象 和“第二个以及后续的基类对象”(像咒语一样)之间的转换。在上面的例子里,“第二个以及后续的基类”就是类B和C。这个转换就是


b = &d; // upcast

c = &d; // upcast


this指针就是在这个时候被compiler调整的。b和c分别指向了正确的,属于它们各自的subobject的地址。同理,当我们将b和c转换成d指针的时候,this指针也会调整


D* d2 = static_cast<D*>(b); // downcast

D* d3 = static_cast<D*>(c); // downcast


结果是:


assert( d2 == &d );

assert( d3 == &d );


指针又被调整了回来。而这在SI的世界中是不会发生的(重叠模型)。


为什么要调整this指针呢?this指针调整的原因在于MI采用了非重叠的内存模型,而之所以采用这种模型,是为了保证各基类体系的完整性和独立性,保证virtual机制能够得以在MI的不同体系之间顺利运行(这通过每个subobject各自的vptr进行)。关于MI以及它的this指针调整,可以说的东西足够写成一本书(本文只是冰山一角),这里当然不行!关于MI的任何理论问题,你都可以在《Inside The C++ Object Model》一书中找到。


但是,如果你把上面我们讨论的理论都弄明白了,就足够理解下面的部分,以及一般的MI问题了。


问题分析


在掌握了SI和MI各自的基本知识之后,我们现在可以把之前的问题弹出堆栈!我们暂时离开实验室,来分析一下这个现实生活中的问题。Actor的继承体系如下所示:


compler moves this pointer while Upcasting derived ojbect pointe to parent pointe by static_cast_第6张图片


老办法,我们分析一下它的内存模型:


compler moves this pointer while Upcasting derived ojbect pointe to parent pointe by static_cast_第7张图片


该体系是一个SI和MI的混合体。可以把Actor看成是左右两个体系的MI类。Super hierarchy和EventedSprite这个SI作为第一个base class,ConcurrentJob和Path_Finder的这个SI看做是第二个base class。因此,


class Actor : public EventedSprite, public Path_Finder {...}


有关系:


Actor actor;

EventedSprite* spr = &actor; // 1

Path_Finder* path = &actor; // 2


assert( spr == &actor );

assert( path != &actor );


因为步骤2进行了this指针调整——这很清楚。好了,我们来看我们出问题的程序:


[cpp] view plain copy
  1. My_Task* myTask = new My_Task;  
  2. Actor* actor = new Actor;  
  3. myTask->setJob( actor );  
  4. System_Task_Manager_Or_Something->addToOperationQueue( myTask );  

我们将actor交给了My_Task::setJob这个方法,该方法的形参是类型void*——它可以接受任何指针类型,这没有什么问题——我们只需要存储这个地址,在需要使用的时候用就是了。我们再看My_Task::run:


[cpp] view plain copy
  1. virtual void run()  
  2. {  
  3.     ConcurrentJob* job = static_cast<ConcurrentJob*>( m_job );  
  4.     job->run();  
  5. }  


m_job就是刚才被存储的Actor*——这个地址没问题。但,m_job的类型是void*——没有任何类型信息!我们应该对


ConcurrentJob* job = static_cast<ConcurrentJob*>( m_job );


有什么期待呢?我们期待compiler会为我们调整this指针!因为ConcurrentJob是第二个基类体系,还记得 “第二个以及后续的基类”咒语吗?一个void*的指针,我们用编译期casting  operator


static_cast


进行转换,是不会有任何地址上的变化的!Actor*的地址就这么直接赋予了ConcurrentJob*。this指针没有被调整!这个指针没有指向正确的subobject!导致了后面的严重错误!


一个快速的解决方案就是把m_job先变成Actor*,然后再转换。不过无论如何,只要能够给compiler足够的类型信息量,它就能做对事情——但前提是,你要先做对事情。


你可能感兴趣的:(指针,multiple,多继承,向上转换,upcast,inherence)