原文链接
在多继承的情况下,用static_cast去upcast子对象指针到父对象指针时候,This 指针会自动偏移到正确的那路父对象指针。 条件是static_cast时候,子对象的指针不可以是(void *)必须是(static_cast *). 原因是static_cast是编译时候处理的。
单继承(Single Inheritance,SI)对象模型
考虑下面的这个类:
class object a在内存中的布局如下所示:
两个member data按照顺序排列,class object a的地址就是该内存空间的首地址。现在我们增加一个类:
class object b在内存中的布局如下图:
先是A类的subobject内存布局,然后是B类的data member。C++标准保证“出现在派生类中的基类subobject保留其原样性不变”。因此无论class A的布局如何,都会完整地存在于class B的内存模型中,这主要考虑和C的兼容性。但有以下几点需要注意(请不要被下面3条所述细节困扰,如果实在不太清楚,可以略过,我们的重点在于SI的基础知识):
1)class A的因内存alignment而产生的padding bytes也必须出现在B的class A subobject中,这确保了基类subobject的严格原样性。
2)对于具有virtual function的类体系,vptr的放置根据不同编译器会有两种方式:头部和尾部。对于放在头部的编译器,如果这里给B类增加一个virtual destructor,从而让A无virtual机制而让B有virtual机制,class object b的头部就是vptr而不是class A subobject了。但这不会影响指针的相同性。
3)如果B是virtual继承于A,则事情另有变数。用Stanley B. Lippman的话说“任何规则一旦遇到virtual base class,就没辙了”。这里我们不讨论这个题外话。
&b、a和b2所指向的都是b的首地址。因此,在SI模型下,对象内存采用重叠的模型,基类和任何的派生类的指针,都指向该对象的首地址,因此这些指针的地址值都是一样的——所有基类subobject都共享相同首地址。
也就是说,在一个继承体系内,不论你用什么样的方式对一个指向了某对象的指针进行downcast或upcast,指针的地址值都是一样的。再加一层体系如下:
A、B、C这3个在同一体系下的类的指针无论怎样进行相互casting,得到的地址都一样。
多继承(Multiple Inheritance,MI)对象模型
MI机制是C++这门语言的特性之一,同时,也是复杂度的罪魁祸首之一!因为,在这里,编译器又背着我们做了一些事情,这也是C++饱受批评的主要原因。
请考虑下面的程序:
类关系如图所示:
这是一个最简单的MI体系,D继承自三个base class。我们再来看看它的内存模型:
可以看到,和SI不同的是,MI采用了非重叠模型——每个base class subobject都有自己的首地址。这里,A、B和C subobject各自占据它们自己的首地址,唯一的例外就是D object——也就是这个模型的拥有者,它的首地址和class A subobject是相同的。因此,我们说:
assert( a == &d );
assert( b != &d );
assert( c != &d );
“哎!等等!”,我听到了你在打断我,“我们在上面的程序中已经写明
b = &d;
c = &d;
这里为什么你会这么写:
assert( b != &d );
assert( c != &d );
你确定断言不会crash吗?”。如果你这么问我,我很高兴,这表明你在跟着我。下面是我通过试验得到的数据:
这就是问题的关键所在——编译器背着我们做了一件事情:this指针调整!在MI的世界里,this指针调整非常频繁,而这种调整,主要发生在 派生类对象 和“第二个以及后续的基类对象”(像咒语一样)之间的转换。在上面的例子里,“第二个以及后续的基类”就是类B和C。这个转换就是
b = &d; // upcast
c = &d; // upcast
this指针就是在这个时候被compiler调整的。b和c分别指向了正确的,属于它们各自的subobject的地址。同理,当我们将b和c转换成d指针的时候,this指针也会调整
D* d2 = static_cast<D*>(b); // downcast
D* d3 = static_cast<D*>(c); // downcast
结果是:
assert( d2 == &d );
assert( d3 == &d );
指针又被调整了回来。而这在SI的世界中是不会发生的(重叠模型)。
为什么要调整this指针呢?this指针调整的原因在于MI采用了非重叠的内存模型,而之所以采用这种模型,是为了保证各基类体系的完整性和独立性,保证virtual机制能够得以在MI的不同体系之间顺利运行(这通过每个subobject各自的vptr进行)。关于MI以及它的this指针调整,可以说的东西足够写成一本书(本文只是冰山一角),这里当然不行!关于MI的任何理论问题,你都可以在《Inside The C++ Object Model》一书中找到。
但是,如果你把上面我们讨论的理论都弄明白了,就足够理解下面的部分,以及一般的MI问题了。
问题分析
在掌握了SI和MI各自的基本知识之后,我们现在可以把之前的问题弹出堆栈!我们暂时离开实验室,来分析一下这个现实生活中的问题。Actor的继承体系如下所示:
老办法,我们分析一下它的内存模型:
该体系是一个SI和MI的混合体。可以把Actor看成是左右两个体系的MI类。Super hierarchy和EventedSprite这个SI作为第一个base class,ConcurrentJob和Path_Finder的这个SI看做是第二个base class。因此,
class Actor : public EventedSprite, public Path_Finder {...}
有关系:
Actor actor;
EventedSprite* spr = &actor; // 1
Path_Finder* path = &actor; // 2
assert( spr == &actor );
assert( path != &actor );
因为步骤2进行了this指针调整——这很清楚。好了,我们来看我们出问题的程序:
我们将actor交给了My_Task::setJob这个方法,该方法的形参是类型void*——它可以接受任何指针类型,这没有什么问题——我们只需要存储这个地址,在需要使用的时候用就是了。我们再看My_Task::run:
m_job就是刚才被存储的Actor*——这个地址没问题。但,m_job的类型是void*——没有任何类型信息!我们应该对
ConcurrentJob* job = static_cast<ConcurrentJob*>( m_job );
有什么期待呢?我们期待compiler会为我们调整this指针!因为ConcurrentJob是第二个基类体系,还记得 “第二个以及后续的基类”咒语吗?一个void*的指针,我们用编译期casting operator
static_cast
进行转换,是不会有任何地址上的变化的!Actor*的地址就这么直接赋予了ConcurrentJob*。this指针没有被调整!这个指针没有指向正确的subobject!导致了后面的严重错误!
一个快速的解决方案就是把m_job先变成Actor*,然后再转换。不过无论如何,只要能够给compiler足够的类型信息量,它就能做对事情——但前提是,你要先做对事情。