当然问题不止这么多,关于接口方面还有很多很多疑惑,不过时间有限,一下也没办法全部弄清楚,有时间慢慢研究。我主要使用Windbg工具来跟踪调试,关于这个工具如何使用,Google一下就会有很多了。
这些都是我自己研究加上参考资料所得,如果有不对的地方,希望大家讨论指出。
首先看下面这段代码:
public class Base { public virtual void VirtualFun1() { Console.WriteLine("Base.VirtualFun1"); } public void NoneVirtualFun1() { System.Console.WriteLine("Base.NoneVirtualFun1"); } public virtual void VirtualFun2() { System.Console.WriteLine("Base.VirtualFun2"); } public virtual void VirtualFun3() { System.Console.WriteLine("Base.VirtualFun3"); } } public class Derived : Base { public override void VirtualFun1() { Console.WriteLine("Derived.VirtualFun1"); } public new virtual void VirtualFun2() { System.Console.WriteLine("Derived.VirtualFun2"); } public virtual void VirtualFun4() { System.Console.WriteLine("Derived.VirtualFun4"); } }
Base类是基类,它包含三个虚方法VirtualFun1, VirtuaFun2, VirtualFun3和一个非虚方法NoneVirtualFun1。
Derived继承Base类,它重写了VirtualFun1虚方法,隐藏了Base类的VirtualFun2虚方法,然后又增加了VirtualFun4虚方法。
看看一个Base类的实例在内存中是怎样排布的:
Object Ref表示某Base实例的引用,它指向在GC Heap中分配的Base对象,这个对象可以分为三部分:同步块索引、类型指针和字段。主要来关注类型指针,它指向该类型的Method Table,这其实是在Load Heap中分配的Type类型对象,所有该类型的实例的类型指针都指向同一个Method Table(这里表示所有Base对象的类型指针都指向同一个Method Table)。
Method Table里面包含很多信息,这里关注有关Method这一区域,(如果想了解更详细的method table,请参考上面的文章)。
根据在Method Table里的信息,可以知道它包含9个Method(其实应该有个字段标示有多少个虚方法,这里就没画了)。接下来就是这些method,它分为两部分,前面一部分是所有的虚方法,后面的是非虚方法。因为所有的类型都是继承自System.Object类,所以前四个方法是Object类的虚方法(ToString, Equals, GetHashCode, Finalize),接着是Base类定义的三个虚方法(VirtualFun1, VirtualFun2, VirtualFun3),最后是Base类的非虚方法NoneVirtualFun1以及默认的构造函数。下面再来看看Derived类型的Method Table:
仔细对比一下这两个Method Table,可以发现这样几个特点:
下面看看调用虚方法时如何实现多态,比如有这样一段代码
Base b = new Derived();
b.VirtualFun1();
编译后在我的机器上会生成这样的汇编代码:
mov ecx, esi
mov eax, dword ptr[ecx]
call dword ptr [eax + 3ch]
现在来解释这几句代码:mov ecx, esi 是将新构造的对象的地址保存在ecx寄存器中; mov eax, dword ptr[ecx] 表示ecx的值是一个指针(根据上面的图可以知道对象的头4个字节保存的是method table的地址),它将method table的地址保存到eax寄存器中,最后call dword ptr[eax + 3ch]。3ch表示偏移量,它表示该方法相对于该method table的偏址,是在该类型加载到load heap以后确定的。这样,由method table的地址加上method相对与method table的偏移量,就可以唯一确定一个方法。
这样在调用b.VirtualFun1(); 时,由于b是Derived类的实例,所以根据它指向的托管对象找到的method table是Derived类型的method table,就能正确调用该方法。因为Derived类中override了VirtualFun1这个虚方法,所以调用的是Derived类的实现,而如果没有override基类的虚方法,它就指向基类的该方法的实现。
由此可以看出,CLR实现虚方法的机制主要是通过类型的method table加上该虚方法相对于method table的偏移量来确定调用具体方法的。一个虚方法在整个继承体系所有类型对应的method table中的偏移量是固定的,比如VirtualFunc1在Base类型的method table中的偏移量是3ch,它在Derived类型的method table中的偏移量也是3ch,如果还有继承自Derived类的类,也是同样,利用这种机制就实现了多态。
结论
namespace Demo { public interface IFoo { void Foo(); } public class Base : IFoo { public void Foo() { Console.WriteLine("In base's Foo function"); } } class Program { static void Main(string[] args) { IFoo i = new Base(); i.Foo(); } } }
在Essential .NET中,Don Box向读者简单描述了基于接口的多态调用,在堆中有一个全局接口映射表,当某个类实现了一个接口,就会在这个接口表中增加项,而增加的这些项又指向这个具体类的Method Table中的Method,可能说的不是太清楚,就用个图来表示:
当进行方法调用的时候,首先通过对象找到该类型的Method Table,根据偏移量找到指向Interface Offset Table的指针来定位这个Interface Offset Table,然后CLR查找调用方法在这个Offset Table的偏移量,最后调用该方法。调用的汇编代码如下:
mov ecx, esi -- 保存对象地址到ecx中
mov eax, dword ptr [ecx] -- 把类型的Method Table的地址保存在eax中
mov eax, dword ptr [eax+0ch] -- 把Interface Offset Table的地址保存在eax中
mov eax, dword ptr [eax + interface offset] -- 根据Interface在Table中的偏移量,找到其地址并保存到eax中
call dword ptr [eax + method offset] -- 根据该方法的偏移量定位改方法进行调用
可以说这样的调用逻辑是很清楚容易让人理解的。
但是当我用windbg进行跟踪的时候却发现接口方法调用机制和上面所说的不同,并没有一个查找Interface Offset Table的过程,在Main函数里是这样的调用:
mov ecx, esi -- 保存对象地址到ecx中
call dword ptr ds:[980010h] 在数据段980010h上保存的是一个指针,实际上调用的是:
jmp mscorwks!ResolveWorkerAsmStub
可以看到跳转到ResolveWorkerAsmStub函数里去了。而这个函数是做什么的呢,下面的代码是从SSCLI里面找到的(有兴趣的可以看看virtualcallstubcpu.hpp):
__declspec (naked) void ResolveWorkerAsmStub()
{
// 首先保存寄存器状态
call VirtualCallStubManager::ResolveWorkerStatic //调用ResolveWorkerStatic方法
//还原寄存器状态
jmp eax //eax保存着实际上要调用的方法的地址,所以这里就开始了方法调用
}
所以猜想到在VirtualCallStubManager::ResolveWorkerStatic函数里面正确找到了方法的地址,保存在eax里。
看来到底是怎样取到该方法地址这个问题只能等下次有时间再用windbg跟踪。如果有人了解,也希望能解释一下来帮助我解答疑惑。