• | SystemDomain, SharedDomain, and DefaultDomain |
• | 对象布局和内存细节。 |
• | 方法表布局。 |
• | 方法分派(Method dispatching)。 |
本文使用下列技术:
.NET Framework, C#
随着通用语言运行时(CLR)即将成为在Windows®下开发应用程序的首选架构,对其进行深入理解会帮助你建立有效的工业强度的应用程序。在本文中,我们将探索CLR内部,包括对象实例布局,方法表布局,方法分派,基于接口的分派和不同的数据结构。
我们将使用C#编写的简单代码示例,以便任何固有的语言语法含义是C#的缺省定义。某些此处讨论的数据结构和算法可能会在Microsoft® .NET Framework 2.0中改变,但是主要概念应该保持不变。我们使用Visual Studio® .NET 2003调试器和调试器扩展Son of Strike (SOS)来查看本文讨论的数据结构。SOS理解CLR的内部数据结构并输出有用信息。请参考“Son of Strike”补充资料,了解如何将SOS.dll装入Visual Studio .NET 2003调试器的进程空间。本文中,我们将描述在共享源代码CLI(Shared Source CLI,SSCLI)中有相应实现的类,你可以从msdn.microsoft.com/net/sscli下载。图1将帮助你在SSCLI的数以兆计的代码中找到所参考的结构。
在我们开始前,请注意:本文提供的信息只对在X86平台上运行的.NET Framework 1.1有效(对于Shared Source CLI 1.0也大部分适用,只是在某些交互操作的情况下必须注意例外),对于.NET Framework 2.0会有改变,所以请不要在构建软件时依赖于这些内部结构的不变性。
在CLR执行托管代码的第一行代码前,会创建三个应用程序域。其中两个对于托管代码甚至CLR宿主程序(CLR hosts)都是不可见的。它们只能由CLR启动进程创建,而提供CLR启动进程的是shim——mscoree.dll和mscorwks.dll (在多处理器系统下是mscorsvr.dll)。正如图2所示,这些域是系统域(System Domain)和共享域(Shared Domain),都是使用了单件(Singleton)模式。第三个域是缺省应用程序域(Default AppDomain),它是一个AppDomain的实例,也是唯一的有命名的域。对于简单的CLR宿主程序,比如控制台程序,默认的域名由可执行映象文件的名字组成。其它的域可以在托管代码中使用AppDomain.CreateDomain方法创建,或者在非托管的代码中使用ICORRuntimeHost接口创建。复杂的宿主程序,比如ASP.NET,对于特定的网站会基于应用程序的数目创建多个域。
系统域负责创建和初始化共享域和默认应用程序域。它将系统库mscorlib.dll载入共享域,并且维护进程范围内部使用的隐含或者显式字符串符号。
字符串驻留(string interning)是.NET Framework 1.1中的一个优化特性,它的处理方法显得有些笨拙,因为CLR没有给程序集机会选择此特性。尽管如此,由于在所有的应用程序域中对一个特定的符号只保存一个对应的字符串,此特性可以节省内存空间。
系统域还负责产生进程范围的接口ID,并用来创建每个应用程序域的接口虚表映射图(InterfaceVtableMaps)的接口。系统域在进程中保持跟踪所有域,并实现加载和卸载应用程序域的功能。
所有不属于任何特定域的代码被加载到系统库SharedDomain.Mscorlib,对于所有应用程序域的用户代码都是必需的。它会被自动加载到共享域中。系统命名空间的基本类型,如Object, ValueType, Array, Enum, String, and Delegate等等,在CLR启动程序过程中被预先加载到本域中。用户代码也可以被加载到这个域中,方法是在调用CorBindToRuntimeEx时使用由CLR宿主程序指定的LoaderOptimization特性。控制台程序也可以加载代码到共享域中,方法是使用System.LoaderOptimizationAttribute特性声明Main方法。共享域还管理一个使用基地址作为索引的程序集映射图,此映射图作为管理共享程序集依赖关系的查找表,这些程序集被加载到默认域(DefaultDomain)和其它在托管代码中创建的应用程序域。非共享的用户代码被加载到默认域。
默认域是应用程序域(AppDomain)的一个实例,一般的应用程序代码在其中运行。尽管有些应用程序需要在运行时创建额外的应用程序域(比如有些使用插件,plug-in,架构或者进行重要的运行时代码生成工作的应用程序),大部分的应用程序在运行期间只创建一个域。所有在此域运行的代码都是在域层次上有上下文限制。如果一个应用程序有多个应用程序域,任何的域间访问会通过.NET Remoting代理。额外的域内上下文限制信息可以使用System.ContextBoundObject派生的类型创建。每个应用程序域有自己的安全描述符(SecurityDescriptor),安全上下文(SecurityContext)和默认上下文(DefaultContext),还有自己的加载器堆(高频堆,低频堆和代理堆),句柄表,接口虚表管理器和程序集缓存。
加载器堆的作用是加载不同的运行时CLR部件和优化在域的整个生命期内存在的部件。这些堆的增长基于可预测块,这样可以使碎片最小化。加载器堆不同于垃圾回收堆(或者对称多处理器上的多个堆),垃圾回收堆保存对象实例,而加载器堆同时保存类型系统。经常访问的部件如方法表,方法描述,域描述和接口图,分配在高频堆上,而较少访问的数据结构如EEClass和类加载器及其查找表,分配在低频堆。代理堆保存用于代码访问安全性(code access security, CAS)的代理部件,如COM封装调用和平台调用(P/Invoke)。
从高层次了解域后,我们准备看看它们在一个简单的应用程序的上下文中的物理细节,见图3。我们在程序运行时停在mc.Method1(),然后使用SOS调试器扩展命令DumpDomain来输出域的信息。(请查看Son of Strike了解SOS的加载信息)。这里是编辑后的输出:
!DumpDomain System Domain: 793e9d58, LowFrequencyHeap: 793e9dbc, HighFrequencyHeap: 793e9e14, StubHeap: 793e9e6c, Assembly: 0015aa68 [mscorlib], ClassLoader: 0015ab40 Shared Domain: 793eb278, LowFrequencyHeap: 793eb2dc, HighFrequencyHeap: 793eb334, StubHeap: 793eb38c, Assembly: 0015aa68 [mscorlib], ClassLoader: 0015ab40 Domain 1: 149100, LowFrequencyHeap: 00149164, HighFrequencyHeap: 001491bc, StubHeap: 00149214, Name: Sample1.exe, Assembly: 00164938 [Sample1], ClassLoader: 00164a78
我们的控制台程序,Sample1.exe,被加载到一个名为“Sample1.exe”的应用程序域。Mscorlib.dll被加载到共享域,不过因为它是核心系统库,所以也在系统域中列出。每个域会分配一个高频堆,低频堆和代理堆。系统域和共享域使用相同的类加载器,而默认应用程序使用自己的类加载器。
输出没有显示加载器堆的保留尺寸和已提交尺寸。高频堆的初始化大小是32KB,每次提交4KB。SOS的输出也没有显示接口虚表堆(InterfaceVtableMap)。每个域有一个接口虚表堆(简称为IVMap),由自己的加载器堆在域初始化阶段创建。IVMap保留大小是4KB,开始时提交4KB。我们将会在后续部分研究类型布局时讨论IVMap的意义。
图2显示默认的进程堆,JIT代码堆,GC堆(用于小对象)和大对象堆(用于大小等于或者超过85000字节的对象),它说明了这些堆和加载器堆的语义区别。即时(just-in-time, JIT)编译器产生x86指令并且保存到JIT代码堆中。GC堆和大对象堆是用于托管对象实例化的垃圾回收堆。
类型是.NET编程中的基本单元。在C#中,类型可以使用class,struct和interface关键字进行声明。大多数类型由程序员显式创建,但是,在特别的交互操作(interop)情形和远程对象调用(.NET Remoting)场合中,.NET CLR会隐式的产生类型,这些产生的类型包含COM和运行时可调用封装及传输代理(Runtime Callable Wrappers and Transparent Proxies)。
我们通过一个包含对象引用的栈开始研究.NET类型原理(典型地,栈是一个对象实例开始生命期的地方)。图4中显示的代码包含一个简单的程序,它有一个控制台的入口点,调用了一个静态方法。Method1创建一个SmallClass的类型实例,该类型包含一个字节数组,用于演示如何在大对象堆创建对象。尽管这是一段无聊的代码,但是可以帮助我们进行讨论。
图5显示了停止在Create方法“return smallObj;”代码行断点时的fastcall栈结构(fastcall时.NET的调用规范,它说明在可能的情况下将函数参数通过寄存器传递,而其它参数按照从右到左的顺序入栈,然后由被调用函数完成出栈操作)。本地值类型变量objSize内含在栈结构中。引用类型变量如smallObj以固定大小(4字节DWORD)保存在栈中,包含了在一般GC堆中分配的对象的地址。对于传统C++,这是对象的指针;在托管世界中,它是对象的引用。不管怎样,它包含了一个对象实例的地址,我们将使用术语对象实例(ObjectInstance)描述对象引用指向地址位置的数据结构。
一般GC堆上的smallObj对象实例包含一个名为_largeObj的字节数组(注意,图中显示的大小为85016字节,是实际的存贮大小)。CLR对大于或等于85000字节的对象的处理和小对象不同。大对象在大对象堆(LOH)上分配,而小对象在一般GC堆上创建,这样可以优化对象的分配和回收。LOH不会压缩,而GC堆在GC回收时进行压缩。还有,LOH只会在完全GC回收时被回收。
smallObj的对象实例包含类型句柄(TypeHandle),指向对应类型的方法表。每个声明的类型有一个方法表,而同一类型的所有对象实例都指向同一个方法表。它包含了类型的特性信息(接口,抽象类,具体类,COM封装和代理),实现的接口数目,用于接口分派的接口图,方法表的槽(slot)数目,指向相应实现的槽表。
方法表指向一个名为EEClass的重要数据结构。在方法表创建前,CLR类加载器从元数据中创建EEClass。图4中,SmallClass的方法表指向它的EEClass。这些结构指向它们的模块和程序集。方法表和EEClass一般分配在共享域的加载器堆。加载器堆和应用程序域关联,这里提到的数据结构一旦被加载到其中,就直到应用程序域卸载时才会消失。而且,默认的应用程序域不会被卸载,所以这些代码的生存期是直到CLR关闭为止。
正如我们说过的,所有值类型的实例或者包含在线程栈上,或者包含在GC堆上。所有的引用类型在GC堆或者LOH上创建。图6显示了一个典型的对象布局。一个对象可以通过以下途径被引用:基于栈的局部变量,在交互操作或者平台调用情况下的句柄表,寄存器(执行方法时的this指针和方法参数),拥有终结器(finalizer)方法的对象的终结器队列。OBJECTREF不是指向对象实例的开始位置,而是有一个DWORD的偏移量(4字节)。此DWORD称为对象头,保存一个指向SyncTableEntry表的索引(从1开始计数的syncblk编号。因为通过索引进行连接,所以在需要增加表的大小时,CLR可以在内存中移动这个表。SyncTableEntry维护一个反向的弱引用,以便CLR可以跟踪SyncBlock的所有权。弱引用让GC可以在没有其它强引用存在时回收对象。SyncTableEntry还保存了一个指向SyncBlock的指针,包含了很少需要被一个对象的所有实例使用的有用的信息。这些信息包括对象锁,哈希编码,任何转换层(thunking)数据和应用程序域的索引。对于大多数的对象实例,不会为实际的SyncBlock分配内存,而且syncblk编号为0。这一点在执行线程遇到如lock(obj)或者obj.GetHashCode的语句时会发生变化,如下所示:
SmallClass obj = new SmallClass() // Do some work here lock(obj) { /* Do some synchronized work here */ } obj.GetHashCode();
在以上代码中,smallObj会使用0作为它的起始的syncblk编号。lock语句使得CLR创建一个syncblk入口并使用相应的数值更新对象头。因为C#的lock关键字会扩展为try-finally语句并使用Monitor类,一个用作同步的Monitor对象在syncblk上创建。堆GetHashCode的调用会使用对象的哈希编码增加syncblk。
在SyncBlock中有其它的域,它们在COM交互操作和封送委托(marshaling delegates)到非托管代码时使用,不过这和典型的对象用处无关。
类型句柄紧跟在对象实例中的syncblk编号后。为了保持连续性,我会在说明实例变量后讨论类型句柄。实例域(Instance field)的变量列表紧跟在类型句柄后。默认情况下,实例域会以内存最有效使用的方式排列,这样只需要最少的用作对齐的填充字节。图7的代码显示了SimpleClass包含有一些不同大小的实例变量。
图8显示了在Visual Studio调试器的内存窗口中的一个SimpleClass对象实例。我们在图7的return语句处设置了断点,然后使用ECX寄存器保存的simpleObj地址在内存窗口显示对象实例。前4个字节是syncblk编号。因为我们没有用任何同步代码使用此实例(也没有访问它的哈希编码),syncblk编号为0。保存在栈变量的对象实例,指向起始位置的4个字节的偏移处。字节变量b1,b2,b3和b4被一个接一个的排列在一起。两个short类型变量s1和s2也被排列在一起。字符串变量str是一个4字节的OBJECTREF,指向GC堆中分配的实际的字符串实例。字符串是一个特别的类型,因为所有包含同样文字符号的字符串,会在程序集加载到进程时指向一个全局字符串表的同一实例。这个过程称为字符串驻留(string interning),设计目的是优化内存的使用。我们之前已经提过,在NET Framework 1.1中,程序集不能选择是否使用这个过程,尽管未来版本的CLR可能会提供这样的能力。
所以默认情况下,成员变量在源代码中的词典顺序没有在内存中保持。在交互操作的情况下,词典顺序必须被保存到内存中,这时可以使用StructLayoutAttribute特性,它有一个LayoutKind的枚举类型作为参数。LayoutKind.Sequential可以为被封送(marshaled)数据保持词典顺序,尽管在.NET Framework 1.1中,它没有影响托管的布局(但是.NET Framework 2.0可能会这么做)。在交互操作的情况下,如果你确实需要额外的填充字节和显示的控制域的顺序,LayoutKind.Explicit可以和域层次的FieldOffset特性一起使用。
看完底层的内存内容后,我们使用SOS看看对象实例。一个有用的命令是DumpHeap,它可以列出所有的堆内容和一个特别类型的所有实例。无需依赖寄存器,DumpHeap可以显示我们创建的唯一一个实例的地址。
!DumpHeap -type SimpleClass Loaded Son of Strike data table version 5 from "C:\WINDOWS\Microsoft.NET\Framework\v1.1.4322\mscorwks.dll" Address MT Size 00a8197c 00955124 36 Last good object: 00a819a0 total 1 objects Statistics: MT Count TotalSize Class Name 955124 1 36 SimpleClass
对象的总大小是36字节,不管字符串多大,SimpleClass的实例只包含一个DWORD的对象引用。SimpleClass的实例变量只占用28字节,其它8个字节包括类型句柄(4字节)和syncblk编号(4字节)。找到simpleObj实例的地址后,我们可以使用DumpObj命令输出它的内容,如下所示:
!DumpObj 0x00a8197c Name: SimpleClass MethodTable 0x00955124 EEClass 0x02ca33b0 Size 36(0x24) bytes FieldDesc*: 00955064 MT Field Offset Type Attr Value Name 00955124 400000a 4 System.Int64 instance 31 l1 00955124 400000b c CLASS instance 00a819a0 str << some fields omitted from the display for brevity >> 00955124 4000003 1e System.Byte instance 3 b3 00955124 4000004 1f System.Byte instance 4 b4
正如之前说过,C#编译器对于类的默认布局使用LayoutType.Auto(对于结构使用LayoutType.Sequential);因此类加载器重新排列实例域以最小化填充字节。我们可以使用ObjSize来输出包含被str实例占用的空间,如下所示:
!ObjSize 0x00a8197c sizeof(00a8197c) = 72 ( 0x48) bytes (SimpleClass)
如果你从对象图的全局大小(72字节)减去SimpleClass的大小(36字节),就可以得到str的大小,即36字节。让我们输出str实例来验证这个结果:
!DumpObj 0x00a819a0 Name: System.String MethodTable 0x009742d8 EEClass 0x02c4c6c4 Size 36(0x24) bytes
如果你将字符串实例的大小(36字节)加上SimpleClass实例的大小(36字节),就可以得到ObjSize命令报告的总大小72字节。
请注意ObjSize不包含syncblk结构占用的内存。而且,在.NET Framework 1.1中,CLR不知道非托管资源占用的内存,如GDI对象,COM对象,文件句柄等等;因此它们不会被这个命令报告。
指向方法表的类型句柄在syncblk编号后分配。在对象实例创建前,CLR查看加载类型,如果没有找到,则进行加载,获得方法表地址,创建对象实例,然后把类型句柄值追加到对象实例中。JIT编译器产生的代码在进行方法分派时使用类型句柄来定位方法表。CLR在需要史可以通过方法表反向访问加载类型时使用类型句柄。
每个类和实例在加载到应用程序域时,会在内存中通过方法表来表示。这是在对象的第一个实例创建前的类加载活动的结果。对象实例表示的是状态,而方法表表示了行为。通过EEClass,方法表把对象实例绑定到被语言编译器产生的映射到内存的元数据结构(metadata structures)。方法表包含的信息和外挂的信息可以通过System.Type访问。指向方法表的指针在托管代码中可以通过Type.RuntimeTypeHandle属性获得。对象实例包含的类型句柄指向方法表开始位置的偏移处,偏移量默认情况下是12字节,包含了GC信息。我们不打算在这里对其进行讨论。
图9显示了方法表的典型布局。我们会说明类型句柄的一些重要的域,但是对于完全的列表,请参看此图。让我们从基实例大小(Base Instance Size)开始,因为它直接关系到运行时的内存状态。
基实例大小是由类加载器计算的对象的大小,基于代码中声明的域。之前已经讨论过,当前GC的实现需要一个最少12字节的对象实例。如果一个类没有定义任何实例域,它至少包含额外的4个字节。其它的8个字节被对象头(可能包含syncblk编号)和类型句柄占用。再说一次,对象的大小会受到StructLayoutAttribute的影响。
看看图3中显示的MyClass(有两个接口)的方法表的内存快照(Visual Studio .NET 2003内存窗口),将它和SOS的输出进行比较。在图9中,对象大小位于4字节的偏移处,值为12(0x0000000C)字节。以下是SOS的DumpHeap命令的输出:
!DumpHeap -type MyClass Address MT Size 00a819ac 009552a0 12 total 1 objects Statistics: MT Count TotalSize Class Name 9552a0 1 12 MyClass
在方法表中包含了一个槽表,指向各个方法的描述(MethodDesc),提供了类型的行为能力。方法槽表是基于方法实现的线性链表,按照如下顺序排列:继承的虚方法,引入的虚方法,实例方法,静态方法。
类加载器在当前类,父类和接口的元数据中遍历,然后创建方法表。在排列过程中,它替换所有的被覆盖的虚方法和被隐藏的父类方法,创建新的槽,在需要时复制槽。槽复制是必需的,它可以让每个接口有自己的最小的vtable。但是被复制的槽指向相同的物理实现。MyClass包含接口方法,一个类构造函数(.cctor)和对象构造函数(.ctor)。对象构造函数由C#编译器为所有没有显式定义构造函数的对象自动生成。因为我们定义并初始化了一个静态变量,编译器会生成一个类构造函数。图10显示了MyClass的方法表的布局。布局显示了10个方法,因为Method2槽为接口IVMap进行了复制,下面我们会进行讨论。图11显示了MyClass的方法表的SOS的输出。
任何类型的开始4个方法总是ToString, Equals, GetHashCode, and Finalize。这些是从System.Object继承的虚方法。Method2槽被进行了复制,但是都指向相同的方法描述。代码显示定义的.cctor和.ctor会分别和静态方法和实例方法分在一组。
方法描述(MethodDesc)是CLR知道的方法实现的一个封装。有几种类型的方法描述,除了用于托管实现,分别用于不同的交互操作实现的调用。在本文中,我们只考察图3代码中的托管方法描述。方法描述在类加载过程中产生,初始化为指向IL。每个方法描述带有一个预编译代理(PreJitStub),负责触发JIT编译。图12显示了一个典型的布局,方法表的槽实际上指向代理,而不是实际的方法描述数据结构。对于实际的方法描述,这是-5字节的偏移,是每个方法的8个附加字节的一部分。这5个字节包含了调用预编译代理程序的指令。5字节的偏移可以从SOS的DumpMT输出从看到,因为方法描述总是方法槽表指向的位置后面的5个字节。在第一次调用时,会调用JIT编译程序。在编译完成后,包含调用指令的5个字节会被跳转到JIT编译后的x86代码的无条件跳转指令覆盖。
对图12的方法表槽指向的代码进行反汇编,显示了对预编译代理的调用。以下是在Method2被JIT编译前的反汇编的简化显示。
!u 0x00955263 Unmanaged code 00955263 call 003C3538 ;call to the jitted Method2() 00955268 add eax,68040000h ;ignore this and the rest ;as !u thinks it as code
现在我们执行此方法,然后反汇编相同的地址:
!u 0x00955263 Unmanaged code 00955263 jmp 02C633E8 ;call to the jitted Method2() 00955268 add eax,0E8040000h ;ignore this and the rest ;as !u thinks it as code
在此地址,只有开始5个字节是代码,剩余字节包含了Method2的方法描述的数据。“!u”命令不知道这一点,所以生成的是错乱的代码,你可以忽略5个字节后的所有东西。
CodeOrIL在JIT编译前包含IL中方法实现的相对虚地址(Relative Virtual Address ,RVA)。此域用作标志,表示是否IL。在按要求编译后,CLR使用编译后的代码地址更新此域。让我们从列出的函数中选择一个,然后用DumpMT命令分别输出在JIT编译前后的方法描述的内容:
!DumpMD 0x00955268 Method Name : [DEFAULT] [hasThis] Void MyClass.Method2() MethodTable 9552a0 Module: 164008 mdToken: 06000006 Flags : 400 IL RVA : 00002068
编译后,方法描述的内容如下:
!DumpMD 0x00955268 Method Name : [DEFAULT] [hasThis] Void MyClass.Method2() MethodTable 9552a0 Module: 164008 mdToken: 06000006 Flags : 400 Method VA : 02c633e8
方法的这个标志域的编码包含了方法的类型,例如静态,实例,接口方法或者COM实现。让我们看方法表另外一个复杂的方面:接口实现。它封装了布局过程所有的复杂性,让托管环境觉得这一点看起来简单。然后,我们将说明接口如何进行布局和基于接口的方法分派的确切工作方式。
public interface IA
{
void PrintA();
}
public interface IB
{
void PrintB();
}
public class A :IA,IB
{
public virtual void PrintA()
{
Console.WriteLine("A");
}
public virtual void PrintB()
{
Console.WriteLine("B");
}
}
public class B : A,IA
{
public new virtual void PrintA()//虚函数的slot是父类,子类中能一一对应的,如果那么 new virtual void PrintA放到哪?不好解释,只能是在IVM表中有接口每个方法的指针来之心类中的方法的slot了,这样才能解释通
{
Console.WriteLine("B:printA");
}
}
class Program
{
static void Main(string[] args)
{
B b = new B();
IA s = b;
s.PrintA();
Console.Read();
//另外一个例子
接口的本质
从概念上理解了接口,还应进一步从本质上揭示其映射机制,在.NET中基于接口的多态究竟是如何被实现的呢?这是值得思考的话题,根据下面的示例,及其IL分析,我们对此进行一定的探讨:
interface IMyInterface
{
void MyMethod();
}
该定义在Reflector中的IL为:
.class private interface abstract auto ansi IMyInterface
{
.method public hidebysig newslot abstract virtual instance void MyMethod() cil managed
{
}
}
根据IL分析可知,IMyInterface接口本质上仍然被标记为.class,同时提供了abstract virtual方法MyMethod,因此接口其实本质上可以看作是一个定义了抽象方法的类,该类仅提供了方法的定义,而没有方法的实现,其功能由接口的实现类来完成,例如:
class MyClass : IMyInterface
{
void IMyInterface.MyMethod()
{
}
}
其对应的IL代码为:
.class private auto ansi beforefieldinit MyClass
extends [mscorlib]System.Object
implements InsideDotNet.OOThink.Interface.IMyInterface
{
.method public hidebysig specialname rtspecialname instance void .ctor() cil managed
{
}
.method private hidebysig newslot virtual final instance void InsideDotNet.OOThink.Interface.IMyInterface.MyMethod() cil managed
{
.override InsideDotNet.OOThink.Interface.IMyInterface::MyMethod
}
}
由此可见,实现了接口的类方法在IL标记为override,表示覆写了接口方法实现,因此接口的抽象机制仍然是多态来完成的。接口在本质上,仍旧是一个不能实例化的类,但是又区别于一般意义上的类,例如不能实例化、允许多继承、可以作用于值类型等。
那么在CLR内部,接口的方法分派是如何被完成的呢?在托管堆中CLR维护着一个接口虚表来完成方法分派,该表基于方法表内的接口图信息创建,主要保存了接口实现的索引记录。以IMyInterface为例,在MyClass第一次加载时,CLR检查到MyClass实现了IMyInterface的MyMethod方法,则会在接口虚表中创建一条记录信息,用于保存MyClass方法表中实现了MyMethod方法的引用地址,其他实现了IMyInterface的类型都会在接口虚表中创建相应的记录。因此,接口的方法调用是基于接口虚表进行的。
//end
在方法表的第12字节偏移处是一个重要的指针,接口虚表(IVMap)。如图9所示,接口虚表指向一个应用程序域层次的映射表(这个映射表就好像静态字段一样,存在一个,是公用的),该表以进程层次的接口ID作为索引。接口ID在接口类型第一次加载时创建(每个接口在编译的时候在内部都会生成一个接口编号)。每个接口的实现都在接口虚表中有一个记录。如果MyInterface1被两个类实现,在接口虚表表中就有两个记录。该记录会反向指向MyClass方法表内含的子表的开始位置,如图9所示。这是接口方法分派发生时使用的引用。接口虚表是基于方法表内含的接口图信息创建,接口图在方法表布局过程中基于类的元数据创建。一旦类型加载完成,只有接口虚表用于方法分派。
第28字节位置的接口图会指向内含在方法表中的接口信息记录。在这种情况下,对MyClass实现的两个接口中的每一个都有两条记录。第一条接口信息记录的开始4个字节指向MyInterface1的类型句柄(见图9和图10)。接着的WORD(2字节)被一个标志占用(0表示从父类派生,1表示由当前类实现)。在标志后的WORD是一个开始槽(Start Slot),被类加载器用来布局接口实现的子表。对于MyInterface2,开始槽的值为4(从0开始编号),所以槽5和6指向实现;对于MyInterface2,开始槽的值为6,所以槽7和8指向实现。类加载器会在需要时复制槽来产生这样的效果:每个接口有自己的实现,然而物理映射到同样的方法描述。在MyClass中,MyInterface1.Method2和MyInterface2.Method2会指向相同的实现。
基于接口的方法分派通过接口虚表进行,而直接的方法分派通过保存在各个槽的方法描述地址进行。如之前提及,.NET框架使用fastcall的调用约定,最先2个参数在可能的时候一般通过ECX和EDX寄存器传递。实例方法的第一个参数总是this指针,所以通过ECX寄存器传送,可以在“mov ecx,esi”语句看到这一点:
mi1.Method1(); mov ecx,edi ;move "this" pointer into ecx mov eax,dword ptr [ecx] ;move "TypeHandle" into eax mov eax,dword ptr [eax+0Ch] ;move IVMap address into eax at offset 12 mov eax,dword ptr [eax+30h] ;move the ifc impl start slot into eax call dword ptr [eax] ;call Method1 mc.Method1(); mov ecx,esi ;move "this" pointer into ecx cmp dword ptr [ecx],ecx ;compare and set flags call dword ptr ds:[009552D8h];directly call Method1
/*以下信息是VS2010中调试出来的
mc.Method1();
mov ecx,dword ptr [ebp-3Ch]
cmp dword ptr [ecx],ecx
call FFC8A3F8
nop
mi1.Method1();
mov ecx,dword ptr [ebp-40h] ;//move IVMap
call dword ptr ds:[001A0020h] ;//很清楚的看到调用是ecx+001A0020h 偏移量处的方法的
nop
mi1.Method2();
mov ecx,dword ptr [ebp-40h]
call dword ptr ds:[001A0024h]
nop
mi2.Method2();
mov ecx,dword ptr [ebp-44h]
call dword ptr ds:[001A0028h]
nop
mi2.Method3();
mov ecx,dword ptr [ebp-44h]
call dword ptr ds:[001A002Ch]
nop
mc.Method3();
mov ecx,dword ptr [ebp-3Ch]
mov eax,dword ptr [ecx]
mov eax,dword ptr [eax+28h]
call dword ptr [eax+18h]
*/
这些反汇编显示了直接调用MyClass的实例方法没有使用偏移。JIT编译器把方法描述的地址直接写到代码中。基于接口的分派通过接口虚表发生,和直接分派相比需要一些额外的指令。一个指令用来获得接口虚表的地址,另一个获取方法槽表中的接口实现的开始槽。而且,把一个对象实例转换为接口只需要拷贝this指针到目标的变量。在图2中,语句“mi1=mc”使用一个指令把mc的对象引用拷贝到mi1。
现在我们看看虚分派,并且和基于接口的分派进行比较。以下是图3中MyClass.Method3的虚函数调用的反汇编代码:
mc.Method3(); Mov ecx,esi ;move "this" pointer into ecx Mov eax,dword ptr [ecx] ;acquire the MethodTable address Call dword ptr [eax+44h] ;dispatch to the method at offset 0x44
虚分派总是通过一个固定的槽编号发生,和方法表指针在特定的类(类型)实现层次无关。在方法表布局时,类加载器用覆盖的子类的实现代替父类的实现。结果,对父对象的方法调用被分派到子对象的实现。反汇编显示了分派通过8号槽发生,可以在调试器的内存窗口(如图10所示)和DumpMT的输出看到这一点。
静态变量是方法表数据结构的重要组成部分。作为方法表的一部分,它们分配在方法表的槽数组后。所有的原始静态类型是内联的,而对于结构和引用的类型的静态值对象,通在句柄表中创建的对象引用来指向。方法表中的对象引用指向应用程序域的句柄表的对象引用,它引用了堆上创建的对象实例。一旦创建后,句柄表内的对象引用会使堆上的对象实例保持生存,直到应用程序域被卸载。在图9 中,静态字符串变量str指向句柄表的对象引用,后者指向GC堆上的MyString。
EEClass在方法表创建前开始生存,它和方法表结合起来,是类型声明的CLR版本。实际上,EEClass和方法表逻辑上是一个数据结构(它们一起表示一个类型),只不过因为使用频度的不同而被分开。经常使用的域放在方法表,而不经常使用的域在EEClass中。这样,需要被JIT编译函数使用的信息(如名字,域和偏移)在EEClass中,但是运行时需要的信息(如虚表槽和GC信息)在方法表中。
对每一个类型会加载一个EEClass到应用程序域中,包括接口,类,抽象类,数组和结构。每个EEClass是一个被执行引擎跟踪的树的节点。CLR使用这个网络在EEClass结构中浏览,其目的包括类加载,方法表布局,类型验证和类型转换。EEClass的子-父关系基于继承层次建立,而父-子关系基于接口层次和类加载顺序的结合。在执行托管代码的过程中,新的EEClass节点被加入,节点的关系被补充,新的关系被建立。在网络中,相邻的EEClass还有一个水平的关系。EEClass有三个域用于管理被加载类型的节点关系:父类(Parent Class),相邻链(sibling chain)和子链(children chain)。关于图4中的MyClass上下文中的EEClass的语义,请参考图13。
图13只显示了和这个讨论相关的一些域。因为我们忽略了布局中的一些域,我们没有在图中确切显示偏移。EEClass有一个间接的对于方法表的引用。EEClass也指向在默认应用程序域的高频堆分配的方法描述块。在方法表创建时,对进程堆上分配的域描述列表的一个引用提供了域的布局信息。EEClass在应用程序域的低频堆分配,这样操作系统可以更好的进行内存分页管理,因此减少了工作集。
图13中的其它域在MyClass(图3)的上下文的意义不言自明。我们现在看看使用SOS输出的EEClass的真正的物理内存。在mc.Method1代码行设置断点后,运行图3的程序。首先使用命令Name2EE获得MyClass的EEClass的地址。
!Name2EE C:\Working\test\ClrInternals\Sample1.exe MyClass MethodTable: 009552a0 EEClass: 02ca3508 Name: MyClass
Name2EE的第一个参数时模块名,可以从DumpDomain命令得到。现在我们得到了EEClass的地址,我们输出EEClass:
!DumpClass 02ca3508 Class Name : MyClass, mdToken : 02000004, Parent Class : 02c4c3e4 ClassLoader : 00163ad8, Method Table : 009552a0, Vtable Slots : 8 Total Method Slots : a, NumInstanceFields: 0, NumStaticFields: 2,FieldDesc*: 00955224 MT Field Offset Type Attr Value Name 009552a0 4000001 2c CLASS static 00a8198c str 009552a0 4000002 30 System.UInt32 static aaaaaaaa ui
图13和DumpClass的输出看起来完全一样。元数据令牌(metadata token,mdToken)表示了在模块PE文件中映射到内存的元数据表的MyClass索引,父类指向System.Object。从相邻链指向名为Program的EEClass,可以知道图13显示的是加载Program时的结果。
MyClass有8个虚表槽(可以被虚分派的方法)。即使Method1和Method2不是虚方法,它们可以在通过接口进行分派时被认为是虚函数并加入到列表中。把.cctor和.ctor加入到列表中,你会得到总共10个方法。最后列出的是类的两个静态域。MyClass没有实例域。其它域不言自明。
我们关于CLR一些最重要的内在的探索旅程终于结束了。显然,还有许多问题需要涉及,而且需要在更深的层次上讨论,但是我们希望这可以帮助你看到事物如何工作。这里提供的许多的信息可能会在.NET框架和CLR的后来版本中改变,不过尽管本文提到的CLR数据结构可能改变,概念应该保持不变。
Hanu Kommalapati是微软Gulf Coast区(休斯顿)的一名架构师。他在微软现在的角色是帮助客户基于.NET框架建立可扩展的组件框架。可以通过[email protected]联系他。
Tom Christian是微软开发支持高级工程师,使用ASP.NET和用于WinDBG的.NET调试器扩展(sos/ psscor)。他在北卡罗来州的夏洛特,可以通过[email protected]联系他。
翻译者Luke是微软公司的软件工程师,习惯使用C++和C#开发应用程序。闲暇时间他喜欢音乐,旅游和怀旧游戏,并且愿意帮助MSDN翻译更多的文章和其他开发者共享。可以通过[email protected]联系他。