C#基础语言知识--编译和执行过程(二)

3.加载公共语言运行时
  生成的每个程序集既可以是可执行应用程序,也可以是DLL。当然,最终是由CLR管理这些程序集中的代码的执行。这意味着目标机器必须安装好.Net Framework。

  要知道是否已安装.Net Framwork,只需检查%SystemRoot%\System32目录中的MsCorEE.dll文件。存在该文件,表明.Net Framework已安装。

  如果程序集文件值包含类型安全的代码,代码在32位和64位Windows上都能正常工作。在这两种Windows上运行,源代码无需任何改动。事实上,编译器最终生成的EXE/DLL文件在Windows的x86和x64版本上都能正常工作。在极少数情况下,开发人员希望代码只在一个特定版本的Windows上运行。例如,要使用不安全的代码,或者要和面向一种特定CPU架构的非托管代码进行互操作,就可能需要这样做。
  
  C#编译器提供了一个/platform命令行开关选项。这个开关允许指定最终生成的程序集只能在运行32位Windows版本的x86机器上使用,只能在运行64位Windows版本的x64机器上使用。不指定具体平台的话,默认选项就是anycpu,表明最终生成的程序集能在任何版本的Windows上运行。
C#基础语言知识--编译和执行过程(二)_第1张图片

  下表总结了两方面的信息。其一,为C#编译器指定不同/platform命令行开关将得到哪种托管代码。其二,应用程序在不同版本的Windows上如何运行。
C#基础语言知识--编译和执行过程(二)_第2张图片
Windows检查EXE文件头,决定是创建32位还是64位进程后,会在进程地址空间加载MSCorEE.dll的x86,x64或ARM版本。如果是Windows的x86或ARM版本,MSCorEE.dll的x86版本在%SystemRoot%\System32目录中。如果是Windows的x64版本,MSCorEE.dll的x86版本在%SystemRoot%\SysWow64目录中,64位版本则在%SystemRoot%\System32目录中。然后,进程的主线程调用MSCorEE.dll中定义的一个方法。这个方法初始化CLR,加载EXE程序集,再调用其入口方法(Main)。随即,托管应用程序启动并运行。

4.执行程序集的代码
  为了执行一个方法,首先必须把它的IL转换成本地CPU指令。这是CLR的JIT(just-in-time或者“即时”)编译器的职责。

  下图展示了一个方法首次调用时发生的事情。
  C#基础语言知识--编译和执行过程(二)_第3张图片

  就在Main方法执行之前,CLR会检测出Main的代码引用的所有类型。这导致CLR分配一个内部数据结构,它用于管理对所引用的类型的访问。在图1-4中,Main方法引用了一个Console类型,这导致CLR分配一个内部结构。在这个内部数据结构中,Console类型定义的每个方法都有一个对应的记录项。每个记录项都容纳了一个地址,根据此地址即可找到方法的实现。对这个结构进行初始化时,CLR将每个记录项都设置成(指向)包含在CLR内部的一个文档化的函数。我将这个函数称为JITCompiler。

  Main方法首次调用WriteLine时,JITCompiler函数会被调用。JITCompiler函数负责将一个方法的IL代码编译成本地CPU指令。由于IL是“即时”(just in time)编译的,所以通常将CLR的这个组件成为JITter或者JIT编译器。
  
  JITCompiler函数被调用时,它知道要调用的是哪个方法,以及具体是什么类型定义了该方法。然后,JITCompiler会在定义(该类型的)程序集的元数据中查找被调用的方法的IL。接着,JITCompiler验证IL代码,并将IL代码编译成本地CPU指令。本地CPU指令被保存到一个动态分配的内存块中。然后JITCompiler返回CLR为类型创建的内部数据结构,找到与被调用的方法对应的那一条记录,修改最初对JITCompiler的引用,让它现在指向内存块(其中包含了刚才编译好的本地CPU指令)的地址。最后,JITCompiler函数跳转到内存块中的代码。这些代码正是WriteLine方法(获取单个String参数的那个版本)的具体实现。这些代码执行完毕并返回时,会返回至Main中的代码,并跟往常一样继续执行。

  现在,Main要第二次调用WriteLine。这一次,由于已对WriteLine的代码进行了验证和编译,所以会直接执行内存块中的代码,完全跳过JITCompiler函数。WriteLine方法执行完毕之后,会再次返回Main。
  
  下图展示了第二次调用WriteLine时发生的事情。
  C#基础语言知识--编译和执行过程(二)_第4张图片

  一个方法只有在首次调用时才会造成一些性能损失。以后对该方法的所有调用都以本地代码的形式全速运行,无需重新验证IL并把它编译成本地代码。

  JIT编译器将本地CPU指令存储到动态内存中。一旦应用程序终止,编译好的代码也会被丢弃。所以,如果将来再次运行应用程序,或者同时启动应用程序的两个实例(使用两个不同的操作系统进程),JIT编译器必须再次将IL编译成本地指令。

  对于大多数应用程序,因JIT编译造成的性能损失并不显著。大多数应用程序都会反复调用相同的方法。在应用程序运行期间,这些方法只会对性能造成一次性的影响。另外,在方法内部花费的时间很有可能被花在调用方法上的时间多得多。

5.通用类型系统
CLR是完全围绕类型展开的,这一点到现在为止应该很明显了。类型为应用程序和其他类型公开了功能。通过类型,用一种编程语言写的代码能与用另一种语言写的代码沟通。由于类型是CLR的根本,所以Microsoft制定了一个正式的规范,叫做“通用类型系统”(Common Type System,CTS),它描述了类型的定义和行为。
  
CTS规范规定,一个类型可以包含零个或者多个成员。本书第II部分“设计类型”将更详细地讨论这些成员。目前只是简单地介绍一下它们。

  • 字段(Field) 一个数据变量,是对象状态的一部分。字段根据名称和类型来区分。
  • 方法(Method) 一个函数,能针对对象执行一个操作,通常会改变对象的状态。方法有一个名称、一个签名以及一个或多个修饰符。签名指定参数的数量(及其顺序);参数的类型;方法是否有返回值;如果有返回值,还要指定返回值的类型。
  • 属性(Property) 对于调用者,该成员看起来像是一个字段。但对于类型的实现者,它看起来像是一个方法(或者两个方法,称为getter和setter,或者称为取值方法和赋值方法)。属性允许实现者在访问值之前对输入参数和对象状态进行校验,以及/或者只有在必要的时候才计算一个值。属性还允许类型的用户采用简化的语法。最后,可利用属性创建只读或只写的“字段”。
  • 事件(Event) 事件在对象以及其他相关对象之间实现了一个通知机制。例如,利用按钮提供的一个事件,可以在按钮被单击之后通知其他对象。

CTS还指定了类型可视化规则以及类型成员的访问规则。例如,如果将类型标记为public(在C#中使用public修饰符),任何程序集都能看见并访问该类型。但是,如果将类型标记为assembly(在C#中使用internal修饰符),只有同一个程序集中的代码才能看见并访问该类型。所以,利用CTS制定的规则,程序集为一个类型建立了可视边界,CLR则强制(贯彻)了这些规则。

调用者虽然能“看见”一个类型,但并不是说就能随心所欲地访问它。利用一下选项,可进一步限制调用者对类型中的成员的访问。

  • private 成员只能由同一个类(class)类型中的其他成员访问。
  • family 成员可由派生类型访问,不管那些类型是否在同一个程序集中。注意,许多语言(比如C++和C#)都用protected修饰符来表示family。
  • family and assembly 成员可由派生类型访问,但这些派生类型必须是在同一个程序集中定义的。许多语言(比如C#和Visual Basic)都没有提供这种访问控制。当然,IL汇编语言不在此列。
  • assbmly 成员可由同一个程序集中的任何代码访问。许多语言都用internal修饰符来标识assembly。
  • family or assembly 成员可由任何程序集中的派生类型访问。成员也可由同一个程序集中的任何类型访问。在C#中,是用protected internal修饰符来标识family or assembly。
  • public 成员可由任何程序集中的任何代码访问。

除此之外,CTS还为类型继承、虚方法、对象生存期等定义了相应的规则。这些规则在设计之初,并顺应了可以用现代编程语言来表示的语义。事实上,根本不需要专门去学习CTS规则本身,因为你选择的语言会采用你熟悉的方式公开它自己的语言语法与类型规则。通过编译来生成程序集时,它会将语言特有的语法映射到IL–也就是CLR的“语言”。
  
下面是另一条CTS规则:所有类型最终必须从预定义的System.Object类型继承。可以看出,Object是System命名空间中定义的一个类型的名称。Object是其他所有类型的根,因为保证了每个类型实例都有一组最基本的行为。具体地说,System.Object类型允许做下面这些事情:

  • 比较两个实例的相等性(Equals)
  • 获取实例的哈希码(GetHashCode)
  • 查询一个实例的真正类型(GetType)
  • 执行实例的(浅)拷贝(MemberwiseClone)
  • 获取实例对象的当前状态的一个字符串表示(ToString)

6.公共语言规范
  要创建很容易从其他编程语言中访问的类型,只能从自己的编程语言中挑选其他所有语言都确定支持的那些功能。为了在这个方面提供帮助,Microsoft定义了一个“公共语言规范”(Common Language Specification,CLS),它详细定义了一个最小功能集。任何编译器生成的类型要想兼容于由其他“符合CLS、面向CLR的语言”所生产的组件,就必须支持这个最小功能集。

  CLR/CTS支持的功能比CLS定义的子集多得多。如果不关心语言之间的互操作性,可以开发一套功能非常丰富的类型,它们仅受你选用的那种语言的功能集的限制。具体地说,在开发类型和方法的时候,如果希望它们对外“可见”,能够从符合CLS的任何一种编程语言中访问,就必须遵守由CLS定义的规则。注意,假如代码只是从定义(这些代码的)程序集的内部访问,CLS规则就不适用了。
  下图形象地演示了这一段想要表达的意思。
  C#基础语言知识--编译和执行过程(二)_第5张图片
  
  上图所示,CLR/CTS提供了一个功能集。有的语言公开了CLR/CTS的一个较大的子集。例如,假定开发人员使用IL汇编语言写程序,就可以使用CLR/CTS提供的全部功能。但是,其他大多数语言(比如C#、Visual Basic和Fortran)只向开发人员公开了CLR/CTS的一个功能子集。CLS定义了所有语言都必须支持的一个最小功能集。

以下代码使用C#定义一个符合CLS的类型。然而,类型中含有几个不符合CLS的构造,造成C#编译器报错:

"font-size: 14px;">using System;
//  告诉编译器检查CLS相容性
[assembly: CLSCompliant(true)]

namespace SomeLibrary
{
    //  因为是public类,所以会显示警告

    public sealed class SomeLibraryType
    {
        //  警告:SomeLibrary.SomeLibraryType.Abc()的返回类型不符合CLS
        public UInt32 Abc() { return 0; }

        //  警告:仅大小写不同的标识符SomeLibrary.SomeLibraryType.abc()不符合CLS
        public void abc() { }

        //  不会显示警告:该方法是私有的
        private UInt32 ABC() { return 0; }

    }
}

  上述代码将[assembly:CLSCompliant(true)]这个attribute1应用于程序集。这个attribute告诉编译器检查public类型,判断是否存在任何不合适的构造,阻止了从其他编程语言中访问该类型。上述代码编译时,C#编译器会报告两条警告消息。第一个警告是因为Abc方法返回了一个无符号整数;有一些语言是不能操作无符号整数值的。第二个警告是因为该类型公开了两个public方法,这两个方法(Abc和abc)只是大小写和返回类型有别。Visual Basic和其他一些语言无法区别这两个方法。

  有趣的是,删除sealed class SomeLibraryType之前的public字样,然后重新编译,两个警告都会消失。因为这样一来,SomeLibraryType类型将默认为internal(而不是public),将不再向程序集的外部公开。要获得完整的CLS规则列表,请参见.NET Framework SDK文档的“跨语言互操作性”一节(http://msdn.microsoft.com/zh-cn/library/730f1wy3.aspx)。

  现在,让我们提炼一下CLS的规则。在CLR中,一个类型的每个成员要么是一个字段(数据),要么是一个方法(行为)。这意味着每一种编程语言都必须能访问字段和调用方法。这些字段和方法通过特殊或者通用的方式来使用。为了编程进行编程,语言通常提供了额外的抽象,对这些常见的编程模式进行简化。例如,语言可能公开枚举、数组、属性、索引器、委托、事件、构造器、析构器、操作符重载、转换操作符等概念。编译器在源代码中遇到上述任何一种构造,必须将其转换成字段和方法,使CLR和其他编程语言能够访问这些构造。

7.编译和执行过程总结
  下图简要说明了上述特性在编译和执行过程中如何发挥作用。
  C#基础语言知识--编译和执行过程(二)_第6张图片

你可能感兴趣的:(C#)