DLR
一.近年来,在TIOBE公司每个月发布的编程语言排行榜中,C#总是能挤进前十名,而在最近十年来,C#总体上呈现上升的趋势.C#能取得这样的成绩,有很多因素,其中它在语言特性上的锐意进取让人印象深刻.
C#4动态功能是Dynamic Language Runtime(动态语言运行时,DLR)的一部分.DLR是添加到CLR的一系列服务,它允许添加动态语言,如Ruby和Python,并使C#具备和这些动态语言相同的某些功能.
动态编程语言并非什么新鲜事物,早在面向对象编程语言成为主流之前,人们就已经使用动态编程语言来开发了.及时在JAVA,C#,C++等面向对象编程语言繁荣兴旺,大行于世的年代,动态编程语言也在”悄悄”的攻城略地,占据了相当的开发领域,比如JS也已成为了web客户端事实上的主流语言.
最近这几年,动态语言变得很火,比如Python,Ruby.
这里有一个问题,为什么我们需要在开发中应用动态编程语言?与C#he JAVA这类已经变得非常成熟且功能强大的静态类型编程语言相比,动态编程语言有何优势?
简单地说,使用动态编程语言开发拥有以下特性:
1.支持REPL(read-evaluate-print Loop:读入->执行->输出,循环迭代)的开发模式,这个过程就简洁明了了,直指问题的核心.
案例:我们使用IronPython[2]变成计算1+2+...+100,我们可以快速的输入一段完成累加求和的代码,然后马上就可以求和:
如果使用C#开发貌似就麻烦的多了,得先使用VS创建一个项目,然后向其中添加一个类,在类中写一个方法完成求和的功能,在编译调用这一方法的代码,编译,排错,最后才能得到结果.
2.扩展方便.用户可以随时对代码进行调整,需要什么功能直接往动态对象上”加”就是了,不是的时候可以一处他们.而且这种修改可以马上生效,并不像C#那样必须先修改类的定义和声明,编译之后新方法才能使用.
换句话说:使用动态语言编程,不需要“重量级”的OOAD,整个开发过程迭代迅速而从不拖泥带水。 |
3.动态编程语言的类型解析实在运行时完成的,可以省去许多不必要的类型转换代码,因此,与静态类型编程语言相比,动态类型编程语言写的代码往往更紧凑,量更少.
当然了,动态语言的缺点也是有的:
1.代码中的许多错误要等到运行的时候才能发现,而且需要特定的运行环境支持,对其进行测试不太方便,也不支持许多用于提升代码质量的各种软件工程工具,因此不太适合开发规模大,包含复杂逻辑的应用系统.
2.与静态语言相比,动态语言编写的程序性能较低.不过随着计算机硬件技术的不断进步,比如多核CPU的广发应用,动态编程语言引起和运行环境不断的优化,动态编程语言编写的程序性能不断提升,在特定的应用场景中,甚至可以逼近静态语言编写的程序.
二.拥抱”动态编程”特征的C#4
为了让C#,VB等.NET编程语言能具备动态编程语言的特性,.NET4引入了一个DLR:
DLR运行于CLR之上,提供了一个动态语言的运行环境,从而允许Python,Ruby等动态语言编写的程序在.NET平台上运行,同时,现有的.NET静态类型编程语言,比如C#和VB,也可以利用DLR而拥有一些动态编程语言的特征.
(1)使用C#4编写动态的代码
C#4新增了一个dynamic关键字,可以用它来编写”动态的代码”.
例如:以下代码创建乐一个ExpandoObject对象(注意必须定义为dynamic):
//这里需要添加命名空间System.Dynamic;
dynamic dynamicObj = new ExpandoObject();
//这一对象的奇特之处在于,我们可以随时给她们添加新成员
dynamicObj.Value = 100;//添加字段
dynamicObj.Increment = new Action(() => dynamicObj.Value++);//添加方法
//这些动态添加的成员与普通的类成员用法一样
for (int i = 0; i < 10; i++)
{
dynamicObj.Increment();
Console.WriteLine("dynamicObj.Value: {0}", dynamicObj.Value);
}
分析:ExpandoObject对象实现了IDictionary<string,object>接口,可看成是一个字典对象,所有动态添加的成员都是这个字典对象中的元素,这意味着我们不仅仅可以添加新成员,还可以随时移除我们不需要的成员.
//移除Increment方法
(dynamicObj as IDictionary<string, object>).Remove("Increment");
方法移除后之后,再尝试访问此方法将引发RuntimeBinderException异常.
(2)使用dynamic关键字简化与COM组件交互的代码
要在.NET这个”托管世界”里调用”非托管世界”中的COM组件,我们必须通过”互操作程序集(InteropAssembly)”作为桥梁,”互操作程序集”定义了CLR类型与COM类型之间的对应关系.
只要给.NET项目添加对”互操作程序集”的引用,就可以在.NET应用程序中创建这一程序集所包含的各种类型的实例(即COM包装器对象),对这些对象的方法调用(或对其属性的存取)将会被转发给COM组件.
以调试word为例,在C#4以前您可能经常需要编写这样的代码:
Object wordapp = new Word.Application(); //创建Word对象
Object fileName = “MyDoc.docx” ;//指定Word文档
Object argu = System.Reflection.Missing.Value;
Word.Document doc = wordapp.Documents.Open(ref fileName, ref argu,
ref argu, ref argu, ref argu, ref argu, ref argu, ref argu,
ref argu, ref argu, ref argu, ref argu, ref argu, ref argu,
ref argu, ref argu);
上述对Open()方法的调用语句只能用一句”JB”来形容,其原因是word组件中的Open()方法定义了太多的参数.
C#4使用dynamic关键字,配合从VB中学来的”命名参数与可选参数”这两个新语法特性,可以写出简介的代码.
dynamic wordapp = new Word.Application();
dynamic doc = wordapp.Documents.Open(FileName: “MyDoc.docx”);
上述代码省去了用不着的参数,并且可以去掉参数前的ref关键字.
当上述代码运行时,DLR会使用反射技术将dynamic表达式”绑定(bind)”到COm互操作程序集中所包含的Word.Application代理对象.
(3)C#4动态编程技术内幕
C#4中所定义的dynamic变量可以引用以下类型的对象:
a.传统的”静态”的CLR对象
b.COM包装器对象.
c.实现了IDynamicMetaObjectProvider接口的”动态对象”,ExpandoObject就是这种类型对象的实例.
d.基于DLR实现的动态语言(比如IronRuby和IronPython)所创建的对象
从C#程序员的角度看,所有这四种对象都是一样的,都可用一个dynamic变量引用之,而DLR在程序运行时动态的讲方法调用和字段存取请求”绑定”到真正的对象上.
dynamic的功能时有DLR所支撑的,是C#编译器与DLR分工合作的成果.
请看以下代码:
dynamic d=100;
d++;
C#编译器在处理上述代码时,它并不是去检查变量d是否可以支持自增操作,而是为其创建了一个CallSite<T>对象(<>p_Site1),声明如下:
private static class <Main>o_SiteContainer(){
public static CallSite<Func<CallSite,object,object>><>p_Site1;
}
中文MSDN将CallSite<T>译为“动态(调用)站点”,它是DLR中的核心组件之一。
动态站点对象通过CallSite<T>.Create()方法创建, C#编译器会为其指定一个派生自CallSiteBinder的对象(称为“动态站点绑定对象”)作为其参数。
动态站点绑定对象是与具体语言相关的,比如IronPython和C#都有各自的动态站点绑定对象。
动态站点绑定对象的主要工作是将代码中的动态表达式(本例中为d++)转换为一棵“抽象语法树(AST:Abstract Syntax Tree)”,这棵语法树被称为“DLR Tree”,是在.NET 3.5所引入的LINQ表达式树的基础上扩充而来的,因此,有时又称其为“表达式树(Expression Tree)”
DLR在内部调用此表达式树的Compile()方法生成IL指令,得到一个可以被CLR所执行的委托(在本例中其类型就是Func<CallSite, object, object>)。
动态调用站点对象(本例中为<>p__Site1)有一个Target属性,它负责引用这一生成好的委托。
委托生成之后,动态表达式的执行就体现为委托的执行,其实参由C#编译器直接“写死”在IL代码中。
简化的代码示意如下(通过Reflector得到,为便于阅读,修改了变量名):
object d = 100;
object CS$0$0000 = d;
if (<>p__Site1 == null)
<>p__Site1 = CallSite<Func<CallSite, object, object>>.Create(……);
d = <>p__Site1.Target(<>p__Site1, CS$0$0000);
上述类型推断、方法绑定及IL代码生成的工作都是在程序运行时完成的。
(4)动态代码很慢吗?
动态编程语言易学易用,代码紧凑,开发灵活,但性能则一直是它的”软肋”.为了提升性能,DLR设计了一个三级缓存策略.
动态站点绑定对象回味动态调用表达式转换而成的语法书加上相应的测试条件(称为”test”),构成一个”规则(Rule
)”,这个规则可以用于判断某个语法树是否可用于特定的动态调用表达式.
案例:观察下面这个动态表达式
d1+d2
如果再程序运行时d1和d2都是int类型的整数,则DLR生成的规则为:
if(d1 is int && d2 is int)//测试条件
return (int)d1+(int)d2; //语法树
DLR通过检查规则中的”测试条件”,就可以知道某个动态表达式是否可以使用此规则所包含的语法树.
“规则”是DLR缓存的主要对象.
前面介绍过的动态站点对象Target属性所引用的委托是第一级缓存,它实现的处理逻辑是这样的:
//当前处理规则,属于第1级缓存
if( d1 is int && d2 is int) //测试条件
return (int)d1+(int)d2; //满足测试条件,直接返回一个表达式树
//未命中,则在第2级、第3级缓存中查找,如果找到了,用找到的结果更新第1级缓存
return site.Update(site,d1,d2);
如果3级缓存中都没有命中的规则,则此动态站点所关联的调用站点绑定对象会尝试创建一个新的规则。如果创建新规则失败,则由当前编程语言(比如C#)所提供的默认调用站点绑定对象决定如何处理,通常的作法是抛出一个异常。
当前版本的DLR第2级缓存了10条规则,第3级则缓存了100条规则。
由于DLR自身设计了一个“规则”缓存系统,又充分利用了CLR所提供的JIT缓存(因为所有动态调用代码最终都会转换为CLR可以执行的IL指令,而CLR可以缓存这些代码),使得动态代码仅仅在第一次执行时性能较差,后续的连续调用其性能可以逼近静态代码.
三.C#4与动态语言的继承
由于几乎所有的编程语言都可以使用抽象语法树来表示,因此,在理论上DLR支持无限多种编程语言间的互操作,在当前版本中,可以实现C#/VB与IronPython与IronRuby的互操作,相信很快会出现其他动态编程语言的DLR实现.
一个有趣的地方是当前局域DLR实现的动态编程语言都以”Iron”开头,比如IronRuby和IronPython.IronPython的设计者,DLR的架构设计师曾经在微软PDC2008大会上解释说主要是为了避免起一个Python.net或pythonfor.NET之类微软味十足的名字,才有了IronPython.他强调,Iron系列动态语言将严格遵守动态语言自身的标准和规范,尊重这些动态语言已有的历史和基类,不会引入一些仅限于.NET平台的新语言特征,并且这些语言的.NET实现保持开源.与此同时,该作者指出”Iron”系列语言能很好的与.net现有类库,编程语言和工具集成,并且能”嵌入”到.net宿主程序中.
(1)动态对象通讯协议
由于各种动态编程语言之间的特性相差极大,实现各语言间的互操作是个难题.为此DLR采取了一个聪明了策略,他不去尝试设计一个”通用的类型系统”(CLR就是这么干的),而是设计了一个”通用的对象通讯协议”,规定所有需要互操作的动态对象必须实现IDynamicMetaObjectProvider接口,此接口定义了一个GetMetaObject()方法,接受一个语法树作为参数向外界返回一个”动态元数据”对象:
DynamicMetaObject GetMetaObject(Expression parameter);
DynamicMetaObject对象向外界提供了两个重要属性,Restrictions引用一组测试条件,Expression属性则引用一个语法树.这两个属性组合起来就是可供动态站点对象缓存的”规则(Rule)”.
DLR中的”动态站点绑定对象”获取了DynamicMetaObject对象之后,他调用此对象所提供的各个方法创建”规则”,让”动态站点对象(CallSite<T>)”的Target属性引用它,完成动态绑定的工作.
(2)动态语言集成环境
为了方便的实现静态语言与各种动态语言间的相互集成,DLR提供了一整套称为”通用寄宿”的组件,其中包含ScriptRuntime,ScriptScope等类型.
我们可以将静态和动态编程语言组合起来,开发出一些具有高度交互性的应用程序,使用静态编程语言搭建系统框架,使用动态编程语言实现交互性,这是一个很值得关注的应用领域.
将来回出现一些静态,动态编程语言同时适用的库,像实现”无所不在的复用”目标又前进了一步.
Visual Studio 2010为新的.NET编程语言F#提供了专门的项目模板,但没有为IronPython和IronRuby之类动态语言的开发提供支持,相信随着动态语言在.NET平台之上的应用日趋广泛,后继版本的Visual Studio会直接支持动态语言的开发。
从C# 1.0~4.0所走过的路,可以很清晰地看到它的发展轨迹,得到这样的一个结论:
未来的编程语言应该是多范式的,具有高度的可组合性,在一个项目或产品中组合多个编程语言、使用多种编程范式会变得越来越普遍。
我们可以推断C#的后继版本将会在此条道路上越走越远……
什么是DLR呢?
DLR(Dynamic Language Runtime),是微软主导的一个开源项目.为,NET应用程序,提供脚本支持.目前版本为0.9,你可以从Codeplex获得源码.
DLR主要提供以下三个功能:
1.语言实现服务提供语言的互操作性
2.动态语言运行时服务提供动态调用支持
3.公共脚本宿主
依托这些模块,您可以非常轻松的做下面这些事
1.为您现有的.NET应用程序,加入脚本支持
2.为您现有的语言,提供动态知己
3.为任何对象提供动态操作支持
4.在您的架构中提供脚本语言.