在ASP.NET应用程序运行过程中,很可能会遇到各种意料之外的问题。如果在开发环境下,我们可以设置断点,对程序状态一探究竟。但是很显然,在产品环境中我们几乎无法使用这样的状态。也正因为如此,Dump一个内存快照并进行分析才成为一种“高级技术”,同时在线调试也成为一种需要结合技术能力、分析能力,甚至抗压能力的工作。对于调试和解决问题的探索永远不会停止,各成熟的技术团队几乎都会有一个丰富工具箱,用于应付生产环境中的各种状况。
在维护一些生产环境中的ASP.NET应用程序时,老赵也经常会感到“力不从心”。虽然我们可以建立丰富有效的监控或日志等维护机制,但是调试和分析一次程序经常需要耗费大量的脑细胞。因为我们可以使用的工具大都非常抽象,即使是一个非常微小的问题,也要用较多的时间才能发现“哦,原来是这个变量的值进入了一种奇怪的状态”。如果我们有一种机制,可以直观地检查生产环境中正在运行的程序的状态,那么一定可以大大方便我们的工作。
这篇文章记录的便是老赵的一次探索。
我们的目的是“在程序运行过程中记录状态”。使用ASP.NET的传统机制,例如HttpModule,Trace,往往需要修改配置和部署新的程序集,这样一不小心便会造成应用程序的重启。对于访问量数据量到了一定规模的时候,冷启动的消耗也是相当可观的,不断地冷启动会对应用程序造成非常大的影响。可能我们希望的,只是能够简单地(在不影响现有系统的情况下)执行一段代码,并输出一些内容。要实现这点其实并不难,例如最直接的做法便是提交一段代码,保存成文件,调用CSC将其编译成dll,然后在程序中进行加载。这已经不是一种新鲜的技巧了,它已经用在很多地方,得到了一些不错的效果。
但是,老赵在这里还是想使用IronPython,一个原因是老赵最近也在尝试合理地混用各种语言(F#, IronPython, IronRuby, etc.)编写应用程序以提高生产力,便“顺便”地用上了IronPython的现有成果。IronPython已经内置了Python代码的执行引擎,并且能与.NET程序无缝集成。此外,社区中也已经接受了如Crack.NET等基于IronPython的调试工具1,表明IronPython已经足够成熟,可以放心使用。关于更多IronPython的信息,可以参考在QCon London 20092中,《IronPython in Action》一书的作者Michael Foord的演讲“Real World IronPython”。
在这里,我们先准备一个简单的aspx页面,其中有两个文本框,以及一个按钮:
<asp:TextBox ID="txtCode" runat="server" Height="320px" TextMode="MultiLine" Width="640px">asp:TextBox> <br /> <asp:Button ID="btnExecute" runat="server" onclick="btnExecute_Click" Text="Execute" /> <br /> <asp:TextBox ID="txtOutput" runat="server" Height="320px" TextMode="MultiLine" Width="640px">asp:TextBox>
这里,我们希望在点击按钮之后,可以执行txtCode中的IronPython代码,并且将信息显示在txtOutput中:
protected void btnExecute_Click(object sender, EventArgs e) { ScriptEngine engine = Python.CreateEngine(); var scope = engine.CreateScope(); var script = engine.CreateScriptSourceFromString( this.txtCode.Text, SourceCodeKind.Statements); script.Execute(scope); TextWriter writer = new StringWriter(); scope.SetVariable("logger", writer); Action<HttpContext> trace; if (scope.TryGetVariable<Action<HttpContext>>("trace", out trace)) { trace(this.Context); } this.txtOutput.Text = writer.ToString(); }
如果您要使用上面的代码,则需要引用IronPython、Microsoft.Scripting及Microsoft.Scripting.Core三个程序集。您可能没有接触过这部分内容,但是应该也能够轻易理解上述代码的含义:
- 创建一个ScriptEngine对象,并得到一个ScriptScope。
- 将txtCode文本框内的代码,作为Statements编译为ScriptSource对象。
- 创建一个StringWriter对象,并赋给ScriptScope中的logger变量。
- 执行ScriptSource,并从中获取trace方法成为一个委托。
- 将当前HttpContext传入trace方法执行,并输出内容。
于是我们准备一段IronPython代码,它的作用是输出当前请求的UserAgent,如下图:
只是这么一个简单的功能,我们便可以做很多事情,例如使用反射改变某个对象的状态,甚至调用系统中某个方法进行复杂的工作。不过在实际使用时我们可能还需要额外的注意:由于我们基于单个“请求”,因此只能有一台机器得以动态执行IronPython代码。如果在产品环境中只有一台机器,那么自当无事,否则我们就可能需要某种手段来确保我们的代码是在哪台服务器上执行的。例如,对于DNS轮询方式的附载均衡策略,您只需修改本机DNS即可,否则您可能就需要根据您的NLB策略进行其它一些配置。更进一步,如果您需要代码在所有机器上执行,可能就需要编写一个远程调用平台,可以将代码发送到所有机器上执行,并将结果进行聚合。
在下一篇文章中,我们将使用类似的做法,对系统中的请求进行采样,以获取更加丰富的数据——那是一件更有意思的事情.
注1:Crack.NET是用于分析WinForm和WPF应用程序状态的工具,可能是由于CLR托管方式的不同,它无法用于ASP.NET或SQL Server等托管程序上。
注2:(广告时间)QCon北京是中国举办的第一次QCon大会,业界各顶尖专家齐聚一堂,如果哪位朋友或所在公司感兴趣,请和老赵联系。
相关文章:使用IronPython检测ASP.NET程序状况(下)