XML文件
就在前几年XML刚刚问世的时候,它就被赋予电子商务的世界语的美称,尤其在B2B(business-2-business)领域内更是如此。原因就是XML是个非常简单的而又是结构化的ASCII文本语言,任何人和任何事都能读懂它。与作为当前网页标准格式的HTML语言不一样。两者之间的不同之处在于:HTML要用预先定义的语法集来解释;XML文件虽然要遵循通用的语法规则,但真正的关键词(标记)则是由作者决定的。其含义可由DTD(Document Type Definition)文件或者现在更为流行使用的纲(Schema)来选择定义。使用DTD或Schema的XML文件可以说是一个自我解释的文件,在数据集成化和出错调整时都很有用。
XML的结构化模式使得数据和信息可以在应用程序之间相互传递(包括在多层应用的中间层之间,例如Delphi提供的功能)。它提供一个标准格式,对所用的通讯协议是透明的。这就是XML在电子商务应用的电子数据交换(Electronic Data Interchange, EDI)和B2B中扮演重要角色的原因。通过DTD或者Schema来“定义”(或检查)XML文件理所当然地使得任何人都可以与任何其它人和事交谈,只要使用恰当的的XML/DTD/Schema组合。现在越来越经常要求集成现有的系统,XML可能成为系统之间相互交谈和理解的“语言”。
本文不讨论涉及EDI或B2B的XML。但它引出三篇论及XML文件编程和Delphi 6的XML新特性的文章。
XML文件编程
Delphi 6 支持DOM解析,因此我们可以读(和翻译!)以及编辑任何XML文件,甚至在缺少了DTD或Schema的情况下,一如本文所示。我在本文创建了一个包含我的网页内容的小小的XML文件:
<?xml version="1.0" standalone="yes" ?>
<Clinics>
<Clinic No="2002-1">
<Title>dbExpress and DataSnap</Title>
<Date>2002/01/10</Date>
<Topics> </Topics>
</Clinic>
<Clinic No="2002-2">
<Title>WebBroker/InternetExpress and WebSnap</Title>
<Date>2002/01/31</Date>
<Topics> </Topics>
</Clinic>
<Clinic No="2002-3">
<Title>WebSnap and Adapters</Title>
<Date>2002/02/21</Date>
<Topics> </Topics>
</Clinic>
<Clinic No="2002-4">
<Title>BizSnap and WebServices</Title>
<Date>2002/03/14</Date>
<Topics> </Topics>
</Clinic>
<Clinic No="2002-5">
<Title>WebSnap and BizSnap</Title>
<Date>2002/04/04</Date>
<Topics> </Topics>
</Clinic>
</Clinics>
*这个XML文件将作为这组系列文章的例子(本文以及后面的XML数据绑定和XML映像等文章里都会用到)
TXMLDocument组件
要进行XML文件编程就要用到TXMLDocument组件(在Delphi 6组件栏的Internet标签里)。可以从那里拖拽一个组件到窗体或数据模块上。TXMLDocument组件有些值得一提的属性。显然,Active属性可以用于打开XML文件,但我们这会儿还用不上。DOMVendor属性定义了XML文件的解析器。在我的机器上,被置为"MSXML"。可以自己插入其它类型的DOMVendor(实际就是任何能够执行IDOMImplementation的接口组件)。在使用自己的DOMVendor组件前,要对它先进行注册。DOMVendor是一个全局变量,含有一个DOMVendor注册值表。这样第三方的DOMVendor可以在注册后加入这个表,让用户可以自行选择TXMLDocument的DOMVendor属性值。
TXMLDocument的第三个属性是FileName,指向XML文件(本例为clinics.xml)。如果XML文件并不是直接存在,而是通过其它转换获得,也可以设置这个属性值[译者注:只要使用的解析器支持,甚至可以指向一个URL]。这是在EDI和B2B里的基本用法,这种场合下往往不必[有时也不可能 - 译者]存储真正的XML文件。
NodeIndentStr属性决定子节点的后移位置,缺省值为二个空格,最多可选到八个空格。这个属性只有在选项里设置了doNodeAutoIndent标识为真(True)后才有效,这个标识的缺省状态为非真(False)。组件选项里还有其它标识,如NodeAutoCreate, AttrNull, AutoPrefix, NamespaceDecl和AutoSave。AutoSave使得组件在关闭时能够将XML文件发生的变动自动存盘。我觉得这是个非常好的特性,所以在我的例子里,我把它设置为真(它的缺省状态是非真)。
除了常规选项之外,XMLDocument组件还有解析选项,如ResolveExternals, ValidateOnParse, PreserveWhiteSpace和AsyncLoad,这些标识的意义从名字上就可以看出。
XMLDocument组件的最后一个属性是XML,指向一条XML的字符串(点击属性旁边的省略号可以编辑XML)。正如我前面说过的,这在B2B多层应用中是非常有用的。这时中间层往往接收从其它应用中得到XML字符串,就要对这些XML数据进行处理或“编程”。
XML文件编程
只要稍作设置(设置FileName为clinics.xml和将doAutoSave置为真),就可以激活TXMLDocument组件。激活之后,就可以遍历节点,读取和编辑数据。
现在我们可以在XMLDocument里访问各个节点(IXMLNode),递归访问各节点的子节点。例如,可以用一个按钮来获取第一个节点的元素值并将结果写入Memo:
procedure TForm1.Button1Click(Sender: TObject);
var
Clinic: IXMLNode;
begin
Clinic := XMLDocument1.DocumentElement.ChildNodes[0];
Memo1.Lines.Clear;
Memo1.Lines.Add(Clinic.ChildNodes['Title'].Text);
Memo1.Lines.Add(Clinic.ChildNodes['Date'].Text);
Memo1.Lines.Add(Clinic.ChildNodes['Topics'].Text) ;
end;
增加索引指针可以访问其它节点。下面的例子用"current"作索引,通过循环增加"current"的值来遍历节点。我用try-except来防止循环出界。
procedure TForm1.Button2Click(Sender: TObject);
var
Clinic: IXMLNode;
Begin
Inc(current);
Try
Clinic := XMLDocument1.DocumentElement.ChildNodes[current];
Memo1.Lines.Clear;
Memo1.Lines.Add(Clinic.ChildNodes['Title'].Text);
Memo1.Lines.Add(Clinic.ChildNodes['Date'].Text);
Memo1.Lines.Add(Clinic.ChildNodes['Topics'].Text);
Except
on E: Exception do
Memo1.Lines.Add(E.Message)
End
end;
除了遍历节点之外,还可以修改子节点的值。下面的代码将第一个节点的标题值加上一个"HOT"前缀。
procedure TForm1.Button1Click(Sender: TObject);
var
Clinic: IXMLNode;
Begin
current := 0;
Clinic := XMLDocument1.DocumentElement.ChildNodes[current];
Memo1.Lines.Clear;
Clinic.ChildNodes['Title'].Text := 'HOT: ' + Clinic.ChildNodes['Title'].Text;
Memo1.Lines.Add(Clinic.ChildNodes['Title'].Text);
Memo1.Lines.Add(Clinic.ChildNodes['Date'].Text);
Memo1.Lines.Add(Clinic.ChildNodes['Topics'].Text);
end;
还可以增删节点。下面的代码增加一个子节点并赋予缺省值:
procedure TForm1.Button1Click(Sender: TObject);
var
Clinic: IXMLNode;
begin
Clinic := XMLDocument1.DocumentElement.AddChild('Clinic');
Clinic.ChildNodes['Title'].Text := 'Title';
Clinic.ChildNodes['Date'].Text := 'Date';
Clinic.ChildNodes['Topics'].Text := 'Topics';
end;
记住,我们已经将AutoSave设置为真。所以在XMLDocument对象或应用关闭时,任何变化都将自动存盘。也可以调用XMLDocument1.SaveToFile方法显式存盘。