1.XSLT的概念
1.1 什么是XSLT
1.2 为什么要用XSLT
1.3 XSLT的历史
1.4 什么是XPath
1.5 XSLT和CSS的比较
1.6 XSLT和IE5
1.XSLT的概念
我们首先来澄清一个概念,大家可能听说过XSL(eXtensible Stylesheet Language),XSL和我们这里说的XSLT从狭义上理解是一样的,而按照W3C的标准,XSLT的说法更严格些,因此我们在文章中统一使用XSLT的称法。它们之间具体的关系我们会在下面讲述。
1.1 什么是XSLT
XSLT的英文标准名称为eXtensible Stylesheet Language Transformation。根据W3C的规范说明书(http://www.w3.org/TR/xslt),最早设计XSLT的用意是帮助XML文档(document)转换为其它文档。但是随着发展,XSLT已不仅仅用于将XML转换为HTML或其它文本格式,更全面的定义应该是:
XSLT是一种用来转换XML文档结构的语言。
1.2 为什么要用XSLT
我们已经知道,XML是一种电脑程序间交换原始数据的简单而标准的方法。它的成功并不在于它容易被人们书写和阅读,更重要的是,它从根本上解决了应用系统间的信息交换。因为XML满足了两个基本的需求:
(1).将数据和表达形式分离。就象天气预报的信息可以显示在不同的设备上,电视,手机或者其它。
(2).在不同的应用之间传输数据。电子商务数据交换的与日俱增使得这种需求越来越紧迫。
为了使数据便于人们的阅读理解,我们需要将信息显示出来或者打印出来,例如将数据变成一个HTML文件,一个PDF文件,甚至是一段声音;同样,为了使数据适合不同的应用程序,我们必须有能够将一种数据格式转换为另一种数据格式,比如需求格式可能是一个文本文件,一个SQL语句,一个HTTP信息,一定顺序的数据调用等。而XSLT就是我们用来实现这种转换功能的语言。将XML转换为HTML,是目前XSLT最主要的功能。
1.3 XSLT的历史
想很多其他XML家族成员一样,XSLT是由W3C起草和制定的。它的主要发展历程如下:
.1995年由James Clark提议;
.1997年8月正式提案为XSL;
.1998年5月由Norman Walsh完成需求概要;
.1998年8月18日XSL草案发布;
.1999年11月16日正式发布XSL 1.0推荐版本。
目前,XSLT仍然在快速的发展中,XSLT1.1的草案已经可以在W3C网站(http://www.w3.org/TR/xslt11)上看到。
1.4 什么是XPath
XPath是XSLT的重要组成部分,我们将在第四章讲解它的详细语法。那么XPath是什么呢?我们首先来了解一下XSL系列的"家族"关系。如下图:
XSL在转换XML文档时分为明显的两个过程,第一转换文档结构;其次将文档格式化输出。这两步可以分离开来并单独处理,因此XSL在发展过程中逐渐分裂为XSLT(结构转换)和XSL-FO(formatting objects)(格式化输出)两种分支语言,其中XSL-FO的作用就类似CSS在HTML中的作用。而我们这里重点讨论的是第一步的转换过程,也就是XSLT。
另外,在学习XML时我们已经知道XML是一个完整的树结构文档。在转换XML文档时可能需要处理其中的一部分(节点)数据,那么如何查找和定位XML文档中的信息呢,XPath就是一种专门用来在XML文档中查找信息的语言。XPath隶属XSLT,因此我们通常会将XSLT语法和XPath语法混在一起说。
用一种比较好理解的解释:如果将XML文档看作一个数据库,XPath就是SQL查询语言;如果将XML文档看成DOS目录结构,XPath就是cd,dir等目录操作命令的集合。
1.5 XSLT和CSS的比较
2. XSLT的实例
2.1 XSLT如何转换XML
2.2 一个实例
2.3 过程解析
2.4 XSLT的用途
2.1 XSLT如何转换XML
我们打个有趣的比方,你玩过橡皮泥吧,用不同的模子按上去,就可以做出需要的形状。如果我们假设XML数据文档是一块大橡皮泥,XSLT就象是一个模子,用力一按,就做出需要的形状来---符合不同需要的HTML文档。
具体看下面的过程示意图:
我们将XML原文档输入,用XSL作为模板,通过转换引擎,最终输出需要的HTML文档。其中的转换引擎就是比喻中"用力一按"的过程。在具体应用中,有专门的软件来实现这个转换过程,名为XML Processor。目前已经有很多 Processor 软件(下面将详细提到),在IE5.5中也已经内嵌了XML Processor。
2.2 一个实例
现在我们来看一个简单的XSLT实际应用例子,获得一些感官上的认识。很多网页设计师看到类似HTML的代码才会放心,代码是那样的亲切和熟悉。
例子1: "Hello, world!"
hello world作为第一个教程已经是程序语言中的惯例了。我们也遵守这个惯例,看看如何利用XSLT来显示"hello world"。虽然这个例子没有什么实际用途,但是请大家不要急,后面还有更详细的例子。
第一步:建立要输入XML文档hello.xml。
<?xml version="1.0" encoding="iso-8859-1"?>
<greeting>Hello, world!</greeting>
这是一个很简单XML文档,只包含一个节点的XML结构树。
第二步:建立XSLT文档hello.xsl。提示:默认的XSLT文件的后缀名为.xsl。
<?xml version="1.0" encoding="iso-8859-1"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
<xsl:template match="/">
<html>
<head>
<title>First XSLT example</title>
</head>
<body>
<p><xsl:value-of select="greeting"/></p>
</body>
</html>
</xsl:template>
</xsl:stylesheet>
你现在可以用IE5.0以上版本浏览器打开这个hello.xsl文件,看到XSL的结构树。
第三步:在XML中调用这个XSL文件。修改hello.xml的代码为:
<?xml version="1.0" encoding="iso-8859-1"?>
<?xml-stylesheet type="text/xsl" href="hello.xsl"?>
<greeting>Hello, world!</greeting>
ok,到这一步原理上已经完成了所有的代码,接下来只要用一个XSLT的处理器(XML Processor)来执行hello.xml就可以看到"hello
world"的显示结果了。流行的处理器软件有以下几种:
(1).James Clark的XT。下载网址:http://www.jclark.com/xml/xt.html
(2).IBM的XML for Java软件包,名为LotusXSL。下载网址:www.alphaworks.ibm.com/tech/xml4j
(3).Saxon。下载网址:http://www.wrox.com
(4).微软的MSXML3。下载网址:http://www.microsoft.com/xml
有网友要问,我想在浏览器中看到"hello world"的效果应该怎么做?在微软的IE5.5内嵌了MSXML3解释器,你可以用IE5.5打开hello.xml文件,就可以看到结果。如果只看到XML结构树,不是单独的"hello
world"字样,说明你的浏览器没有安装MSXML3版本。
如果没有安装又想看效果怎么办?那还是用我们在XML教程中的老办法,采用JS实现。(这已经超出了本文要讲的范围,但为了更加直观,便于理解,我们在这里提供实例代码。)下面是一种实现的代码,可以保存为hello.htm,和上面的hello.xml,hello.xsl放在同一目录下面。最后用IE5.0以上版本打开hello.htm就可以看到效果了。
<html>
<head>
<script language="JavaScript" for="window" event="onload">
var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");
xmlDoc.async="false";
xmlDoc.load("hello.xml");
nodes = xmlDoc.documentElement.childNodes;
greeting.innerText = nodes.item(0).text;
</script>
<title>First XSLT Example</title>
</head>
<body bgcolor="#FFFFFF">
<span id="greeting"></span><br>
</body>
</html>
2.3 过程解析
如果你成功的看到效果,你也许想知道这些代码的具体含义,我们来详细解说:看hello.xsl文件
<?xml version="1.0" encoding="iso-8859-1"?>
这是标准的XML文档的首行代码,因为XSLT本身也是XML文档。encoding属性用来定义文档使用的编码形式,iso-8859-1主要支持西欧和北美的语言编码。如果你想使用简体中文,那么就应该写成:
<?xml version="1.0" encoding="GB2312"?>
接下去的代码是:
<xsl:stylesheet
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="1.0">
这是标准的XSLT文件首行代码。xsl:stylesheet代码的意思是将文档作为一个样式表来(stylesheet)处理。xmlns:xsl属性是一个名字空间声明,和XML中的名字空间使用方法一样,用来防止元素名称重复和混乱。其中前缀xsl的意思是文档中使用的元素遵守W3C的XSLT规范。最后的version属性说明样式表只采用XSLT
1.0的标准功能,这也是目前仅有的标准。
<xsl:template match="/">
一个<xsl:template>元素定义一个模板规则。属性match="/"说明XML源文档中,这个模板规则作用的起点。"/"是一种XPath语法,我们在后面将详细讲述,这里的"/"代表XML结构树的根(root)。
接下去的代码是:
<html>
<head>
<title>First XSLT Example</title>
</head>
<body>
<p><xsl:value-of select="greeting"/></p>
</body>
</html>
说明:当模板规则被触发,模板的内容就会控制输出的结果。例子中,模板大部分内容由HTML元素和文本构成。只有<xsl:value-of>元素是XSLT语法,这里<xsl:value-of>的作用是拷贝原文档中的一个节点的值到输出文档。而select属性则详细指定要处理的节点名称。这是XPath语法,"greeting"的意思就是寻找根节点名为greeting的元素,并用模板来处理这个节点。具体的就是找到<greeting>元素,然后将元素的值"hello
world"按模板样式拷贝到输出文件。
提示:由于XML文档是严格的层级结构(用IE5查看XML文件,会看见XML文档类似多级关联菜单),所以我们形象的称XML文档为文档树,其中每一对元素称作树的一个节点。根元素就是根节点。
最后关闭所有元素:
</xsl:template>
</xsl:stylesheet>
好,例子解说完毕。你是否想过为什么要用这么复杂的方法来显示"hello world"呢?
关键不在表面,而在于实质:用这种方法,hello world可以从XML文档中被提取出来,并用各种不同的XSLT模板处理,来输出不同需求的文档。我们来看看XSLT的主要用途:
2.4 XSLT的用途
XSLT的主要用途就是数据转换应用。
由于以XML为基础的电子商务广泛普及,XSLT作为数据转换的角色也越来越重要。例如直接将电视新闻的数据格式转换成报纸新闻需要的数据格式;将股票数据直接转换成图片显示在网页上;对EDI(电子数据交换)数据进行统计,排序等等。
XSLT是处理类似工作的理想工具。
第三章
通过前面两章的介绍,我们已经对XSLT的基本概念和它的转换过程有了一些了解。下面我们一起来学习XSLT的具体语法。说到语法总是比较枯燥的,您可以大体上浏览一遍,等您真正需要使用XSLT的时候,再仔细研究它们。 3.1 xsl:template和xsl:apply-templates
模板(template)是XSLT中最重要的概念之一。XSLT文件就是由一个一个的模板组成,任何一个XSLT文件至少包含一个模板。模板的概念就象是搭积木;你如果是程序员,也可以将模板看作一个方法,一个类,或者一个模块。它们可以被拼装组合,也可以单独成块,不同的模板控制不同的输出格式。
xsl:template的语法是:
<xsl:template
xsl:template的作用是定义一个新模板。属性中name,priority,和mode用来区别匹配同一节点的不同模板。它们不是常用的属性。match属性则控制模板的匹配模式(pattern),匹配模式是用来定位XML源文档中哪一个节点被模板处理。一个模板匹配一个节点。我们用一个例子来帮助理解:
<xsl:template match="para">
下面的语句写法说明模板匹配所有的para元素和所有的chapter元素:
<xsl:template match="(chapter|para)">
下面的语句写法说明模板匹配所有的父节点为chapter元素的para元素:
<xsl:template match="chapter//para">
下面的语句写法说明模板匹配根节点:
<xsl:template match="/">
我们再来看apply-templates语法:
<xsl:apply-templates
xsl:apply-templates用来执行那一个节点被模板具体处理。你可以将它理解为程序中调用子函数。select属性用来定义确切的节点名称。xsl:apply-templates总是包含在xsl:template元素中,象这样:
<xsl:template match="/">
这段代码说明摸板匹配整个文档(根节点),具体执行时处理根节点下所有para元素。
<xsl:template match="para">
而这一段代码则表示摸板匹配para节点,所有para下的子元素都将被处理。 3.2 xsl:value-of
XSL:value-of用来将源文档中元素的文本值写到输出文档中。例如:
<?xml version="1.0" encoding="iso-8859-1"?>
我如果想在输出文档中显示上面这个XML源文档中的name元素的值,可以这样写XSLT代码:
<xsl:template match="PERSON">
执行后,你会看到"ajie"被单独显示出来。其中match="PERSON"定义摸板匹配PERSON节点,xsl:value-of 3.3 xsl:for-each
xsl:for-each语法允许你循环处理被选择的节点。例如:有一个含多个个人资料的XML文档:
<?xml version="1.0" encoding="iso-8859-1"?>
我需要显示所有人的姓名,则可以将XSLT代码写成:
<xsl:template match="PEOPLE">
3.4 xsl:if
xsl:if类似普通程序语言的if条件语句,允许设定节点满足某个条件时,被模板处理。xsl:if的语法格式为:
<xsl:if test=布尔表达式>
例如:
<xsl:template match="PEOPLE">
这段代码的意思是检测PEOPLE节点下所有的元素,如果发现有<name>元素,则将<name>元素的值输出。其中@符号是统配符,表示节点下所有的元素。 3.5 xsl:choose, xsl:when 和 xsl:otherwise
xsl:if语法没有else的属性。如果我们要进行多项选择,那么就要使用xsl:choose / xsl:when / xsl:otherwise系列流程控制语法了。具体的使用请看下面的XSL文件例子:
<xsl:template match="PEOPLE">
说明:首先在PEOPLE节点下寻找<name>属性值为ajie的元素,如果找到,将ajie用粗体输出;如果没有发现值为ajie的<name>元素,则将所有的<name>元素的值都用斜体输出;如果没有发现任何<name>元素,则显示"No
3.6 xsl:sort
在XSLT中可以对XML源文档的元素进行重新排序,排序的语法就是xsl:sort。举例:下面的代码就是将文档元素按name排序。
<xsl:template match="PEOPLE">
以上是XSLT的元素的主要语法,还有很多其他的语法,例如:import, include, element, attribute, number, param等等语法,在这里就不一一解释。我们的目的是让您对XSLT的语法有基本的概念,理解XSLT作为一种转换语言的强大功能。 |
4.XPath的语法 4.2 寻址操作 4.4 功能函数(Functions) |