---------------------- android培训、java培训、期待与您交流!----------------------
Schema文件的DTD表示
<!ENTITY % datatypes "(entity | entities | enumeration | id | idref | idrefs | nmtoken | nmtokens | notation | string | bin.base64 | bin.hex | boolean | char | date | dateTime | dateTime.tz | fixed.14.4 | float | int | number | time | time.tz | i1 | i2 | i4 | r4 | r8 | ui1 | ui2 | ui4 | uri | uuid)"
>
<!-- *** 数据类型 **** -->
<!ELEMENT datatype (description)*>
<!ATTLIST datatype
dt:type %datatypes; #IMPLIED
xmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
>
<!-- ***** 描述 ***** -->
<!ELEMENT description (#PCDATA) >
<!-- **** 元素引用 ***** -->
<!--附加限制: maxOccurs 必须是 1 or "*" -->
<!ELEMENT element (description)* >
<!ATTLIST element
type IDREF #REQUIRED
minOccurs CDATA #IMPLIED
maxOccurs CDATA #IMPLIED
>
<!-- **** 属性引用 ***** -->
<!ELEMENT attribute (description)* >
<!ATTLIST attribute
type IDREF #REQUIRED
default CDATA #IMPLIED
required (yes | no) "no"
>
<!-- **** 属性定义 ***** -->
<!ELEMENT AttributeType (datatype | description)* >
<!ATTLIST AttributeType
name ID #REQUIRED
default CDATA #IMPLIED
dt:type %datatypes; #IMPLIED
dt:values CDATA #IMPLIED
required (yes | no) #IMPLIED
xmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
>
<!-- **** 元素定义 ***** -->
<!ELEMENT ElementType (datatype | description | AttributeType | attribute | element | group)* >
<!ATTLIST ElementType
name ID #REQUIRED
model (open | closed) #IMPLIED
content (empty | textOnly | eltOnly | mixed) #IMPLIED
order (one | seq | many) #IMPLIED
dt:type %datatypes; #IMPLIED
dt:values CDATA #IMPLIED
required (yes | no) #IMPLIED
xmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
>
<!-- **** 分组 ***** -->
<!ELEMENT group (group | element | description)*>
<!ATTLIST group
minOccurs CDATA #IMPLIED
maxOccurs CDATA #IMPLIED
order (one | seq | many) #IMPLIED
>
<!-- **** Schema ***** -->
<!ELEMENT Schema (AttributeType | ElementType | description )* >
<!ATTLIST Schema
name CDATA #IMPLIED
xmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
>
这里所讲的Schema的实现语法都是按照微软Internet Explorer 5.0所提供的支持。这个语法主要综合了W3C的两个Note:规范XML-Data (http://www.w3.org/TR/1998/NOTE-XML-data-0105/ )和文档内容描述DCD (http://www.w3.org/TR/NOTE-dcd ),并加入一些扩展
Schema 文件的结构
在说到元素的定义方法之前,我们先来讲一下Schema文件的结构。其实,Schema文件和其它XML文件的样子非常相似,它是由一组元素构成的,其根元素是“Schema”。“Schema”元素是XML Schema中第一个出现的元素,用于表明该XML文档是一个Schema文档,相应的,“Schema”的结束标记一般在文档的末尾。这样,一个Schema的结构如下:
<Schema name="schema-name" xmlns="namespace" > ... </Schema> |
Schema具有两个属性:name指定该Schema的名称,而xmlns则指定该Schema包含的命名空间。注意,一个XML Schema文档中可以包含多个命名空间,比如下面的语句指定了三个命名空间:
<Schema name="mySchema" xmlns="urn:schemas-microsoft-com:xml-data" xmlns:dt="urn:schemas-microsoft-com:datatypes" xmlns:myNS=http://www.xml_step_by_step.edu\ns.xml > |
第一个是xmlns="urn:schemas-microsoft-com:xml-data",它指定本文档是一个XML Schema文档;第二个是xmlns:dt="urn:schemas-microsoft-com:datatypes",它定义了在本文档中可以使用的数据类型;第三个是xmlns:myNS="http://www.xml_step_by_step.edu\ns.xml",它表明下面可能会用到在myNS中定义的元素或属性。
用Schema定义元素及其内容
在讲述Schema中和ETD定义相对应的种种定义方法之前,我们先来看看所涉及的三个Schema元素:ElementType、element、group。
在Schema文档中使用ElementType来声明XML文件中会出现的元素,ElementType的语法表达如下:
<ElementType name="元素名" content="{ empty | textOnly | eltOnly | mixed }" dt:type="元素类型" order="{ one | seq | many }" model="{ open | closed }" > |
在ElementType的几个属性中,name的含义不言而喻,是所声明元素的名称,它是不可缺少的。content是ElementType的一个重要属性,它指明ElementType所声明的元素是否为空、是否包含文本、是否包含子元素、还是既包含文本又包含子元素。dt:type指定该元素的数据类型,我们会在后面的小节中详细讨论。order指定该元素的子元素的排列顺序规则。最后,model指定该元素是否可以包含未在本Schema中定义的元素和属性,它主要用于其它Schema的引入,也就是其它“命名空间”的引入。“命名空间”的概念大家可能还比较生疏,这是我们下一节要讲的内容,现在你只要了解,在一个XML文件中能够同时使用几个不同的DTD或Schema定义。下表列出了model可能的取值。
取 值 | 释 意 |
open | 表明该元素可以包含其它未在XML Schema中定义的元素和属性 |
closed | 表明该元素只能包含在本XML Schema中定义过的元素和属性 |
缺省状态下,XML Schema的model取值"open",也就是说,该元素可以包含其它未在XML Schema中定义的元素和属性。但是,这并不意味着任何元素和属性都可在Schema中出现,允许出现的前提是这些"异类"元素和属性必须在单独的XML Schema中加以定义,并且必须在引用的它们的元素中以命名空间形式指定其出处。下面给出一个具体的示例。
<联系人> <姓名>张三</姓名> <ID>001</ID> <公司>A公司</公司> <EMAIL>[email protected]</EMAIL> <电话>(010)62345678</电话> <传真 xmlns="fax.xml">(010)62345678</传真> <地址> <街道>五街1234号</街道> <城市>北京市</城市> <省份>北京</省份> <ZIP>100001</ZIP> </地址> </联系人> |
本来fclmlschema.xml中并没有定义"传真"元素,但如果将"联系人"元素的的"model"属性设为"open",就可以在"联系人"中引用它,当然还必须指定"传真"元素所在的Schema文件"fax.xml"。"open"体现了XML Schema的可扩展性,而这是DTD所无法比拟的。
ElementType只是起到声明元素的作用,至于元素的内容究竟是什么,则要靠它的子元素element来说明。element的语法表达如下:
<element type="元素类型" [minOccurs="{ 0 | 1 }"] [maxOccurs="{ 1 | * }"] > |
element实际上是对该Schema中ElementType声明的引用,而具体引用什么元素类型,就要靠type属性指定了。type属性不可缺少,并且为了保证type指定的是已经声明过的元素,要求它的取值必须同某个ElementType中的name属性严格一致。至于其它两个属性倒是可有可无。minOccurs指定该元素在其父元素中出现的最小次数,缺省值为1,表明该元素至少出现一次;也可以取值为0,表明该元素是可选的,可以不出现。maxOccurs则指定了该元素出现的最大次数,缺省值同样为1,表明该元素至多出现一次;也可取值为“*”,表明该元素在XML实例文档中出现次数不受限制。
DTD中有成组的概念,相应的,Schema中也有“group”元素。它的语法表达类似element元素:
<group order="{one | seq | many}" [minOccurs="{ 0 | 1 }"] [maxOccurs="{ 1 | * }"] > |
和DTD的规定相同,组里的内容可以是元素,也可以是另一个子组。属性order指定该组中的元素或子组的顺序,minOccurs和maxOccurs分别指定了该组在其父元素中出现的最小次数和最大次数。
下面,我们就开始对DTD和Schema对相同内容的不同定义方式进行一次大比较!
空元素 | <!ELEMENT a EMPTY> | <ElementType name="a" content="empty"/> | <a/> | <a></a> | |
字符串 | <!ELEMENT a (#PCDATA)> | <ElementType name="a" content="textOnly"/> | <a> abcdefg </a> |
||
父 元 素 |
一个子元素 | <!ELEMENT a (b)> | <ElementType name="a" content="eltOnly"> <element type="b"/></ElementType> |
<a> <b/> </a> |
|
有顺序的 子元素 |
<!ELEMENT a (b, c)> | <ElementType name="a" order="seq"> <element type="b"/> <element type="c"/></ElementType> |
<a> <b/> <c/> </a> |
||
OR或 | <!ELEMENT a (b | c)> | <ElementType name="a" order="one"> <element type="b"/> <element type="c"/></ElementType> |
<a> <b/> </a> |
<a> <c/> </a> |
|
任意顺序(或不出现)的子元素 | <!ELEMENT a (b | c)*> | <ElementType name="a" order="many"> <element type="b"/> <element type="c"/></ElementType> |
<a/> | ||
<a> <b/> </a> |
<a> <c/> </a> |
||||
<a> <b/> <c/> </a> |
<a> <c/> <b/> </a> |
||||
可选子元素 | <!ELEMENT a (b?)> | <ElementType name="a" content="eltOnly"> <element type="b" minOccurs="0" maxOccurs="1"/></ElementType> |
<a/> | <a> <b/> </a> |
|
"+"型重复元素 | <!ELEMENT a (b+)> | <ElementType name="a" content="eltOnly"> <element type="b" minOccurs="1" maxOccurs="*"/></ElementType> |
<a> <b/> </a> |
<a> <b/> <b/> </a> |
|
"*"型重复元素 | <!ELEMENT a (b*)> | <ElementType name="a" content="eltOnly"> <element type="b" minOccurs="0" maxOccurs="*"/></ElementType> |
<a/> | <a> <b/> </a> |
<a> <b/> <b/> </a> |
成组元素 | <!ELEMENT a (b,c)+> | <ElementType name="a" content="eltOnly"> <group order="seq" minOccurs="1" maxOccurs="*"/> <element type="b"/> <element type="c"/> </group> </ElementType> |
<a> <b/> <c/> </a> |
<a> <b/> <c/> <b/> <c/> </a> |
|
混合元素 | <!ELEMENT a (#PCDATA | b | c)*> | <ElementType name="a" content="mixed"/> <element type="b"/> <element type="c"/></ElementType> |
<a> abcdefg </a> |
<a> abcdefg <b/> </a> |
|
<a> <b/> abcdefg <c/> </a> |
<a> abcd <c/> efg </a> |
用Schema定义元素属性
Schema中用来定义属性的元素有两个,AttributeType元素是声明属性的,attribute元素则是说明一个元素中究竟包含那些属性。
AttributeType元素也是Schema中的重要元素之一,用于定义该Schema文档中出现的属性类型。AttributeType的语法表达如下:
<AttributeType name="属性名" dt:type="属性类型" dt:values="枚举值列表" default="缺省值" required="{yes | no}" > |
下面我们来一个一个看看对于这些属性的规定:
string | #PCDATA |
enumeration | ENUMERATED |
id | ID |
idref | IDREF |
idrefs | IDREFS |
nmtoken | NMTOKEN |
nmtokens | NMTOKENS |
entity | ENTITY |
entities | EMTITIES |
notation | NOTATION |
注意,当dt:type取值为"enumeration"时,后面的dt:value必须列出所有可能的取值。
我想大家一定还记得前面讲DTD时曾根据关于属性缺省值的规定将属性分为四类,在Schema中,是通过default属性和required属性来作这些规定的。看了下面这个列表就一目了然了。
必须赋值的属性 | <!ATTLIST 天气 状况 (晴 | 阴 | 雨 | 雪) #REQUIRED> | <AttributeType name="状况" dt:type="enumeration" dt:value="晴 阴 雨 雪" required="yes" /> |
<天气 状况="晴"/> |
属性值可有可无的属性 | <!ATTLIST 天气 状况 (晴 | 阴 | 雨 | 雪) #IMPLIED> | <AttributeType name="状况" dt:type="enumeration" dt:value="晴 阴 雨 雪" required="no" /> |
<天气 状况="晴"/> |
<天气/> | |||
定义缺省值的属性 | <!ATTLIST 天气 状况 (晴 | 阴 | 雨 | 雪) "晴"> | <AttributeType name="状况" dt:type="enumeration" dt:value="晴 阴 雨 雪" default="晴" required="yes" /> |
<天气 状况="阴"/> |
<天气/> | |||
固定取值的属性 | <!ATTLIST 天气 状况 (晴 | 阴 | 雨 | 雪) #FIXED> | <AttributeType name="状况" dt:type="enumeration" dt:value="晴 阴 雨 雪" default="晴" required="no" /> |
<天气/> |
AttributeType和attribute的关系与ElementType和element的关系相同,AttributeType只是起到声明属性的作用,而真正指明一个元素具有哪些属性还需依靠attribute元素。attribute的语法表达如下:
<attribute type="attribute-type" default="default-value" [required="{yes | no}"] > |
因为attribute实际上是对该Schema中AttributeType声明的引用,而具体引用什么属性类型,关键就要靠type属性了。type唯一指定了要引用的属性类型,因此其取值必须同某个AttributeType元素中name属性的取值严格一致。其它两个属性与AttributeType中相应属性的含义相同,default指定该属性类型的缺省取值,required指定该属性对于引用它的元素是否是必须的。如果和同一个属性相对应的AttributeType和attribute中都对default和required给出了定义,则在attribute中的取值具有更高的优先级。
最后,我们给出关于上面“天气”元素及其属性的一个完整的Schema定义:
<AttributeType name="状况" dt:type="enumeration" dt:value="晴 阴 雨 雪" required="yes" /> <ElementType name="天气" content="empty"> |
Schema的特色——扩展数据类型
Schema中共有23种扩展数据类型,包括bin.base64、bin.hex、boolean、char、date、dateTime、dateTime.tz、fixed.14.4、float、int、number、time、time.tz、i1、i2、i4、r4、r8、ui1、ui2、ui4、uri、uuid,已经可以覆盖相当广泛的应用。限于篇幅,这里只列表介绍几种最常用的类型。
类 型
解 释
举 例
boolean | 布尔型:0 或 1, 其中0代表false,1代表true | 0,1 |
char | 单字符 | “a”、“b” |
time | 时间类型,符合 ISO 8601格式, 无日期和时区部分。 | 08:16:18 |
date | 日期类型,符合ISO 8601格式且无时间部分. | 2000-06-01 |
dateTime | 日期类型,符合ISO 8601格式,带可选时间部分但无时区部分,秒可精确到纳秒级。 | 2000-06-01T20:08:18 |
fixed.14.4 | 数值类型,同“number”类似,但精度上小数点前不超过14位,小数点后不超过4位 | 14.1234 |
float | 实数类型,位数不受限制,可以包含符号位和小数位以及指数。取值范围从 1.7976931348623157E+308 至 2.2250738585072014E-308 | .314159265358979E+1 |
int | 数值类型, 可以包含符号位,但不含小数位和指数位 | 1, -10, 2566 |
number | 数值类型,位数不限,可以包含符号位和小数位以及指数。取值范围从 1.7976931348623157E+308 至 2.2250738585072014E-308 | 12, 3.1415, -1.24E-10 |
uri | 统一资源标识(URI)类型。 | http://www.ics. uci.edu /pub/ietf/uri/ |
元素和属性的数据类型可以使用元素datatype来定义,这个元素是Schema中一个重要元素,也是Schema的一大特色。datatype的语法表达如下:
<datatype dt:type="datatype"> |
除此以外,还有另一种更直接的方法,是在元素ElementType和AttributeType之中利用dt:type属性。下面分别给出具体的示例:
ElementType | <ElementType name="a"> <datatype dt:type=" float"> </ElementType> |
<ElementType name="a" dt:type="float"/> |
AttributeType | <AttributeType name ="b"/> <datatype dt:type="float"/></AttributeType> <ElementType name="a"> <attribute type="b"/> </ElementType> |
<AttributeType name="b" dt:type="float"/> <ElementType name="a"> <attribute type="b"/> </ElementType> |
好了,现在我们结束这些枯燥的语法论述,来看个实际的例子:
<AttributeType name="更新时间"> <datatype dt:type="dateTime"/> </AttributeType> <ElementType name="description"/> <ElementType name="笔记本电脑" content="eltOnly"> |
上面给出的是一个关于笔记本电脑的Schema定义,在这里,我们为笔记本电脑定义了一个属性--资料更新时间,数据类型定为dateTime;笔记本电脑涉及的元素有:品牌,因为它实际上是一个名称,所以定为string类型;价格,因为考虑到经销商不会小气到连几毛钱都不放过,所以数据类型定为int型;是否全内置,不言而喻自然是铁板钉钉的布尔型了;库存数量,因为考虑到经销上可能会大量囤积以谋取高利,故而选取范围较大的number类型。下面我们再给出一个XML示例文档,以便大家对数据类型有一个更加直观的认识。
<笔记本电脑 更新时间="2000-06-10T14:00:00"> <品牌>ACER 518TE</品牌> <价格>22800</价格> <是否全内置>1</是否全内置> <库存数量>258000</库存数量> </笔记本电脑> |
可是,假设我们偏偏遇上了一个爱专牛角尖且极为小气的电脑经销商,他擅自将上面的实例文档加以改动挂在自己门口,于是就有下面的文档:
<笔记本电脑 更新时间="2000-06-10T14:00:00"> <品牌>ACER 518TE</品牌> <价格>22800.21</价格> <是否全内置>1</是否全内置> <库存数量>258000</库存数量> </笔记本电脑> |
就在他自鸣得意于自己的精明时,我们的语法分析器却报警了:“价格”取值与定义不符!当然了,明明是int类型,又岂能再加上一个小数点?除非我们将上面的Schema中的“价格”定义作下列修改:
<ElementType name="价格" dt:type="fixed.14.4"/> |
---------------------- android培训、java培训、期待与您交流!----------------------