《语义网基础教程》学习笔记(一)

一、XML概述
1、有效(valid)的XML文档:遵守了XML文档的基本规则,并使用DTD或Schema定义了语义约束,而且也完全遵守了DTD或Schema所定义的语义约束的XML文档
2、XML声明部分的encoding属性值应该与保存该文档所使用的字符集相同。如果需要让XML支持中文,应该注意以下几点:
①保存文件时使用支持中文的字符集
②XML声明部分的encoding属性应该与保存该文件时所使用的字符集相同
3、XML元素里的多个属性之间是无序的,因此同一个元素不可包含多个同名的属性,XML元素的属性必须有属性值;
   XML的子元素则是有序的,因此同一个元素可以包含多个同名的子元素;子元素顺序不同,则XML文档所表达的意义也就不同了。
   这正如Java集合里的Set和List,Set代表无序元素,集合不可重复。List代表元素有序,集合元素可以重复的集合。
4、空元素:
  如<book></book>等价与<book />但与<book> </book>不同,注意空元素与元素内容为空的区别
  空元素可以接受多个属性如:<book name="Hadoop权威指南" price="12.8"></book>
5、W3C观点:元数据才应该存储为属性,而数据本身则应该存储为元素。应该尽量使用元素来描述数据,而仅仅使用属性来提供与数据无关的信息。
   在实际开发中如果使用XML交换数据,优先考虑使用子元素来存储数据。用子元素的缺点是XML文档会变得臃肿。
6、语义约束:
   使用XML交换数据的双方相互约定一套规则,XML创建者按这套规则保存信息,而XML接受者按这套规则读取信息。这套规则应该以一种独立的形式存在,然后交给XML创建者和使用者共同遵守。XML将其称为语义约束。
7、内部DTD例子
注:<!ELEMENT 计算机书 (书名,作者,价格,介绍)>这一行定义的子元素有严格的顺序要求,XML文档中要遵守

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<!-- 内部DTD,指定了文档的根元素:书籍列表-->
<!DOCTYPE 书籍列表[
<!ELEMENT 书籍列表 (计算机书)*>
<!ELEMENT 计算机书 (书名,作者,价格,介绍)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 价格 (#PCDATA)>
<!ELEMENT 介绍 (#PCDATA)>
]>

<书籍列表>
<计算机书>
<书名>hadoop权威指南</书名>
<作者>zpc</作者>
<价格>22</价格>
<介绍>该书介绍了Hadoop的技术</介绍>
</计算机书>
</书籍列表>
8、外部DTD
<!DOCTYPE 根元素名
SYSTEM "外部DTD的URI"
>
如:
<!DOCTYPE 书籍列表
SYSTEM "http://www.haodianying.org/dtd/book.dtd"
>

<!DOCTYPE 书籍列表
SYSTEM "book.dtd"
>
外部DTD例子:
book.dtd文件
<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT 书籍列表 (计算机书)*>
<!ELEMENT 计算机书 (书名,作者,价格,介绍)>
<!ELEMENT	书名 (#PCDATA)>
<!ELEMENT   作者 (#PCDATA)>
<!ELEMENT	价格 (#PCDATA)>
<!ELEMENT	介绍 (#PCDATA)>

outer.xml文件
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 书籍列表 SYSTEM "C:\Documents and Settings\zhou\桌面\book.dtd">
<书籍列表>
<计算机书>
<书名>hadoop权威指南</书名>
<作者>zpc</作者>
<价格>22</价格>
<介绍>该书介绍了Hadoop的技术</介绍>
</计算机书>
</书籍列表>

9、共用DTD,一般由某个权威机构定制,通过PUBLIC关键字引入,使用共用DTD时还需给共用DTD指定一个标识名。
   引用公用DTD的格式:
   <!DOCTYPE 根元素
     PUBLIC "DTD的标识名" "公用DTD的URI">
10、DTD必须定义XML文档中出现的所有元素。
11、每个<!ATTLIST...>定义一个属性
    属性的约束规则:#REQUIRED(必须的属性)、#IMPLIED(可有可无)、#FIXED(属性值是固定的)
12、实体是可以自定义的
   定义:<!ENTITY java "疯狂Java讲义">
   引用:&java;
   大多数时候定义实体都是为了减少字符输入

   定义参数实体(只比定义普通实体多了个%)
   <!ENTITY % 实体名 "实体值">
   引用:%实体名;
   注:参数实体一定要先定义后使用,而且参数实体只能在DTD中使用

   定义外部实体
   <!ENTITY 实体名 SYSTEM "实体所在文件的URI">
   注:保存外部实体值的外部文件必须满足:该文件是一个文本文件、该文件是满足XML要求的结构化文档
13、Schema概述及其优势
   XML Schema是DTD的替代者,它采用了标准的XML语法来定义XML文档语义约束,不仅可以定义XML文档的结构还可以定义XML文档的内容约束   
   <schema>元素是每一个XML Schema的根元素:
<?xml version="1.0"?>
<xs:schema>
...
...

</xs:schema>

<schema> 元素可包含属性。一个 schema 声明往往看上去类似这样:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.w3school.com.cn"
xmlns="http://www.w3school.com.cn"
elementFormDefault="qualified">
...
...
</xs:schema>
解释:
xmlns:xs="http://www.w3.org/2001/XMLSchema"
显示 schema 中用到的元素和数据类型来自命名空间 "http://www.w3.org/2001/XMLSchema"。同时它还规定了来自命名空间"http://www.w3.org/2001/XMLSchema" 的元素和数据类型应该使用前缀 xs:
targetNamespace="http://www.w3school.com.cn" 
显示被此 schema 定义的元素 (note, to, from, heading, body) 来自命名空间: "http://www.w3school.com.cn"。
xmlns="http://www.w3school.com.cn" 
指出默认的命名空间是 "http://www.w3school.com.cn"。
elementFormDefault="qualified" 
指出任何 XML 实例文档所使用的且在此 schema 中声明过的元素必须被命名空间限定。

14、一个学习xml的主页:http://bbs.xml.org.cn/dispbbs.asp?boardID=23&ID=7076
15、Schema的数据类型
    (1)字符串相关类型
    (2)数值类型
    (3)日期类型
    (4)boolean类型
    (5)anyURI类型
    (6)二进制数据

16、使用限制派生新类型
 
 例子1:
order1.xsd文件
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema"  >
	<xsd:element name="order">
		<xsd:complexType>
			<xsd:sequence>
				<xsd:element ref="orderItem" maxOccurs="10"/>
			</xsd:sequence>
		</xsd:complexType>
	</xsd:element>
	<xsd:element name="orderItem">
		<xsd:complexType>
			<xsd:sequence>
				<!--自定义的两个类型-->
				<xsd:element name="id" type="idType"/>
				<xsd:element name="quantity" type="quantityType"/>
			</xsd:sequence>
		</xsd:complexType>
	</xsd:element>
	<xsd:simpleType name="idType">
		<xsd:restriction base="xsd:string">
			<!--枚举类型-->
			<xsd:enumeration value="7-5058-3496-7"/>
			<xsd:enumeration value="7-5005-6450-3"/>
			<xsd:enumeration value="7-3020-6069-7"/>
		</xsd:restriction>
	</xsd:simpleType>
	<xsd:simpleType name="quantityType">
		<xsd:restriction base="xsd:integer">
			<xsd:minInclusive value="1"/>
			<xsd:maxInclusive value="10"/>
		</xsd:restriction>
	</xsd:simpleType>
</xsd:schema>


order1.xml文件
<?xml version="1.0" encoding="UTF-8"?>
<order xmlns:xi="http://www.w3.org/2001/XMLSchema-instance" xi:noNamespaceSchemaLocation="file:///C:/Documents%20and%20Settings/zhou/%e6%a1%8c%e9%9d%a2/order1.xsd">
	<orderItem>
		<id>7-5005-6450-3</id>
		<quantity>5</quantity>
	</orderItem>
</order>
注意:在XML Schema的根元素下定义的任何元素都可以作为XML文档的根元素使用,因此上面的order1.xml也可以写成下面的格式
<?xml version="1.0" encoding="UTF-8"?>
<orderItem xmlns:xi="http://www.w3.org/2001/XMLSchema-instance" xi:noNamespaceSchemaLocation="file:///C:/Documents%20and%20Settings/zhou/%e6%a1%8c%e9%9d%a2/order1.xsd">
<id>7-3020-6069-7</id>
<quantity>2</quantity>
</orderItem>


   例子2:
age.xsd文件
<?xml version="1.0" encoding="UTF-8"?>
<zpc:schema xmlns:zpc="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified" >
<!-- 定义新类型-->
<zpc:simpleType name="age_Type">
	<zpc:restriction base="zpc:int">
	    <!--最大值100、最小值0-->
		<zpc:maxInclusive value="100"/>
		<zpc:minInclusive value="0"/>
	</zpc:restriction>
</zpc:simpleType>
<!--定义age元素,它的类型是age_Type-->
<zpc:element name="age" type="age_Type"/>
</zpc:schema>


age.xml
<?xml version="1.0" encoding="UTF-8"?>
<age xmlns:niao="http://www.w3.org/2001/XMLSchema-instance" niao:noNamespaceSchemaLocation="file:///C:/Documents%20and%20Settings/zhou/%e6%a1%8c%e9%9d%a2/test2.xsd">
<!--上述schema限制了age的取值范围-->
33
</age>


例子3:
price.xsd
<?xml version="1.0" encoding="UTF-8"?>
<zpc:schema xmlns:zpc="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified">
	<zpc:simpleType name="price_Type">
		<zpc:restriction base="zpc:decimal">
			<zpc:maxInclusive value="100"/>
			<zpc:minInclusive value="0"/>
			<!-- 最多5位数,小数点最后最多2位-->
			<zpc:fractionDigits value="2"/>
			<zpc:totalDigits value="5"/>
		</zpc:restriction>
	</zpc:simpleType>
	<zpc:element name="price" type="price_Type"/>
</zpc:schema>


price.xml
<?xml version="1.0" encoding="UTF-8"?>
<price xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="file:///C:/Documents%20and%20Settings/zhou/%e6%a1%8c%e9%9d%a2/test3.xsd">
23.34
</price>


例子4:
这次我们给出一个更加复杂一些的文档:
address.xml
---------------
<customer>
  <name>Teiki</name>
  <address>
    <!-- address追加一个地址子元素 -->
    <prefecture>Zhejiang</prefecture>
    <city>Hangzhou</city>
    <street>Xilu Road, No.121, 7F</street>
  </address>
</customer>


为此,我们需要一个更加复杂一点的Schema文档:
address.xsd
-----------------
1: <?xml version="1.0"?>
2: <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:   <xsd:element name="customer">
5:     <xsd:complexType>
6:       <xsd:sequence>
7:         <xsd:element name="name" type="xsd:string"/>
8:         <!-- 追加子元素address-->
9:         <xsd:element name="address">
10:          <xsd:complexType>
11:            <xsd:sequence>
12:              <xsd:element name="prefecture" type="xsd:string"/>
13:              <xsd:element name="city" type="xsd:string" />
14:              <xsd:element name="street" type="xsd:string" />
15:            </xsd:sequence>
16:          </xsd:complexType>
17:        </xsd:element>
18:        <!-- end -->
19:      </xsd:sequence>
20:    </xsd:complexType>
21:  </xsd:element>
22:
23:</xsd:schema>


不过,我们还可以采用ref元素来重新编写这个Schema文档:
address2.xsd
----------------------
1: <?xml version="1.0"?>
2: <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:   <xsd:element name="customer">
5:     <xsd:complexType>
6:       <xsd:sequence>
7:         <xsd:element name="name" type="xsd:string"/>
8:         <xsd:element ref="address"/>
9:       </xsd:sequence>
10:    </xsd:complexType>
11:  </xsd:element>
12:
13:  <xsd:element name="address">
14:    <xsd:complexType>
15:      <xsd:sequence>
16:        <xsd:element name="prefecture" type="xsd:string"/>
17:        <xsd:element name="city" type="xsd:string" />
18:        <xsd:element name="street" type="xsd:string" />
19:      </xsd:sequence>
20:    </xsd:complexType>
21:  </xsd:element>
22:
23: </xsd:schema>
使用ref元素可以直接将其指向另一个模块,使文档更加具有可读性。


例子5:正则表达式约束
pattern.xsd
<?xml version="1.0" encoding="UTF-8"?>
<zpc:schema xmlns:zpc="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified"  >
<!--定义一种新的数据类型-->
<zpc:simpleType name="price_Type">
	<zpc:restriction base="zpc:decimal">
		<!--必须匹配1XX.X的格式-->
		<zpc:pattern value="1\d{2}\.\d"/>
	</zpc:restriction>
</zpc:simpleType>
<!--定义元素-->
<zpc:element name="price" type="price_Type"/>
</zpc:schema>


price.xml文件
<?xml version="1.0" encoding="UTF-8"?>
<price xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="file:///C:/Documents%20and%20Settings/zhou/%e6%a1%8c%e9%9d%a2/pattern.xsd">
122.3
</price>


例子6:使用<list.../>派生列表类型
list.xsd文件
<?xml version="1.0" encoding="UTF-8"?>
<zpc:schema xmlns:zpc="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified">
<zpc:simpleType name="age_list_Type">
	<zpc:list>
	<zpc:simpleType>
		<zpc:restriction base="zpc:int">
				<zpc:maxInclusive value="100"/>
				<zpc:minExclusive value="0"/>
		</zpc:restriction>
	</zpc:simpleType>
	</zpc:list>
</zpc:simpleType>
<zpc:element name="age_list" type="age_list_Type"/>
</zpc:schema>


list.xml文件
<?xml version="1.0" encoding="UTF-8"?>
<age_list xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="file:///C:/Documents%20and%20Settings/zhou/%e6%a1%8c%e9%9d%a2/list.xsd">
12
23
</age_list>
14、合并多个schema
included.xsd:
<?xml version="1.0" encoding="UTF-8"?>
<zpc:schema xmlns:zpc="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified" >
<zpc:simpleType name="age_Type">
	<zpc:restriction base="zpc:int">
	<zpc:maxExclusive value="100"/>
	<zpc:minExclusive value="0"/>
	</zpc:restriction>
</zpc:simpleType>
</zpc:schema>

include.xsd:
<?xml version="1.0" encoding="UTF-8"?>
<zpc:schema xmlns:zpc="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified" targetNamespace="http://www.zpc.org" xmlns="http://www.zpc.org">
<zpc:include schemaLocation="included.xsd"/>
<zpc:element name="age" type="age_Type"/>
</zpc:schema>

在XML文件中引用include.xsd
<?xml version="1.0" encoding="UTF-8"?>
<age xmlns="http://www.zpc.org" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.zpc.org file:///C:/Documents%20and%20Settings/zhou/%e6%a1%8c%e9%9d%a2/include.xsd">
23
</age>


15、可以使用redefine元素重定义被包含schema里的组件


16、使用include包含的schema要么没有目标命名空间,要么其目标命名空间与当前schema的目标命名空间相同
    使用import包含的schema要么没有目标命名空间,要么其目标命名空间与当前schema的目标命名空间不同
例子:
imported.xsd:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified"   targetNamespace="http://zpc.com" xmlns="http://zpc.com">
<xs:simpleType name="age_Type">
	<xs:restriction base="xs:int">
	<xs:maxExclusive value="100"/>
	<xs:minExclusive value="0"/>	
	</xs:restriction>
</xs:simpleType>
</xs:schema>


import.xsd:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified"   targetNamespace="http://www.zpc2.com" xmlns="http://www.zpc2.com" xmlns:zpc="http://zpc.com">
<!--导入名为imported.xsd的schema,被导入的schema的命名空间是http://zpc.com-->
<xs:import schemaLocation="imported.xsd" namespace="http://zpc.com"/>
<xs:element name="age" type="zpc:age_Type"/>
</xs:schema>

17、命名空间详解
例子1:
namespace.xsd
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.zpc.com/schema" xmlns="http://www.zpc.com/schema" elementFormDefault="qualified" attributeFormDefault="unqualified">
<!--定义一个book-list元素-->
<xs:element name="book-list">
<xs:complexType>
<xs:sequence>
<!--使用当前schema里的book元素,因为当前schema位于http://www.zpc.com/schema命名空间下,而且该命名空间没有指定对应限定短名,因此按如下格式使用book元素-->
<xs:element ref="book" minOccurs="1" maxOccurs="unbounded"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<!--定义一个item_Type复杂类型-->
<xs:complexType name="item_Type">
<xs:sequence>
<xs:element name="book-name" type="xs:token"/>
<xs:element name="price" type="xs:decimal"/>
</xs:sequence>
</xs:complexType>
<!--这里使用http://www.zpc.com/schema下的item_Type类型时无需指定命名空间前缀-->
<xs:element name="book" type="item_Type"/>
</xs:schema>


对应的合格的xml文件:
<?xml version="1.0" encoding="UTF-8"?>
<book-list xmlns="http://www.zpc.com/schema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.zpc.com/schema file:///C:/Documents%20and%20Settings/zhou/%e6%a1%8c%e9%9d%a2/namespace.xsd">
	<book>
		<book-name/>
		<price>1</price>
	</book>
	<book>
		<book-name></book-name>
		<price>3</price>
	</book>
</book-list>


例子2:增加了命名空间前缀
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.zpc.com/schema" xmlns:zpc="http://www.zpc.com/schema" elementFormDefault="qualified" attributeFormDefault="unqualified">
<!--定义一个book-list元素-->
<xs:element name="book-list">
<xs:complexType>
<xs:sequence>
<!--使用当前schema里的book元素,因为当前schema位于http://www.zpc.com/schema命名空间下,而且该命名空间指定了对应限定短名zpc,因此按如下格式使用book元素-->
<xs:element ref="zpc:book" minOccurs="1" maxOccurs="unbounded"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<!--定义一个item_Type复杂类型-->
<xs:complexType name="item_Type">
<xs:sequence>
<xs:element name="book-name" type="xs:token"/>
<xs:element name="price" type="xs:decimal"/>
</xs:sequence>
</xs:complexType>
<!--使用http://www.zpc.com/schema下的item_Type类型时必须指定命名空间前缀-->
<xs:element name="book" type="zpc:item_Type"/>
</xs:schema>


例子3:XML允许为任何元素指定xmlns:prefix属性
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.zpc.com/schema" xmlns:zpc="http://www.zpc.com/schema" elementFormDefault="qualified" attributeFormDefault="unqualified">
<!--定义一个book-list元素-->
<xs:element name="book-list">
<xs:complexType>
<xs:sequence xmlns:java="http://www.zpc.com/schema">
<!--使用当前schema里的book元素,因为当前schema位于http://www.zpc.com/schema命名空间下,而且该命名空间也对应限定短名java,因此这里的限定名可以使用两种-->
<xs:element ref="java:book" minOccurs="1" maxOccurs="unbounded"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<!--定义一个item_Type复杂类型-->
<xs:complexType name="item_Type">
<xs:sequence>
<xs:element name="book-name" type="xs:token"/>
<xs:element name="price" type="xs:decimal"/>
</xs:sequence>
</xs:complexType>
<!--限定名java只能作用在上面的位置,因为为某个元素指定了xmlns:prefix属性之后,该属性所引入的命名空间只对该元素及其子元素有效-->
<xs:element name="book" type="zpc:item_Type"/>
</xs:schema>
在模式文档中,我们很容易就能区分出不同名称空间中的元素和类型,带有xs前缀的元素和类型属于http://www.w3.org/2001/XMLSchema名称空间,而其他的元素和类型则属于目标名称空间。
★需要注意的是,只有模式文档中的全局元素和全局属性才属于目标名称空间。
上例中book-list、item_Type都是全局的,而book-name、price是局部元素。
如果要限定局部元素和属性,可以通过xs:schema元素的elementFormDefault和attibuteFormDefault属性来设置。
为了指定模式文档中局部声明的元素必须被限定,可以将xs:schema元素的elementFormDefault属性的值设为"qualified"。

18、当需要在Schema中对指定命名空间下的元素(或属性)添加一致性约束时,必须为其添加短语作为前缀,否则一致性约束会认为只是对未命名
    空间的元素(或属性)添加约束。
  
    由于属性总是属于某个元素的,XML文档用户很容易确定该属性所处的命名空间-总是处于其所属元素所处的命名空间,因此通常无需添加限定短名
    作为前缀,所以Schema中通常会指定attributeFormDefault="unqualified",表明在XML文档中使用局部属性时无需添加限定短名作为前缀。

你可能感兴趣的:(xml,语义网)