XML
一.什么是XML
l Extensible Markup Language,翻译过来为可扩展标记语言。Xml技术是w3c组织发布的,目前推荐遵循的是W3C组织于2000发布的XML1.0规范。
二.XML技术用于解决什么问题?
l XML语言出现的根本目标在于描述在现实生活中经常出现的有关系的数据。
l 在XML语言中,它允许用户自定义标签。一个标签用于描述一段数据;一个标签可分为开始标签和结束标签,在开始标签和结束标签之间,又可以使用其它标签描述其它数据,以此来实现数据关系的描述。例如:
三.一个XML文件分为如下几部分内容:
1文档声明
1在编写XML文档时,需要先使用文档声明,声明XML文档的类型。
l 最简单的声明语法:
<?xml version="1.0" ?>
l 用encoding属性说明文档的字符编码:
<?xml version="1.0" encoding="GB2312" ?>
l 用standalone属性说明文档是否独立:
<?xml version="1.0" encoding="GB2312" standalone="yes" ?>
l 常见错误,见PPT下面的备注区
2元素
l XML元素指XML文件中出现的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写形式,例如:
• 包含标签体:<a>www.itcast.cn</a>
• 不含标签体的:<a/>
l 一个标签中也可以嵌套若干子标签。但所有标签必须合理的嵌套,绝对不允许交叉嵌套 ,例如:
<a>welcome to <b>www.it315.org</a></b>
l 格式良好的XML文档必须有且仅有一个根标签,其它标签都是这个根标签的子孙标签。
3属性
l 一个标签可以有多个属性,每个属性都有它自己的名称和取值,例如:
<input name=“text”>
l 属性值一定要用双引号(")或单引号(')引起来
l 定义属性必须遵循与标签相同的命名规范
l 多学一招:在XML技术中,标签属性所代表的信息,也可以被改成用子元素的形式来描述,例如:
<input>
<name>text</name>
</input>
4注释
l Xml文件中的注释采用:“<!--注释-->” 格式。
l 注意:
• XML声明之前不能有注释
• 注释不能嵌套,例如:
<!--大段注释
……
<!--局部注释-->
……
-->
5CDATA区 、特殊字符
l 在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理。
l 遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直接原封不动的输出。
l 语法:<![CDATA[ 内容 ]]>
<![CDATA[
<csdn>
<br/>
</csdn>
]]>
6处理指令(processing instruction)
l 处理指令,简称PI (processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。
l 例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析引擎,应用css文件显示xml文档内容。 <?xml-stylesheet type="text/css" href="1.css"?>
l 处理指令必须以“<?”作为开头,以“?>”作为结尾,XML声明语句就是最常见的一种处理指令。
四.XML约束
l 什么是XML约束
• 在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。
l 为什么需要XML约束
l 常用的约束技术
• XML DTD
• XML Schema
l DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架>
<书>
<书名>Java就业培训教程</书名>
<作者>redarmy</作者>
<售价>39.00元</售价>
</书>
...
</书架>
六.引用DTD约束
l XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
• 当引用的文件在本地时,采用如下方式:
<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>。在xml文件中手写一下。
• 当引用的文件是一个公共的文件时,采用如下方式:
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
例如:<!DOCTYPE web-app PUBLIC
"-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"
"http://java.sun.com/dtd/web-app_2_3.dtd">
七DTD约束语法细节
1元素定义
l 在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
<!ELEMENT 元素名称 元素类型>
l 元素类型可以是元素内容、或类型
• 如为元素内容:则需要使用()括起来,如
<!ELEMENT 书架 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
• 如为元素类型,则直接书写,DTD规范定义了如下几种类型:
• EMPTY:用于定义空元素,例如<br/> <hr/>
• ANY:表示元素内容为任意类型。
l 元素内容中可以使用如下方式,描述内容的组成关系
• 用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>
• 用|分隔,表示任选其一,即多个只能出现一个
<!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>
l 在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
+: 一次或多次 (书+)
?: 0次或一次 (书?)
*: 0次或多次 (书*)
l 也可使用圆括号( )批量设置,例
<!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>
2属性定义
l xml文档中的标签属性需通过ATTLIST为其设置属性
l 语法格式:
<!ATTLIST 元素名
属性名1 属性值类型 设置说明
属性名2 属性值类型 设置说明
……
>
l 属性声明举例:
<!ATTLIST 商品
类别 CDATA #REQUIRED
颜色 CDATA #IMPLIED
>
l 对应XML文件:
<商品 类别="服装" 颜色="黄色">…</商品>
<商品 类别="服装">…</商品>
l 设置说明:
• #REQUIRED:必须设置该属性
• #IMPLIED:可以设置也可以不设置
• #FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值
• 直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
3实体定义
l 实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。
l 在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。
l 实体可分为两种类型:引用实体和参数实体。