XML与DTD

一. DTD :

文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。

DTD声明方式,有点类似HTML


DTD的作用:

通过 DTD,每一个 XML 文件均可携带一个有关其自身格式的描述。
通过 DTD,独立的团体可一致地使用某个标准的 DTD 来交换数据。
而应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据。
我们还可以使用 DTD 来验证自身的数据。

二. XML 文档构建模块

所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:

  1. 元素
  2. 属性
  3. 实体
  4. PCDATA
  5. CDATA
    下面是每个构建模块的简要描述。

1. 元素

元素是 XML 以及 HTML 文档的主要构建模块。

HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message" 。元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。

实例:

body text in between
some message in between

2. 属性

属性可提供有关元素的额外信息。

属性总是被置于某元素的开始标签中。属性总是以名称/值的形式成对出现的。下面的 "img" 元素拥有关于源文件的额外信息:


3. 实体

实体是用来定义普通文本的变量。实体引用是对实体的引用。

大多数同学都了解这个 HTML 实体引用:" "。这个“无折行空格”实体在 HTML 中被用于在某个文档中插入一个额外的空格。

当文档被 XML 解析器解析时,实体就会被展开。

4. PCDATA

PCDATA 的意思是被解析的字符数据(parsed character data)。

可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。

PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。

文本中的标签会被当作标记来处理,而实体会被展开。

不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 实体来分别替换它们。

5. CDATA

CDATA 的意思是字符数据(character data)。

CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。

以我个人理解,即元素在DTD中解析都为PCDATA,而属性因为不会被解析成数据那就用CDATA来定义类型

三. DTD设定

DTD - 元素

声明一个元素
在 DTD 中,XML 元素通过元素声明来进行声明。元素声明使用下面的语法:


或者

DTD - 属性

在 DTD 中,属性通过 ATTLIST 声明来进行声明。
声明属性
属性声明使用下列语法:


DTD 实例:


XML 实例:


假如不希望强制作者包含属性,并且没有默认值选项的话,使用关键词 #IMPLIED。
假如没有默认值选项,但是仍然希望强制作者提交属性的话,使用关键词 #REQUIRED。
这两种写法是目前我接触到的

DTD - 实体

实体是用于定义引用普通文本或特殊字符的快捷方式的变量。

实体引用是对实体的引用。

实体可在内部或外部进行声明。

一个内部实体声明

语法:


例子



外部实体则是引用链接

下面写出斯坦福课后的一个练习作为例子

xml链接
写出可让上述xml生效的DTD

















你可能感兴趣的:(XML与DTD)