XML学习笔记1

1.什么是XML
XML 是 EXtensible Markup Language 的缩写。 XML 使用文档类型定义( DTD )或者模式( Schema )来描述数据 。XML 使用 DTD 或者 Schema 后就是自描述的语言。

2. XML 和HTML的主要区别
XML 是被设计用来描述数据的,重点是:什么是数据,如何存放数据。
HTML 是被设计用来显示数据的,重点是:显示数据以及如何显示数据更好上面。
他们在格式上也存在巨大区别,相对讲 xml 格式要求严格:
a. 所有的 XML 文档必须有一个结束标记,开始标签和结束标签必须配套,也就是必须写成 <p></p> 或者 <high></ high > 。
b. 空元素必须关闭,不允许出现单标签,但标签必须关闭,关闭使用 <p/> 或者 <high/> 。
c. 所有标签都区分大小写
d. 所有标签都必须合理嵌套。层次合理比如 <p><high></high></p> 这样就合理。
e. 所有标签的属性值必须使用双引号 (””) 或者单引号括起来
f.  xml 只能有一个根元素

3.xml 文档在逻辑上主要有以下 5 个部分组成

(1).xml 声明
xml 文档总是以一个 xml 声明开始,其中指明所用的 xml 版本、文档的编码、文档的独立性信息。格式为:
<?xml version=”1.0” encoding=”gb2312” standalone=”yes”?>
其中需要注意的是在问号左右两边不能有空格。还有其默认编码是 utf8
yes 表示文档是独立文档,即不依赖于外部文档。

(2).文档类型声明
我们可以用 DTD ( Document Type Definition 文档类型定义)来规范 xml 文档中元素和属性的规则及相互关系。
XML 从 SGML ( Standard Generalized Markup Language,SGML 标准通用标记语言)继承了用于定义语法规则的 DTD 机制。几乎所有的 xml 应用都是使用 DTD 来定义的。 DTD 文件也是一个文本文件,通常用 ”.dtd” 作为其扩展名。通过文档类型声明,指出 xml 文档所用的 DTD 。文档类型声明有两种形式,一种是声明 DTD 在一个外部文件中,例如:
<!DOCTYPE greeting SYSTEM “hello.dtd”>
另 1 种是直接在 xml 给出 dtd ,例如:
<!DOCTYPE greeting [
<!ELEMENT greeting  (#PCDATA)>

(3).XML 元素命名必须遵守下面的规则:
元素的名字可以包含子母,数字和其他字符。
元素的名字不能以数字或者标点符号开头。
元素的名字不能以 XML( 或者 xml , Xml,xMl...) 开头。
元素的名字不能包含空格。
尽量不用冒号,冒号在名称空间中用于分隔名称空间前缀和本地部分。
有 2 个细节:
1.  CDATA 段
CDATA 段中包含的都是纯字符数据,在字符数据可以出现的任何地方都可以使用 CDATA 段。 CDATA 段主要用于需要将整个文本解释为字符数据而不是标记的情况下。
CDATA 段以字符串 ”<![CDATA[  ” 开始, ”]]>” 结束。
2.  字符引用和预定义实体引用
xml 有 5 个特殊字符,小于 < 、大于 > 、双引号 ” 、单引号 ’ 、和号 & 。在数据中需要使用这几个字符时候可以用通用字符引用和预定义引用:
请参考:表 1-1 特殊字符的字符引用和预定义实体引用
字符 字符引用 10 进制    字符引用 16 进制      预定义实体引用
<    &#60;                  &#x3c;      &lt;
>    &#62;                  &#x3e;      &gt;
“   &#34;                  &#x22;      &quot;
‘   &#39;                          &#x27;        &apos;
&   &#38;                  &#x26;      &amp;

(4).在 XML 中注释的语法基本上和 HTML 中的一样。 <!-- 这是一个注释 --> 。注释不要出现在标记中。

(5).处理指令
处理指令允许文档中包含由应用程序来处理的指令。处理指令的语法和 xml 声明类似,以 < ?开始,以 ?> 结束。一个常见的样式表单的处理指令如下所示:
<?xml–stylesheet href=”hello.css” type=”text/css”?>


你可能感兴趣的:(学习笔记)