XML 学习笔记 5:PCDATA 和 CDATA

本文章内容转载自 W3school PCDATA 和 CDATA

文章目录

    • PCDATA
    • CDATA


PCDATA

PCDATA 指的是会被解析器解析的字符数据(Parsed Character Data)。

XML 解析器通常会解析 XML 文档中所有的文本。

当某个 XML 元素被解析时,其标签之间的文本也会被解析:

<message>此文本也会被解析message>

解析器之所以这么做是因为 XML 元素可以包含其他元素,如下例子中 元素包含另外两个元素(first 和 last):

<name><first>Billfirst><last>Gateslast>name>

而解析器会把它分解为像这样的子元素:

<name>
    <first>Billfirst>
    <last>Gateslast>
name>

CDATA

CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。

在 XML 元素中,“<” 和 “&” 是非法的。

"<" 会产生错误,因为解析器会把 "<" 解释为新元素的开始。

"&" 也会产生错误,因为解析器会把 "&" 解释为字符实体的开始。

某些文本,比如 JavaScript 代码,包含大量 “<” 或 “&” 字符。

为了避免错误,可以将 JavaScript 代码定义为 CDATA。

CDATA 部分由 " 开始,由 "]]>" 结束:

<script>

function matchwo(a,b)
{
    if (a < b && a < 0) then
    {
        return 1;
    }
    else
    {
        return 0;
    }
}
]]>
script>

在上面的例子中,解析器会忽略 CDATA 部分中的所有内容。

  • CDATA 部分不允许嵌套
  • CDATA 部分不能包含字符串 “]]>”
  • CDATA 部分结尾的 “]]>” 不能包含空格或换行

你可能感兴趣的:(xml,xml)