XML中的转义字符和CDATA部件

转自:http://www.cnblogs.com/qiantuwuliang/archive/2010/03/29/1699361.html


【yasi】CDATA 即 character data

解析数据

XML 解析器通常情况下会处理XML文档中的所有文本。

当XML元素被解析的时候,XML元素内部的文本也会被解析:

 

< message > This text is also parsed </ message >

 

 

XML解析器这样做的原因是XML元素内部可能还包含了别的元素,象下面的例子,name元素内部包含了first和last两个元素:

 

< name >< first > Bill </ first >< last > Gates </ last ></ name >

 

 

解析器会认为上面的代码是这样的:

< name >
  
< first > Bill </ first >
  
< last > Gates </ last >
</ name >

 


转义字符

不合法的XML字符必须被替换为相应的实体。

如果在XML文档中使用类似"<" 的字符, 那么解析器将会出现错误,因为解析器会认为这是一个新元素的开始。所以不应该象下面那样书写代码:

 

< message > if salary  <  1000  then</message >

 

 

为了避免出现这种情况,必须将字符"<" 转换成实体,象下面:

< message > if salary  &lt;  1000 then </ message >

 

 

下面是五个在XML文档中预定义好的实体:

&lt; < 小于号
&gt; > 大于号
&amp; &
&apos; ' 单引号
&quot; " 双引号

实体必须以符号"&"开头,以符号";"结尾。

注意: 只有"<" 字符和"&"字符对于XML来说是严格禁止使用的。剩下的都是合法的,为了减少出错,使用实体是一个好习惯。

CDATA部件

在CDATA内部的所有内容都会被解析器忽略

如果文本包含了很多的"<"字符和"&"字符——就象程序代码一样,那么最好把他们都放到CDATA部件中。

一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束:

复制代码
< script >
<! [CDATA[
function  matchwo(a,b)
{
if  (a  <  b  &&  a  <   0 ) then
{
return   1
}
else
{
return   0
}
}
]]
>
< / script>
复制代码

 

在前面的例子中,所有在CDATA部件之间的文本都会被解析器忽略。

CDATA注意事项:

1.CDATA部件之间不能再包含CDATA部件(不能嵌套)。如果CDATA部件包含了字符"]]>" 或者"<![CDATA[" ,将很有可能出错哦。

2.同样要注意在字符串"]]>"之间没有空格或者换行符。


<![CDATA[ ]]>是什么意思???
=================================================

标明是纯文本的,没有这个的话 <  >  & 字符是不能直接存入XML的,需要转义,而用这个标记则不需要转义而将这些符号存入XML文档。
可以避免未预料的特殊符号导致XML解析出错。


c#涉及到关于XML的CDATA和验证有效性的问题
我刚开始学习XML的东西,这里面我遇到一个叫做CDATA的段。这里面的解释是在CDATA里面的所有东西都会被解析器忽略我不清楚这是什么意思。用简单的话来说就是CDATA什么时候用,这里面的东西有什么用。如果用这个了,会产生什么样子的结果。 
还有就是XML有效性的验证。这个是什么意思,为什么要验证有效性呢,一般怎么验证呢,方法如何?我看书上说有DTD和XML Schema的两个方法,如何用,有什么区别呢? 
问题虽然多了点,但是就是两个主要的问题。希望知道的大侠帮帮小弟,用通俗简单一点的话告诉我。万分感谢。
==================================================

当你用FLASH和xml结合做网站应用程序时,例如让人自由输入姓名时,人们可以输入一些符号,例如∶"<"、">"、"/"、"?"等,当生成XML时,会破坏了XML结构,使数据中断。

这就要用XML CDATA

在XML文档中的所有文本都会被解析器解析。

只有在CDATA部件之内的文本会被解析器忽略。


<![CDATA[ ]]>是什么意思?~

从数据库里读取数据生成XML文件,加个“<![CDATA[    ]]>“是什么意思?
Response.Write "<body><![CDATA["
Response.Write rs("message")
Response.Write "]]></body>"
============================================

标明是纯文本的,没有这个的话 <  >  & 字符是不能直接存入XML的,需要转义,而用这个标记则不需要转义而将这些符号存入XML文档。

可以避免未预料的特殊符号导致XML解析出错。



PCDATA和CDATA的区别究竟是什么呢?
=============================================
PCDATA表示已解析的字符数据。
   CDATA是不通过解析器进行解析的文本,文本中的标签不被看作标记。
   CDATA表示里面是什么数据XML不会解析.比如可能是下面的一段
   <![CDATA[ 
       if(a>b){
          System.out.println(a);
     }

     ]]>

    注意上面的一个">"符号.


    PCDATA的数据是要给XML解析器去解析的,那上面的>去解析肯定会出错了,所以要用实体定义.上面的数据如果用PCDATA表示如下:

      if(a&gt;b){
         System.out.println(a);
      }


    
     cdata是在XML文档里面使用的关键字,用来告诉浏览器,这部分内容不用解析,是给其他程序用的,比如JAVASCRIPT等等,#PCDATA是在 XML约束文档里使用的,如DTD类型的约束文档,在这里面表示元素的内容或属性的取值范围等等,是字符串形式的,


你可能感兴趣的:(XML中的转义字符和CDATA部件)