XML 特殊字符处理

在XML中,有一些符号作为XML 的标记符号,一些特定情况下,属性值必须带有这些特殊符号。 下面主要是讲解一些常用的特殊符号的处理

例一: 双引号的使用。

双引号作为XML 属性值的开始结束符号,因此无法在值中直接使用"". 处理方式可以分为两种。

a: 属性值中没有'(单引号) ,那么可以用单引号'' 作为属性值的开始结束符号

<add key="IPhone" value="apple"/>  ...属性值为 ("apple").

解决:  <add key="IPhone" value=’"apple"‘/>

b: 属性值中有'(单引号) ,也有双引号。 如...属性值为 ("'apple").

<add key="IPhone" value="&quot;&apos;apple&quot;"/> 

下表为 XML 标记使用的字符列出了五种内置实体。

实体 实体引用
含义
&lt;
&lt;
<(小于号)
&gt;
&gt;
>(大于号)
&amp;
&amp;
&(和)
&apos;
&apos;
'(单引号)
&quot;
&quot;
"(双引号)

如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。&apos; 和 &quot; 实体引用最常用在属性值中。

 

在做WebServices时为了实现复杂数据的传输,我们经常会采用XML格式的字符串来传送,这主要是由于XML具有存取数据,跨平台及跨语言等好处。请看下面例子:


  public String getAllNewSpace() { 

  StringBuffer toClient = new StringBuffer("<root>"); 

  if (null != dataset) {

  while (dataset.next()) {

  toClient.append("<User>"); 

  toClient.append("<UserName>"); //<![CDATA[

  toClient.append(dataset.getString(1)); 

  toClient.append("</UserName>"); //]]

  toClient.append("<UserId>"); 

  toClient.append(dataset.getString(2)); 

  toClient.append("</UserId>"); 

  toClient.append("</User>"); 

  }

  }

  toClient.append("</root>"); 

  return toClient.toString(); 

  }


  如果<UserName>节点中含有“&”,“<”,“>”等字符时,解释此XML时会出错。


  可以有两种解决方法:


  一、 通过Xml Document对象得到XML字符串返回给客户端,不能直接把XmlDocument返回给客户端,因为Java中的Xml Document对象,别的语言是无法正确解释的,我们只能返回XML 字符串:


public String getAllNewSpace() { 

  Document document = DocumentHelper.createDocument(); 

  Element root=document.addElement("root"); 

  if (null != dataset) {

  while (dataset.next()) {

  Element user=root.addElement("User"); 

  Element userName=user.addElement("UserName"); 

  userName.setText(dataset.getString(1)); 

  Element userId=user.addElement("UserId"); 

  userId.setText (dataset.getString(2)); 

  }

  }

  return document.asXML(); 

  }


  二、 给XML 字符串添加DTD验证:在节点值部份添加“<![CDATA[ ]]”


  public String getAllNewSpace() { 

  StringBuffer toClient = new StringBuffer("<root>"); 

  if (null != dataset) {

  while (dataset.next()) {

  toClient.append("<User>"); 

  toClient.append("<UserName><![CDATA["); 

  toClient.append(dataset.getString(1)); 

  toClient.append("]]</UserName>"); 

  toClient.append("<UserId>"); 

  toClient.append(dataset.getString(2)); 

  toClient.append("</UserId>"); 

  toClient.append("</User>"); 

  }

  }

  toClient.append("</root>"); 

  return toClient.toString(); 

  }

写ajax时最容易输出xml的就是拼凑字符串拉

如何处理特殊字符串是个问题

参见以下两种方法

http://webdev.csdn.net/page/96ba432b-af4a-412c-9684-2935c617faeb

对如我而言,我需要在html页面上显示的,我只需要把特殊字符串转为实体字符

实体 实体引用
含义
&lt;
<
小于号
&gt;
>
大于号
&amp;
&

&apos;
'
单引号
&quot;
"
双引号

很显然 struts标签 bean:write 的属性 filter="true" 也是实现此功能

打开源代码,轻松找到这个方法 org.apache.struts.util。ResponseUtils.filter(String value)

具体实现如下:

public static String filter(String value)

    {

        if(value == null)

            return null;

        char content[] = new char[value.length()];

        value.getChars(0, value.length(), content, 0);

        StringBuffer result = new StringBuffer(content.length + 50);

        for(int i = 0; i < content.length; i++)

            switch(content[i])

            {

            case 60: // '<'

                result.append("&lt;");

                break;

            case 62: // '>'

                result.append("&gt;");

                break;

            case 38: // '&'

                result.append("&amp;");

                break;

            case 34: // '"'

                result.append("&quot;");

                break;

            case 39: // '\''

                result.append("&#39;");

                break;

            default:

                result.append(content[i]);

                break;

            }

        return result.toString();

    }

当然有时候写javascript还需要平凑html,然后用一句 obj.innerHTML=展示你的页面

这时候也需要处理特殊字符。

我也仿照bean:write标签写很土的一个js版本的filter方法吧

function  filter(v)

    {

        if(v == null||v=="")

            return "";

      var result="";

        for(var i = 0; i < v.length; i++)

            switch(v.charAt(i))

            {

            case "<": result+="&lt;";break;

            case ">": result+="&gt;"; break;

            case "&":result+="&amp;";break;

            case "\"": result+="&quot;";break;

            case "'": result+="&#39;";break;

            default:result+=v.charAt(i);break;

            }

        return result;

}

如果用到prototype框架里面也有个方法

escapeHTML: function() {

    return this.replace(/&/g,'&amp;').replace(/</g,'&lt;').replace(/>/g,'&gt;');

  }

转换回来的对应方法为unescapeHTML

例如

var temp="<>/";

alert(temp.escapeHTML());





转载出处:http://blog.csdn.net/ldl22847/article/details/7029314

你可能感兴趣的:(xml,特殊字符处理)