在XML中,有一些符号作为XML 的标记符号,一些特定情况下,属性值必须带有这些特殊符号。 下面主要是讲解一些常用的特殊符号的处理
例一: 双引号的使用。
双引号作为XML 属性值的开始结束符号,因此无法在值中直接使用"". 处理方式可以分为两种。
a: 属性值中没有'(单引号) ,那么可以用单引号'' 作为属性值的开始结束符号
解决:
b: 属性值中有'(单引号) ,也有双引号。 如...属性值为 ("'apple").
下表为 XML 标记使用的字符列出了五种内置实体。
实体 | 实体引用 |
含义 |
< |
< |
<(小于号) |
> |
> |
>(大于号) |
& |
& |
&(和) |
' |
' |
'(单引号) |
" |
" |
"(双引号) |
如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。' 和 " 实体引用最常用在属性值中。
在做WebServices时为了实现复杂数据的传输,我们经常会采用XML格式的字符串来传送,这主要是由于XML具有存取数据,跨平台及跨语言等好处。请看下面例子:
public String getAllNewSpace() {
StringBuffer toClient = new StringBuffer("<root>");
if (null != dataset) {
while (dataset.next()) {
toClient.append("<User>");
toClient.append("<UserName>"); //<![CDATA[
toClient.append(dataset.getString(1));
toClient.append("</UserName>"); //]]
toClient.append("<UserId>");
toClient.append(dataset.getString(2));
toClient.append("</UserId>");
toClient.append("</User>");
}
}
toClient.append("</root>");
return toClient.toString();
}
如果<UserName>节点中含有“&”,“<”,“>”等字符时,解释此XML时会出错。
可以有两种解决方法:
一、 通过Xml Document对象得到XML字符串返回给客户端,不能直接把XmlDocument返回给客户端,因为Java中的Xml Document对象,别的语言是无法正确解释的,我们只能返回XML 字符串:
public String getAllNewSpace() {
Document document = DocumentHelper.createDocument();
Element root=document.addElement("root");
if (null != dataset) {
while (dataset.next()) {
Element user=root.addElement("User");
Element userName=user.addElement("UserName");
userName.setText(dataset.getString(1));
Element userId=user.addElement("UserId");
userId.setText (dataset.getString(2));
}
}
return document.asXML();
}
二、 给XML 字符串添加DTD验证:在节点值部份添加“<![CDATA[ ]]”
public String getAllNewSpace() {
StringBuffer toClient = new StringBuffer("<root>");
if (null != dataset) {
while (dataset.next()) {
toClient.append("<User>");
toClient.append("<UserName><![CDATA[");
toClient.append(dataset.getString(1));
toClient.append("]]</UserName>");
toClient.append("<UserId>");
toClient.append(dataset.getString(2));
toClient.append("</UserId>");
toClient.append("</User>");
}
}
toClient.append("</root>");
return toClient.toString();
}
写ajax时最容易输出xml的就是拼凑字符串拉
如何处理特殊字符串是个问题
参见以下两种方法
http://webdev.csdn.net/page/96ba432b-af4a-412c-9684-2935c617faeb
对如我而言,我需要在html页面上显示的,我只需要把特殊字符串转为实体字符
实体 | 实体引用 |
含义 |
< |
< |
小于号 |
> |
> |
大于号 |
& |
& |
和 |
' |
' |
单引号 |
" |
" |
双引号 |
很显然 struts标签 bean:write 的属性 filter="true" 也是实现此功能
打开源代码,轻松找到这个方法 org.apache.struts.util。ResponseUtils.filter(String value)
具体实现如下:
public static String filter(String value)
{
if(value == null)
return null;
char content[] = new char[value.length()];
value.getChars(0, value.length(), content, 0);
StringBuffer result = new StringBuffer(content.length + 50);
for(int i = 0; i < content.length; i++)
switch(content[i])
{
case 60: // '<'
result.append("<");
break;
case 62: // '>'
result.append(">");
break;
case 38: // '&'
result.append("&");
break;
case 34: // '"'
result.append(""");
break;
case 39: // '\''
result.append("'");
break;
default:
result.append(content[i]);
break;
}
return result.toString();
}
当然有时候写javascript还需要平凑html,然后用一句 obj.innerHTML=展示你的页面
这时候也需要处理特殊字符。
我也仿照bean:write标签写很土的一个js版本的filter方法吧
function filter(v)
{
if(v == null||v=="")
return "";
var result="";
for(var i = 0; i < v.length; i++)
switch(v.charAt(i))
{
case "<": result+="<";break;
case ">": result+=">"; break;
case "&":result+="&";break;
case "\"": result+=""";break;
case "'": result+="'";break;
default:result+=v.charAt(i);break;
}
return result;
}
如果用到prototype框架里面也有个方法
escapeHTML: function() {
return this.replace(/&/g,'&').replace(//g,'>');
}
转换回来的对应方法为unescapeHTML
例如
var temp="<>/";
alert(temp.escapeHTML());
转载出处:http://blog.csdn.net/ldl22847/article/details/7029314