js编码处理

1.使用JS中的encodeURIComponent或encodeURI方法。

说明：

encodeURIComponent(String)

对传递参数进行设置。不编码字符有71个：!，'，(，)，*，-，.，_，~，0-9，a-z，A-Z。

例：

var url = “中国”;

encodeURI(String)

对URL整体转换。不编码字符有82个：!，#，$，&，'，(，)，*，+，，，-，.，/，:，;，=，?，@，_，~，0-9，a-z，A-Z。

例：

var url = “中国”;

乱码处理实例：

/////////////////////////////////////////////////////////////////////////////////////

初始页面内容如下(hello.jsp)：

/////////////////////////////////////////////////////////////////////////////////////

<%@ page language="java" import="java.util.*" pageEncoding="GB18030"%>

<%String path = request.getContextPath();%>

AJAX提交页面

function justdo(){

var post="name=王力猛[email protected]&bokee=http://wallimn.bokee.com";

post = encodeURI(post);

post = encodeURI(post);//两次，很关键var xmlObj = new ActiveXObject('Msxml2.XMLHTTP');

var URL = '<%= path%>/page/act.jsp';//文件名需要调整成测试时的相应位置?

xmlObj.open ('post'，URL，true);

xmlObj.setrequestheader("cache-control"，"no-cache");

xmlObj.setrequestheader("Content-Type"，"application/x-www-form-urlencoded");

xmlObj.send (post);//注意:POST方式，使用这个来发送内容?

}

/////////////////////////////////////////////////////////////////////////////////////

ajax请求处理页面（act.jsp）的内容如下:

/////////////////////////////////////////////////////////////////////////////////////

<%@ page language="java" import="java.util.*" pageEncoding="GB18030"%>

<%String path = request.getContextPath();%>

%@pageimport="java.net.URLDecoder"%>

ajax deal

//遍历输出参数内容。

for (Enumeration e = request.getParameterNames(); e.hasMoreElements();) {

String h = (String) e.nextElement();

String v = request.getParameter(h);

String mm = java.net.URLDecoder.decode(v

，"UTF-8");

System.out.println("请求参数: " + h + " = " + mm);

}

/////////////////////////////////////////////////////////////////////////////////////

说明：

java.net.URLencode和java.net.URLDecode分别对应于JavaScript中的encodeURI和decodeURI、encodeURIComponent和decodeURIComponent.

为什么要连续两次调用encodeURI(String)方法呢？是因为Java中的request.getParameter(String)方法会进行一次URI的解码过程，调用时内置的解码过程会导致乱码出现。而URI编码两次后，request.getParameter(String)函数得到的是原信息URI编码一次的内容。接着用java.net.URLDecoder.decode(String str,String codename)方法，将已经编码的URI转换成原文。

2.使用JS中的escape方法。

说明：

escape(String)

对0-255以外的unicode值进行编码时输出%u****格式，其它情况下escape，encodeURI，encodeURIComponent编码结果相同。

例：

var url = “中国”;

乱码处理实例：

/////////////////////////////////////////////////////////////////////////////////////

例子跟上面一样。只有这里不同。

(hello.jsp)

post = escape(post);

post = escape (post);//两次，很关键

(act.jsp)

String h = (String) e.nextElement();

String v = request.getParameter(h);

String mm =EscapeUnescape.unescape(v，"UTF-8");

System.out.println("请求参数: " + h + " = " + mm);

/////////////////////////////////////////////////////////////////////////////////////

(EscapeUnescape.java)Java中的escape和unescape.内容如下：

/////////////////////////////////////////////////////////////////////////////////////

package cn.kgnews.util;

public classEscapeUnescape{

public static String escape(String src) {

int i;

char j;

StringBuffer tmp = new StringBuffer();

tmp.ensureCapacity(src.length() * 6);

for (i = 0; i < src.length(); i++) {

j = src.charAt(i);

if (Character.isDigit(j) || Character.isLowerCase(j)

|| Character.isUpperCase(j))

tmp.append(j);

else if (j < 256) {

tmp.append("%");

if (j < 16)

tmp.append("0");

tmp.append(Integer.toString(j，16));

} else {

tmp.append("%u");

tmp.append(Integer.toString(j，16));

}

return tmp.toString();

}

public static String unescape(String src) {

StringBuffer tmp = new StringBuffer();

tmp.ensureCapacity(src.length());

int lastPos = 0，pos = 0;

char ch;

while (lastPos < src.length()) {

pos = src.indexOf("%"，lastPos);

if (pos == lastPos) {

if (src.charAt(pos + 1) == 'u') {

ch = (char) Integer.parseInt(src

.substring(pos + 2，pos + 6)，16);

tmp.append(ch);

lastPos = pos + 6;

} else {

ch = (char) Integer.parseInt(src

.substring(pos + 1，pos + 3)，16);

tmp.append(ch);

lastPos = pos + 3;

}

} else {

if (pos == -1) {

tmp.append(src.substring(lastPos));

lastPos = src.length();

} else {

tmp.append(src.substring(lastPos，pos));

lastPos = pos;

}

return tmp.toString();

}

/////////////////////////////////////////////////////////////////////////////////////

说明：

EscapeUnescape.java类是Java中的escape和unescape。

原理跟上例一样。

3.用JavaScript实现java中的URLencode跟URLdecode.

说明：

这种方法服务器端代码不必修改。直接request.getParameter()来获取就可以了。

JavaScript中的URLencode跟URLdecode实现如下：

/////////////////////////////////////////////////////////////////////////////////////

(UrlEncodeUrlDecode_gecko.js)非IE实现方法如下：

完整代码可到这里下载：

http://www.blueidea.com/user/qswh/qswhU2GB.js

/////////////////////////////////////////////////////////////////////////////////////

var qswhU2GB = […..]; //此数组为GB Unicode对照表

function UrlEncode(str){

var i，c，ret=""，strSpecial="!\"#$%&'()*+，/:;<=>?@[\]^`{|}~%";

for(i=0;i

if(str.charCodeAt(i)>=0x4e00){

c=qswhU2GB[str.charCodeAt(i)-0x4e00];

ret+="%"+c.slice(0，2)+"%"+c.slice(-2);

}

else{

c=str.charAt(i);

if(c==" ")

ret+="+";

else if(strSpecial.indexOf(c)!=-1)

ret+="%"+str.charCodeAt(i).toString(16);

else

ret+=c;

}

return ret;

}

function UrlDecode(str){

var i，c，d，t，p，ret = "";

function findPos(str){

for(var j = 0; j < qswhU2GB.length; j++){

if(qswhU2GB[j] == str){

return j;

}

return -1;

}

for(i = 0;i < str.length;){

c = str.charAt(i);i++;

if(c != "%"){

if(c == "+"){

ret += " ";

}else{

ret += c;

}

}else{

t = str.substring(i，i+2);i += 2;

if(("0x" + t) > 0xA0){

d = str.substring(i+1，i+3);i += 3;

p = findPos(t + d);

if(p != -1){

ret += String.fromCharCode(p + 0x4e00);

}

}else{

ret += String.fromCharCode("0x" + t);

}

return ret;

}

function getSpell(str，sp){

var i，c，t，ret="";

if(sp==null)sp="";

for(i=0;i

if(str.charCodeAt(i)>=0x4e00){

c=parseInt(qswhU2GB[str.charCodeAt(i)-0x4e00]，16);

if(c<55290){

for(t=qswhSpell.length-1;t>0;t=t-2)if(qswhSpell[t]<=c)break;

if(t>0)ret+=qswhSpell[t-1]+sp;

}

return ret.substr(0，ret.length-sp.length);

}

/////////////////////////////////////////////////////////////////////////////////////

(UrlEncodeUrlDecode_ie.js)IE实现方法如下：

/////////////////////////////////////////////////////////////////////////////////////

function UrlEncode(str) {

var ret = "";

var strSpecial = " ~!\"#$%&'()*+-，/:;<=>?[]^`{|}~%";

for (var i = 0; i < str.length; i++) {

var chr = str.charAt(i);

strstr = chr;

execScript("c = hex(asc(strstr))"，"VBScript");

if (parseInt("0x" + c) > 127) {

ret += "%" + c.slice(0，2) + "%" + c.slice(-2);

} else {

if (strSpecial.indexOf(chr) != -1) {

ret += "%" + c.toString(16);

} else {

ret += chr;

}

return ret;

}

function UrlDecode(str) {

var ret = "";

for (var i = 0; i < str.length; i++) {

var chr = str.charAt(i);

if (chr == "+") {

ret += " ";

} else {

if (chr == "%") {

var asc = str.substring(i + 1，i + 3);

if (parseInt("0x" + asc) > 127) {

temp = parseInt("0x" + asc + str.substring(i + 4，i + 6));

execScript("rt = chr(temp)"，"VBScript");

ret += rt;

i += 5;

} else {

temp = parseInt("0x" + asc);

execScript("ret = ret + chr(temp)"，"VBScript");

i += 2;

}

} else {

ret += chr;

}

return ret;

}

/////////////////////////////////////////////////////////////////////////////////////

(loadcssorjs.js)自动识别浏览器动态导入JS/CSS

实现方法如下：

/////////////////////////////////////////////////////////////////////////////////////

Created by CAnca.2007.9.4

function LoadScript(url) {

document.write("");

}

function LoadCss(url) {

document.write("");

}

var sSuffix = /msie/.test(navigator.userAgent.toLowerCase()) ? "ie" : "gecko";

LoadScript("js/UrlEncodeUrlDecode_" + sSuffix + ".js");

使用方法：

将三个JS文件放在同目录。在页面导入loadcssorjs.js。在要进行编码的地方使用UrlEncode方法即可。

例：

//index.html

var url = “http://cancait.blog.163.com/name=” +UrlEncode(“中国人”);

window.open(url);

…..

三种解决方案的比较：

第一种，在服务器端需要一次java.net.URLdecode(String)转码。使用起来，不太方便。

第二种，要建立Java版的escape跟uncape。在服务器端还是需要一次uncape转码。使用起来，不太方便。

第三种，是最方便的一种方法。只需要客户端进行编码。服务器端可以不做任何修改。唯一缺点的是：firefox浏览网页时，要加载一个150K的UrlEncodeUrlDecode_gecko.js文件。影响了浏览速度。（但本人还是推荐使用这方案。）

总结：

当然，Ajax实现不乱码，可以不用这三种方案，用这三种方案，只是迫不得已的做法。通常造成乱码的原因有以下几点：

1.xmlhttp返回的数据默认的字符编码是utf-8，如果前台页面是gb2312或者其它编码数据就会产生乱码。

2.post方法提交数据默认的字符编码是utf-8，如果后台是gb2312或其他编码数据就会产生乱码。

解决方法：

推荐方法：由于Javascript沿用java的字符处理方式，内部是使用unicode来处理所有字符的。前台后台都用utf-8编码，这样可以省不少麻烦，从根本上解决了乱码问题.优点是效率高，而且符合目前的形式，utf-8编码本身就是一种比较优秀的编码，没有语言限制.缺点只能调用自己的后台编码或者其他的utf-8的编码。

js编码处理

你可能感兴趣的:(js编码处理)