乱码解决参考方案


“字符与编码”是一个被经常讨论的话题。即使这样,时常出现的乱码仍然困扰着大家
不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312 编码。

我们经常所使用的页面默认编码一般是GB2312,当然这可以修改。当我们在传递数据时如果存在字符编码的转换,当转换出现错误时就会出现乱码。

GB2312、GBK等这些编码 用2个字节代表一个中文字符,而utf-8则是由3个字节存储一个字符。这也这是单个字符的时候容易出现乱码的原因,例如 “中国人”如果是utf-8的编码,它占9个字节,但如果转换成其他编码由于9是单数不能转换所以会出现乱码

一般情况下从jsp 到action 最好是不要传中文参数。但特殊需要的话有以下参考解决方案:
如果是普通请求:
1、 最好的方法是配置一个过滤器来设置request,response的编码方式,这是最方便而且一劳永逸的方法。但要确保你的提交方式是post
2、 如果是get请求,那最好的方案就是先获得字符参数的字节数组,然后再转换成正确的编码,new String(str.getBytes(“iso8859-1”),”GBK”)
如果是Ajax请求:
1、 首先就要用URLEcoder对字符串来进行加码,然后在action取参数的时候用URLDecoer进行解码。值得注意的是加码解码的编码方式要一致,不然会出现乱码
2、 如果页面是utf-8的编码,通过Ajax请求传递参数时上中方式还是不能解决问题,当他遇到特殊字符或是单数中文,半角时,还是会出现乱码。这时的解决方案是,首先还是要用URLEcoder对字符加码,然后在action取参数时先获得它的字节数组然后转换成相应的编码方式,new String(str.getBytes(“iso-8859-1”),”utf-8”)

你可能感兴趣的:(jsp,Ajax)