按 iso-8859-1进行解码 然后再按UTF-8进行编码 正常应用
String str=“编码”;str=new String(str.getBytes("iso-8859-1"), "UTF-8");
最近在学JSP,在学习处理get方式提交数据出现乱码问题的时候,对其中的一个解决方法new String(s.getBytes("iso-8859-1"),"utf-8");产生了疑问,就是为什么要使用s.getBytes("iso-8859-1")?
当时只这样想的:客户端向服务器发送一个请求,比如说是一个字符串"请求";之后服务器接收到这个请求,也就是这个字符串,可是这时由于某种原因出现了乱码!这时为了解决这个问题,使用new String(s.getBytes("iso-8859-1"),"utf-8");解决问题。看到这条语句,我感觉想不通啊,字符使用iso-8859-1编码取得字节序列,再由utf-8解码取得字符串,得到的还是乱码啊!怎么会取得正确的字符呢!!!想不通啊!
之后,通过查找资料,得到了一点想法,代码如下:
1 public class ThinkIng {
2 public static void main(String[] args) throws Exception {
3 System.out.println("\t------JSP模拟------");
4 System.out.println("客户端,有一个中文字符的请求(转换成了字节序列发送),发送至服务器端");
5 String request="请求";
6 byte[] client=request.getBytes();//客户端的请求的字节序列
7 print(client);
8 System.out.println();//分割用的
9 System.out.println("有一中间件,将发送的字符序列一默认的编码格式(iso-8859-1)进行解码");
10 String sever=new String(client,"iso-8859-1");
11 System.out.println(sever);
12 System.out.println("程序猿发现,这边有问题,中文有乱码,前来解决!");
13 String debug=new String(sever.getBytes("iso-8859-1"),"gbk");//还原字节序列,使用“gbk”重新进行解码!
14 System.out.println(debug);
15 System.out.println("问题解决!");
16 }
17 public static void print(byte[] b){//用于显示字节序列的
18 for(byte b1:b){
19 System.out.print(Integer.toHexString(b1 & 0xff)+" ");
20 }
21 }
22 }
先前没有想通主要是自己没注意到:
总的来说,乱码是由于编码方式与解码方式不一致导致的,这一句话没有理解透!如果当时这样想既然出现了乱码,肯定是那边的编码格式和解码格式不一致,就好了!
注:编码:将字符串转换成字节序列;解码:将字节序列转换成字符串