Tomcat web 编解码过程


假设客户端通过sender=URLEncoder.encode("中文的测试","GBK")对参数进行编码,格式为 GBK ,编码后是一串16进制字符串【gbk两个字节表示一个字符,utf-8三个字节表示一个字符】

一:GET请求方式:

1:请求的参数都放在http请求的头信息中,在doget方法中调用request.getParameter("sender")时tomcat会对url后面跟的查询串进行解码
2:如果 server.xml中没有对设置 URIEncoding="gbk"  useBodyEncodingForURI="true"任何一个,那么,会使用 ISO-8859-1对16进制的参数进行解码,这时候request.getParameter()获得的中文参数乱码,可以使用new String(sender.getBytes("ISO-8859-1"), "gbk")正确的到参数;
3:如果 server.xml中设置 URIEncoding="gbk"但是没有设置 useBodyEncodingForURI="true", 那么,会使用 gbk对16进制的参数进行解码,这时候request.getParameter()获得正确的中文参数
【但是】如果 server.xml中设置 URIEncoding="utf-8", 没有设置 useBodyEncodingForURI="true" , 那么,会使用 utf-8对16进制的参数进行解码(三个字节对应一个字符),这时候request.getParameter()获得乱码的中文参数,并且通过new String(sender.getBytes("  utf-8 "), "gbk")也会乱码,可能丢失字节;
【但是】如果 server.xml中设置 URIEncoding="utf-8", 但设置 useBodyEncodingForURI="true" , 那么 URIEncoding="utf-8"将不会起作用,设置request.setCharacterEncoding(“gbk”)后,
request.getParameter()可以正确的获得中文参数
4: 如果 server.xml中设置 useBodyEncodingForURI="true" 但是没有设置  URIEncoding="gbk",这个时候request.setCharacterEncoding(“gbk”)对get方式是起作用的,可以直接通过request.getParameter()可以正确的获得中文参数; 如果没有request.setCharacterEncoding(“gbk”)如何??
5:如果 URIEncoding="gbk"  useBodyEncodingForURI="true"都设置了,那么 URIEncoding="gbk"不起作用
解码方式为server.xml中
URIEncoding=""设置的方式【如果没有配置,默认使用ISO-8859-1】,如果server.xml中还设置了useBodyEncodingForURI="true"那么URIEncoding=""设置无效,将使用body的编码方式进行解码,
二:POST请求方式:
1:参数都放在http请求的body中,在dopost中request.setCharacterEncoding(“**”)设置body中数据以**方式编码;
     如果**就是客户端通过URLEncoder对参数的编码方式,那么直接通过request.getParameter()就可以正确的获得中文参数;
2:post方式的解码方式与server.xml文件中的参数
     URIEncoding="" useBodyEncodingForURI="true/false" 没有关系

你可能感兴趣的:(Tomcat)