java web乱码浅析

分析过程不说了,直接说结果。

一。对于QueryString的解析



   1. 对urlencode 解析错误这个错误源于过时的javax.servlet.http.HttpUtils类
      HttpUtils.parseQueryString(arg0)   这个类在解析中使用ISO-8859-1 字符集解析字符串
   2. (貌似规范要求这么做的)

二。对于post正文请求的解析



   1. 对于post的解析一般能正常解析。但是在第一次调用request.getParameter后设置编码无效,所以很多时候使用过滤器来解决这个问题,过滤会第一个获取到request并设置好惨。
   2. 在未设置编码(setCharacterEncoding)时使用ISO-8859-1 。。。解析

三。解决办法



   1. 对于QueryString我们可以直接拆解字符串进行解析(URLDecoder.decode(str, "UTF8"))
   2. 对于post数据在容器第一次解析我们不能获取到请求正文流和数据。可以使用new String(str.getBytes("ISO-8859-1 "),"UTF8") 解析
   3. 最彻底的办法,,自己写包装器在过滤器或者框架内对解析进行包装。
   4. 我们公司使用包装器在框架内解决,应用层一般不接触到HttpServletRequest



刚才看了apache的实现,直接用的把%后面的当成16进制解析成char

你可能感兴趣的:(java,apache,Web,框架,servlet)