Http请求编码是个老问题了,不论是UTF-8还是GBK,在咖啡的印象中,这个应该是7年前,刚学Java web时候碰到的。
最近在做一个老项目,准确的说是在老项目上做修改的时候,编码问题又发生了。
问题背景:
1.一个历经三年前的项目,使用的是Jboss,老项目的编码在Jboss上设置了Http Encoding=GBK。就是说,老项目的设计者只考虑了客户端使用GBK的编码提交的。
2.新添加的功能,我们使用jQuery,通过AJAX提交POST请求,这里有两个限制
第一。AJAX的Post请求是UTF-8的编码,这个无法修改
第二。我们提交的表单有50多个字段,没法使用GET转换绕开编码,因为会超长。
问题发生了,也在网络上找了半天,没发现解决方案(这也是偶要写blog的原因,希望大家不再走弯路)。
解决过程:
尝试1(失败).使用request.getParameter,而后转码,不论如何处理,由于在Jboss上设置了编码,在参数获取的时候,服务器会默认进行一次GBK的转码,这样编码就出错了,是无法转换回正常的UTF-8的。
尝试2(成功,但很麻烦).直接读取request.getOutputStream中的byte流。这个方法是可以的,但所有的参数就必须要自己解析了(注意:request.getParameter 和 request.getOutputStream中,哪个先执行了,则另一个就失效,读不到数据的)
最佳答案
在所有的request.getParameter被调用之前,对request进行编码设置,即纠正jboss的默认设置,而后再取参数就正常了。在request.getParameter前加上
request.setCharacterEncoding("utf-8");
很简单不是嘛,但是如果自己碰到了,思路不对,又要浪费上个把小时时间了。