网上有很多讲解决Servlet中文乱码的问题,一般的解决方案是加一个过滤器,在doFilter方法中加入:
- request.setCharacterEncoding("UTF-8");
可是这样并不能解决GET方式传递的数据。如果你能修改tomcat的配置文件,你可以把网址的编码设为UTF-8(或其它):在server.xml的<Connector> 加入 URIEncoding="UTF-8"。当然,更大的可能性是你没有权限修改这个文件,或者有多个网站,但使用了不同的编码。所以需要在doFilter中判断是get还是post后再作相应的处理
- if(httpServletRequest.getMethod().toLowerCase().equals("get")){
- for(String[] strs : request.getParameterMap().values()){
- for(int i = 0; i < strs.length; i++){
- strs[i] = new String(strs[i].getBytes("ISO-8859-1"), "UTF-8");
- System.out.println(strs[i]);
- }
- }
- }
- else{
- request.setCharacterEncoding("UTF-8");
- }
这样看起来似乎是完美了,但是实际应用中,经常使用到混合POST和GET方式提交。如用POST方式提交一个单表到www.xxx.com/deal?page=2。如果使用上述的过滤器,自然是按POST方式进行处理,那通过网址传过来的中文数据就会乱码了。
好在可以得到QueryString,似乎只要把QueryString中的出现的参数处理一下就行了(先忽略重复name的问题):
- HttpServletRequest httpServletRequest = (HttpServletRequest) request;
- String[] expressions = httpServletRequest.getQueryString().split("&");
- for(String expression : expressions){
- String[] parts = expression.split("=");
- if(parts.length == 2){
- request.getParameterMap().put(parts[0], new String[]{ decode(parts[1])});
- }
- }
运行下。。。OMG。。。java.lang.IllegalStateException: No modifications are allowed to a locked ParameterMap。原来这个Map是不能添加值的。可是第一个过滤器中我却成功修改了值,所以产生了第一种方案,我不用put,我去改values。
- public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException {
- request.setCharacterEncoding("UTF-8"); //这句得在下面那个强制转换之前,不知道为什么。这句用来处理post的情况
- HttpServletRequest httpServletRequest = (HttpServletRequest) request;
- //建立一个ArrayList用来存所有的Get方式提交的name对应在Parameter里的value
- ArrayList<String> queryValues = new ArrayList<String>();
- Map<String, String[]> map = request.getParameterMap();
- String query = httpServletRequest.getQueryString();
- if(query != null){
- String[] expressions = query.split("&");
- for(String expression : expressions){
- String[] parts = expression.split("=");
- if(parts.length == 2){
- String[] values = map.get(parts[0]);
- for(String value : values){
- queryValues.add(value);
- }
- }
- }
- }
- //遍历value,如果是get方式提交的(存在于queryValues中),就转一下编码
- for(String[] strs : request.getParameterMap().values()){
- for(int i = 0; i < strs.length; i++){
- for(String qStr : queryValues){
- if(qStr.equals(strs[i])){
- strs[i] = new String(qStr.getBytes("ISO-8859-1"), "UTF-8");
- //ISO-8859-1是tomcat中默认的,UTF-8是urlencode的编码
- break;
- }
- }
- }
- }
- chain.doFilter(request, response);
- }
这样做蛮复杂的,效率又不高。如果post和get中有相同的name,就会出错,可以稍加修改:
- public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException {
- request.setCharacterEncoding("UTF-8");
- HttpServletRequest httpServletRequest = (HttpServletRequest) request;
- ArrayList<String> queryValues = new ArrayList<String>();
- Map<String, String[]> map = request.getParameterMap();
- String query = httpServletRequest.getQueryString();
- if(query != null){
- String[] expressions = query.split("&");
- for(String expression : expressions){
- String[] parts = expression.split("=");
- if(parts.length == 2){
- /*String[] values = map.get(parts[0]);
- for(String value : values){
- queryValues.add(value);
- }*/
- //将上面这段修改为
- String str = URLDecoder.decode(parts[1], "UTF-8");
- System.out.println(str);
- queryValues.add(new String(str.getBytes("UTF-8"), "ISO-8859-1"));
- }
- }
- }
- for(String[] strs : request.getParameterMap().values()){
- for(int i = 0; i < strs.length; i++){
- for(String qStr : queryValues){
- if(qStr.equals(strs[i])){
- strs[i] = new String(qStr.getBytes("ISO-8859-1"), "UTF-8");
- break;
- }
- }
- }
- }
- chain.doFilter(request, response);
- }
另一种方案是,把parameter中的成员都放到Attribute中,然后把QueryString中的成员也放到Attribute中,覆盖了parameter中的GET方式提交的成员。缺点是,数据得用getAttribute来读了...