解决 Web 开发中常见的中文乱码问题

为什么会有乱码

  产生乱码的原因一句话就能说明白:

编码和解码使用的字符集不同。

  比如说在后端把字符串 "你好,世界" 按照 UTF-8 进行编码,但是前端却按照 GB2312 进行解码,那自然会产生乱码。

解决 response 中的乱码

  因为目前大部分浏览器都是采用 UTF-8 编码的,所以向浏览器输出中文字符,只需在 doGet 方法中指定 Content-Type:text/html;charset=utf-8。

response.setContentType("text/html;charset=utf-8");

解决 request 中的乱码

GET

  获取 HTTP 请求中的中文参数时可能会有乱码,所以先将字符串变回字节数组,然后再按照 UTF-8 进行编码。假设 HTTP 请求中带了一个 username 的参数,那么就需要在 doGet 方法中进行如下处理

String username = request.getParameter("username");
// Tomcat 默认的编码方式是 ISO8859-1
username = new String(username.getBytes("iso8859-1"),"utf-8");

  问题是,在实际的应用场景中 HTTP 请求携带的参数可能有多个,所以就不能只针对某个参数进行修改。解决的方案是使用装饰器模式,写一个 HttpServletRequest 的装饰器类,经过装饰的 request 对请求中的任何参数都能进行编码的处理。

// 装饰器类,用来设置 GET 请求的编码
public class EncodingRequest extends HttpServletRequestWrapper{

    private HttpServletRequest request;    // 真正的 request 对象
    
    public EncodingRequest(HttpServletRequest request) {
        super(request);
        this.request = request;
    }
    
    @Override
    public String getParameter(String name) { // 覆写 getParameter 方法,将所有参数的编码设置为 UTF-8
        String value = request.getParameter(name);
        try {
            value = new String(value.getBytes("iso-8859-1"),"utf-8");
        } catch (UnsupportedEncodingException e) {
            throw new RuntimeException(e);
        }
        return value;
    }
}

  然后用一个 Filter 对所有的请求进行编码的处理,然后再把处理过后的 request 对象传递给 Servlet:

@WebFilter("/*")
public class EncodingFilter implements Filter {

    public void destroy() {}

    public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain)
            throws IOException, ServletException {
        HttpServletRequest req = (HttpServletRequest) request;
        if (req.getMethod().equals("GET")) { // 处理 GET 请求的编码
            EncodingRequest encodingReq = new EncodingRequest(req);
            // 注意这里传递的是 EncodingRequest 对象
            chain.doFilter(encodingReq, response);
        }
        if (req.getMethod().equals("POST")) { // 处理 POST 请求的编码
            request.setCharacterEncoding("utf-8");
            chain.doFilter(request, response);
        }
    }

    public void init(FilterConfig fConfig) throws ServletException {}

}

POST

  因为大多数情况下我们在 doPost 方法内都会调用 doGet 方法,因此按照上面的做法就能解决 POST 请求中的中文乱码问题。如果使用 Spring 进行开发,那么有 POST 请求乱码的专门解决方案。在 web.xml 中添加如下配置:

    
    
        CharacterEncodingFilter
        org.springframework.web.filter.CharacterEncodingFilter
        
            encoding
            UTF-8
        
    
    
        CharacterEncodingFilter
        /*
    

  这样就可以解决 POST 的乱码问题了。

你可能感兴趣的:(解决 Web 开发中常见的中文乱码问题)