JSP中文编码经验小结

影响JSP编码的两个属性: contentType 和 pageEncoding ;

首先,我们先了解一下JSP的编码规则,从中可以理解到contentType和pageEncoding的作用域.
contentType的charset是指服务器发送给客户端时的内容编码.而pageEncoding是jsp文件本身的编码. 
 JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。
         第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
        第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
        JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
        第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

contentType的設定.
         pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。

从此我们可以看出,  pageEncoding影响的是JSP编绎成.java文件(即servlet文件)阶段,此时如果pageEncoding设定错了,用一般的编绎器编绎出来的.java文件中就会出现中文乱码. 而用eclipse的话会提示你编码错误..
contentType影响的是最后一个阶段,即由Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码(也就是.class文件)的阶段,我们在客户端看到的结果就是此阶段产生的,  这时的编码就是根据contentType来设定. 光从客户端来说,pageEncoding 和contentType设置的不一样,例pageEncoding=GB2312,contentType的charset=UTF-8,此时客户端显示的JSP页面都能够正常显示中文乱码. 

但是更重要的是与服务器的交互...   当从一个JSP页面发送请求至服务器端时, header中会发送什么数据呢?
header中发送的编码设定是由contentType指定的..  此时如果contentType指定的编码与服务器的编码不一致时,在服务器端就会产生中文乱码!

这是我经过多次实验得出的结果-_-|||  希望大家不会再为JSP的中文乱码问题头痛.. (统一编码为UTF-8是王道)

在开发J2EE WEB应用时最好使用过滤器来杜绝中文乱码的问题.  附过滤器源码:
import  java.io.IOException;

import  javax.servlet.Filter;
import  javax.servlet.FilterChain;
import  javax.servlet.FilterConfig;
import  javax.servlet.ServletException;
import  javax.servlet.ServletRequest;
import  javax.servlet.ServletResponse;

public   class  SetCharacterEncodingFilter  implements  Filter  {
 
private String encoding;
 
public void init(FilterConfig filterConfig) throws ServletException {
  
// TODO Auto-generated method stub
  this.encoding=filterConfig.getInitParameter("encoding");
 }


 
public void doFilter(ServletRequest request, ServletResponse response,
   FilterChain chain) 
throws IOException, ServletException {
  
// TODO Auto-generated method stub
  request.setCharacterEncoding(this.encoding);
  chain.doFilter(request,response);
 }


 
public void destroy() {
  
// TODO Auto-generated method stub

 }


}

在web.xml中添加以下代码:

   < filter >
   
< filter-name > SetCharacterEncodingFilter </ filter-name >
   
< filter-class > org.hilor.servlet.SetCharacterEncodingFilter </ filter-class >
   
< init-param >
    
< param-name > encoding </ param-name >
    
< param-value > UTF-8 </ param-value >
   
</ init-param >
  
</ filter >

   
< filter-mapping >
   
< filter-name > SetCharacterEncodingFilter </ filter-name >
   
< url-pattern > /* </ url-pattern >   
  
</ filter-mapping >
这样在所有的request请求的时候就会转换成UTF-8编码.

你可能感兴趣的:(JSP中文编码经验小结)