jsp乱码问题

在Java内部运算中,所有的字符串都 会被转化为UTF-8编码来进行操作。Java总是根据操作系统的默认编码字符集来决定字符串的初始编码,而且Java系统的输入和输出的都是采取操作系 统的默认编码。因此,如果能统一Java系统的输入、输出和操作系统3者的编码字符集合,将能够使Java系统正确处理和显示汉字。这是处理Java系统 汉字的一个基本原则。J2EE中,输入输出涉及到,浏览器,数据库等,java的汉字处理即是要统一这些终端的字符集,把他们设成一样或相容的字符集。

一、Java中文问题的由来

Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。

首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字 节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。基于这种乱码,建议在Java文件中尽量 不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb18030编译;对于JSP,在文件头加上

<%@ page contentType="text/html;charset=GBK"%>或

<%@ page contentType="text/html;charset=gb18030"%>基本上就能解决这类乱码问题。

很多存储媒介,如数据库,文件,流等的存储方式都是基于字节流的,Java程序与这些媒介交互时就会发生字符(char)与字节(byte)之间的转换,具体情况如下:

从页面form提交数据到java程序 byte->char
从java程序到页面显示 char?>byte

从数据库到java程序 byte?>char
从java程序到数据库 char?>byte

从文件到java程序 byte->char
从java程序到文件 char->byte

从流到java程序 byte->char
从java程序到流 char->byte

如果在以上转换过程中使用的编码方式与字节原有的编码不一致,很可能就会出现乱码。

二、出现乱码的原因
   1存储与读取:
在存储的时候将汉字使用某种编码方式 转换成了字节流,而在重新读取这些字节流以解码成相应的汉字时去使用了另外的编码方式,错误的原因是可能是使用较短的ISO-8859-1编码存储,而使 用了可能是GBK、GB2312、UTF-8解码,或是使用了较长的GBK、GB2312、或是UT-8作编码存储,而使用了较短的编码如ISO- 8859-1编码解码。
   
    2网页显示:
A、当从网页从客户端提交请求信息到服务器端时,采用的编码一般为ISO-8859-1方式,因此,为了获得正确的汉字显示,应采用相同的编码将取得的信息解码。
       B、将汉字显示到客户端面页面时,应使用与网页指定的字符集相同或相兼容的编码方式编码后再发送到客户端网页。

1、JSP与页面参数之间的乱码

在<%@ page language="java" contentType="text/html; charset=GB18030" pageEncoding="GB18030"%>,在每个JSP页面中都应该有这样的一个语句,第一个 charset=GB18030  表示JSP编码时采用GB18030字符集,第二pageEncoding="GB18030"  表示将JSP页面 解码时采用GB18030字符集,若设置了这个语句,且两个字符集都一致则JSP的页面输出不会产生乱码。
JSP获取页面参数时一般采用系统默认的编码方式,如果页面参数的编码类型和系统默认的编码类型不一致,很可能就会出现乱码。解决这类乱码问题的基本方法是在页
面获取参数之前,强制指定request获取参数的编码方式:request.setCharacterEncoding("GBK")或

request.setCharacterEncoding("GB18030")。
如果在JSP将变量输出到页面时出现了乱码,可以通过设置

response.setContentType("text/html;charset=GBK")或response.setContentType("text/html;charset=GB18030")解决。
如果不想在每个文件里都写这样两句话,更简洁的办法是使用Servlet规范中的过虑器指定编码,过滤器的在web.xml中的典型配置和主要代码如下:
web.xml:

<filter>
<filter-name>CharacterEncodingFilter</filter-name>
<filter-class>net.vschool.web.CharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>GBK</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>CharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>

CharacterEncodingFilter.java:

public class CharacterEncodingFilter implements Filter
{

protected String encoding = null;

public void init(FilterConfig filterConfig) throws ServletException
{
this.encoding = filterConfig.getInitParameter("encoding");
}

public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException
{
request.setCharacterEncoding(encoding);
response.setContentType("text/html;charset="+encoding);
chain.doFilter(request, response);
}

}

 

2、Java与数据库之间的乱码
大部分数据库都支持以unicode编码方式,所以解决 Java与数据库之间的乱码问题比较明智的方式是直接使用unicode编码与数据库交互。很多数据库驱动自动支持unicode,如Microsoft 的SQLServer驱动。其他大部分数据库驱动,可以在驱动的url参数中指定,如如mm的
mysql驱动:jdbc:mysql://localhost/WEBCLDB?useUnicode=true&
characterEncoding=GBK。

3、Java与文件/流之间的乱码
Java读写文件最常用的类是
FileInputStream/FileOutputStream和FileReader/FileWriter。其中FileInputStream
和FileOutputStream是基于字节流的,常用于读写二进制文件。读写字符文件建议使用基于字符的FileReader和
FileWriter,省去了字节与字符之间的转换。但这两个类的构造函数默认使用系统的编码方式,如果文件内容与系统编码方式不一致,可能会出现乱码。
在这种情况下,建议使用FileReader和FileWriter的父类:
InputStreamReader/OutputStreamWriter,它们也是基于字符的,但在构造函数中可以指定编码类型:
InputStreamReader(InputStream in, Charset cs) 和OutputStreamWriter
(OutputStream out, Charset cs)。

4、其他
上面提到的方法应该能解决大部分乱码问题,如果在
其他地方还出现乱码,可能需要手动修改代码。解决Java乱码问题的关键在于在字节与字符的转换过程中,你必须知道原来字节或转换后的字节的编码方式,转
换 时采用的编码必须与这个编码方式保持一致。我们以前使用Resin服务器,使用smartUpload组件上传文件,上传文件同时传递的中文参数获取没有 乱码问题。当在Linux中把Resin设置成服务后,上传文件同时的中文参数获取出现了乱码。这个问题困扰了我们很久,后来我们分析 smartUpload组件的源文件,因为文件上传采用的是字节流的方式,里面包含的参数名称和值也是字节流的方式传递的。smartUpload组件读 取字节流后再将参数名称和值从字节流中解析出来,问题就出现在smartUpload将字节流转换成字符串时采用了系统默认的编码,而将Resin设置成
服务后,系统默认的编码可能发生了改变,因此出现了乱码。后来,我们更改了smartUpload的源文件,增加了一个属性charset和
setCharset(String)方法,将upload()方法中提取参数语句:
String value = new String(m_binArray, m_startData, (m_endData - m_startData) + 1 );
改成了
String value = new String(m_binArray, m_startData, (m_endData - m_startData) + 1, charset );

 

本文改自CSDN博客,转载请标明出处:http://blog.csdn.net/li285913050/archive/2008/10/12/3057166.aspx

你可能感兴趣的:(职场,休闲,jsp乱码)