webSphere和TomCat的区别以及乱码问题

(一)JSP的中文乱码问题

     其根源在于:Web容器(Tomcat)默认的字符处理编码是iso-8859-1,对于需要在浏览器页面上显示中文的JSP程序,

    器有些不是这样的,比如BEA WeblogicIBM Websphere是从操作系统中取得默认的编码,然后按该编码来转码所有用户请求.Struts

    1. 发送请求时的中文问题

    客户机向服务器发送请求时,根据所使用浏览器的不同可能会有不同的编码形式。不过通常情况下在请求到达Web容器前要将之转码,

    转成某种固定的编码以方便Web应用的处理。这种问题有三种处理方法:

    第一种(针对Tomcat 5 POST请求有效,GET请求无效,因为Tomcat 5 POSTGET请求时分别处理的)可以采用设置用户请求对象的编码形式,也就是以HttpServletRequest对象的编码的形式来进行用户请求的转码:

    //将用户请求转码为GB2312GB18030GBKUTF-8 等型,具体转为什么类型的编码以您的jsp文件的编码方式为准,javajsp js css应保持一致的编码方式。这里以GBK为例。

    request.setCharacterEncoding("GBK");

    第二种(GET请求有效),可以在Servlet中对用户输入的数据进行转码。Web容器接受到一个请求时,它会将它发往某个处理的Servlet。在Servlet中直接获取用户请求的数据,然后将之转码为需要的格式,例如把数据转换为GBK格式:

    String username = request.getParameter("username");

    username = new String(username.getBytes("iso-8859-1”), "GBK");

    以上两种方法都是很常用的,但第一种是每个页面都要去修改,当JSP页面很多时比较麻烦,第二种就每个发送的数据都要转码,也很麻烦。

    第三种,就是采用Filter过滤器方式,将用户的所有请求都通过过滤器进行转码,这种方法就克服了以上两种方法的缺点。代码如下:

    public void doFilter(ServletRequest request, ServletResponse response,

    FilterChain chain ) throws IOException, ServletException {

    request.setCharacterEncoding("GBK");

    //response.setContentType("text/html;charset=GBK");

    chain.doFilter(request, response);

    }

    这里转码为GBK过滤器的主要代码,当然还要把这个类要在web.xml文件中部署。

    2. 处理响应结果的中文问题

    响应的结果包括ServletJSPHTML三种情况,可以通过以下方式设置响应结果编码:

    对于Servlet,可以在Servlet中为其设置响应代码类型,代码如下:

    response.setContentType("text/html;charset=GBK"); 也可把这句加到上面的Filter中,如注释掉的部分。

    有人说用 response.setCharacterEncoding("GBK"); 无效,必须用 response.setContentType("text/html;charset=GBK"); 

    对于JSP,是比较方便的,只需要在JSP最前部分按如下方式声明:

    <%@ page contentType="text/html;charset=GBK"%>

    对于HTML,其和JSP文件基本类似,也是在页面最前部分按如下方式声明:

    <head>

    <META HTP-EQUIV="contentType" CONTENT="text/html;charset=GBK">

    </head>

    3.  国际化资源文件的中文问题

    一个Struts应用程序中,可以配置多个资源包,无论是ActionActionForm还是JSP都可以访问这些包中的资源。资源包就是由扩展名为.properties的文件组成的一组具有相同前缀的文件,如ApplicationResources_zh_CN.propertiesApplicationResources_zh.propertiesApplicationResources.properties。这些文件就构成一个Struts的资源包,它们都有一个统一的前缀ApplicationResources,凡是有相同前缀的资源文件就都属于一个包。

    当用MyEclipse编写资源文件时,默认是不能保存中文的,因为默认保存编码的格式是ISO-8859-1,这就需要修改为gb2312或者gbk编码格式。Windons -->Preferences-->General -->Content Types-->Text-->Java Properties File,在最下方把其Default encoding改为"UTF-8”,然后"update”就可以保存中文了。但就这样保存的中文还是不能够在页面上使用的,因为Web容器默认是使用ISO-8859-1,也就会把中文用ISO-8859-1的格式发送给客户页面,显示的还是乱码,这就是JAVA国际化的问题。JAVA是支持unicode编码格式的,unicode是国际统一通用编码,所以不管什么格式的编码转化为unicode编码肯定不会显示乱码的。这个时候就是需要把资源文件的UTG-8编码格式转化为unicode编码格式,而SUN公司又提供了这样的一种工具。在JDK的安装目录bin下,有一个叫native2ascii可执行文件,这个是专门来进行资源文件转码的。打开cmd,进入JDKbin目录下,把资源文件拷贝到该目录下,执行该命令。比如:

    native2ascii –encoding GBK ApplicationResources.properties ApplicationResources_zh_CN.properties 就是把GBK编码格式ApplicationResources.properties转化为unicode编码格式ApplicationResources_zh_CN.properties,这样显示页面时就不会出现乱码了。

(二)Websphere 默认的字符处理编码要看

     管理控制台--->服务器--->应用程序服务器--->server1--->java和进程管理--->进程定义--->java虚拟机--->通用jvm参数 的设置了,如为,-Dfile.encoding=GB2312 -Dclient.encoding.override=GBK 则是GBK

    我们可以通过如下判定:

    ieHTTPHEADERS 等工具查看POST请求中的请求参数,汉字是经过Encoding的(是按哪种字符集编码要看jsp文件的编码方式了),

    % 间隔的十六进制数组成,如下 jsp文件的字符集是UTF-8form 表单提交,用ieHTTPHEADERS 工具查得请求参数为:

    struts.token.name=struts.token&struts.token=HPADE1CXRJ0PASL2V7RQFVXJLLFB1OUE&ptoId=244&

    orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0&orgId=&oscId=&oscType=H1&ptoType=01&impDate=2009-06-16

    &details=%E5%85%B7%E4%BD%93%E6%83%85%E5%86%B5

    orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0 UTF-8 编码的,其中文对应的是"组织名称" E7BB84 ""的十六进制表示,

    E7BB87 ""的十六进制表示等。

    form表提交后,在ACTION中查看 "组织名称" 变为乱码: "缁勭粐鍚嶇О"

    通过以下代码分析:

    String JinZhi16 = Integer.valueOf("E7",16).toString();  // E7 转为十进制,这里JinZhi16 = 231 BB 对应的十进制:187

    System.out.println("JinZhi16 = "+JinZhi16);

    // 这里的231187132等都是通过Integer.valueOf("E7",16).toString()分别把对应的E7BB84 等转过来的十进制数字。

    byte[] bt = new byte[]{(byte)231,(byte)187,(byte)132,(byte)231,(byte)187,(byte)135,(byte)229,(byte)144,(byte)141,(byte)231,(byte)167,(byte)176};

    System.out.println("GB18030 = "+new String(bt,"GB18030"));

    System.out.println("GBK = "+new String(bt,"GBK"));

    System.out.println("UTF-8 = "+new String(bt,"UTF-8"));

    String aa = new String(bt,"GB18030");

    System.out.println("GBK = "+new String(aa.getBytes("GBK"),"UTF-8"));

    String encoding=System.getProperty("file.encoding");

    System.out.println("Default System Encoding: " + encoding);

    输出内容:

    JinZhi16 = 231

    GB18030 = 缁勭粐鍚嶇О

    GBK = 缁勭粐鍚嶇О

    UTF-8 = 组织名称

    GBK = 组织名称

    Default System Encoding: UTF-8

    我们发现:form表单提交 orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0(即"组织名称") 到 ACTION , "缁勭粐鍚嶇О"

    这样的乱码,而 System.out.println("GB18030 = "+new String(bt,"GB18030"));  输出的也为"缁勭粐鍚嶇О" ,所以可假设其

    编码字符集也为GB18030GBK,用通过System.out.println("GBK = "+new String(aa.getBytes("GBK"),"UTF-8")); 得知确为GBK

    GB18030GB18030 GBK的超集,他支持3--4字节的编码,不过这两个标准都支持GB2312-80

    查看WebSphere "通用jvm参数" 的设置了是 -Dfile.encoding=GB2312 -Dclient.encoding.override=GBK

    所以最后把-Dfile.encoding=GB2312 -Dclient.encoding.override=GBK 改为

    -Dfile.encoding=UTF-8 -Dclient.encoding.override=UTF-8 就可以解决乱码了(对get post 有效)。

    修改完上述参数要从起WebSphere的服务,远程登录到安装WebSphere的机器上,你的was发布的ip 就是WebSphere所在的机器,    其用户名和密码同登录到发布was WebSphere的控制台一样,因为本来就是同一台机器。登录到WebSphere控制台 ,服务器    ——>应用程序服务器找到对应的节点名称如 "cncaitKaifaNode03" ,在控制面板 - > 服务 -> 查看以IBM开头的有"cncaitKaifaNode03" 标识的WebSphere服务,重启。

    用如下过滤器不管用。

    public class  ChartFilter  implements  Filter{

    private   String   encoding   =   "UTF-8";

    public   void   init(FilterConfig   config)   throws   javax.servlet.ServletException   {

    String   temp   =   config.getInitParameter("encoding");

    encoding   =   (temp   ==   null)   ?   encoding   :   temp;

    }

    public   void   doFilter(ServletRequest   request,

    ServletResponse   response,

    FilterChain   chain )   throws   java.io.IOException,   javax.servlet.ServletException   {

    System.out.println("-----------过滤器-----------encoding = "+encoding);

    request.setCharacterEncoding(encoding);

    response.setCharacterEncoding(encoding);

    response.setContentType("text/html; charset="+encoding);

    chain.doFilter(request,   response);

    }

    public   void   destroy()   {

    }

    }

(三)共同问题:

    Tomcat 5  webSphere6.1 get请求,如果有奇数个汉字的参数,则紧接着&的下一参数会追加在这个汉字参数后。如:

    String url = "/cnca/servlet/update.action?orgName=中国船级社质量认证公司&oscYM=2009-06" ,则取得orgName的值

    为中国船级社质量认证公oscYM=2009-06,oscYM 没有取到值。

    解决的简单方法就是在 orgName=中国船级社质量认证公司之后 &oscYM=2009-06之前加一个全角空格。

    ---------------------------------------------------------------

    程序从tomcat迁移至websphere的修改

    1.普通应用部署在websphere上中文乱码问题

    解决:管理控制台--->服务器--->应用程序服务器--->server1--->java和进程管理--->进程定义--->java虚拟机--->将通用jvm参数设置为:

    根据你的jsp java文件的编码是什么而定,如果是UTF-8 则设置为 -Ddefault.client.encoding=UTF-8 -Dclient.encoding.override=UTF-8 -Dfile.encoding=UTF-8 -Duser.language=zh -Duser.region=CN

    2.修改hibernate.cfg.xml (针对我的项目cnca(自律))

    <property name="connection.datasource">jdbc/cncaprod</property>

    以下下是网上搜集的:

    在部署文件中设定了jdbc引用名jdbc/samplejndi名字为jdbc/sample

    如果采用如下代码:

    javax.sql.DataSource ds = (javax.sql.DataSource)ctx.lookup("java:comp/env/jdbc/sample");

    conn = ds.getConnection();

    运行就报错:05-7-1 10:02:24:178 CST] 00000031 SystemErr R Naming-Exception: Exception occurred while the JNDI NamingManager was processing a javax.naming.Reference object.

    去掉"java:comp/env/”就好了。

    解决:确认部署后在概要表空间下的config\cells\CN7642012HNode01Cell\applications目录下相应应用的web.xml文件下有正确的配置JNDI,如:

    <b><resource-ref id="ResourceRef_1097466019938"></b>

    <res-ref-name>jdbc/yjjndi</res-ref-name>

    <res-type>javax.sql.DataSource</res-type>

    <res-auth>Container</res-auth>

    <res-sharing-scope>Shareable</res-sharing-scope>

    </resource-ref>

    再查看同目录下的ibm-web-bnd.xmi文件中id是否和上面的id相同,如下(注意粗体部分)

    <b><resRefBindings xmi:id="ResourceRefBinding_1097466019938" jndiName="jdbc/yjjndi" loginConfigurationName="DefaultPrincipalMapping">

    <bindingResourceRef href="WEB-INF/web.xml#ResourceRef_1097466019938"/></b>

    <properties xmi:id="Property_1165956970219" name="com.ibm.mapping.authDataAlias" value="CN7642012HNode01/yjj2c" description="description"/>

    </resRefBindings>

    3. get请求,去掉类似new String(username.getBytes("iso-8859-1”), "GBK"); 的代码段。

 

你可能感兴趣的:(websphere)