Tomcat和Websphere的区别

一、JSP的中文乱码问题

  其根源在于:Web容器(Tomcat)默认的字符处理编码是iso-8859-1,对于需要在浏览器页面上显示中文的JSP程序,

  但在程序中并没有指定中文的字符集,那么中文将在浏览器页面上显示为乱码。当然,前面所说的是指在Tomcat服务器下的,其他服务

  器有些不是这样的,比如BEA Weblogic和IBM Websphere是从操作系统中取得默认的编码,然后按该编码来转码所有用户请求.Struts中

  文问题有三种:发送请求时的中文问题、处理响应结果的中文问题和国际化资源文件的中文问题。

  1. 发送请求时的中文问题

  客户机向服务器发送请求时,根据所使用浏览器的不同可能会有不同的编码形式。不过通常情况下在请求到达Web容器前要将之转码,

  转成某种固定的编码以方便Web应用的处理。这种问题有三种处理方法:

  第一种(针对Tomcat 5 对POST请求有效,GET请求无效,因为Tomcat 5 对POST和GET请求时分别处理的)可以采用设置用户请求对象的编码形式,也就是以HttpServletRequest对象的编码的形式来进行用户请求的转码:

  //将用户请求转码为GB2312、GB18030、GBK、UTF-8 等型,具体转为什么类型的编码以您的jsp文件的编码方式为准,java、jsp 、js 、css应保持一致的编码方式。这里以GBK为例。

  request.setCharacterEncoding("GBK");

  第二种(对GET请求有效),可以在Servlet中对用户输入的数据进行转码。Web容器接受到一个请求时,它会将它发往某个处理的Servlet。在Servlet中直接获取用户请求的数据,然后将之转码为需要的格式,例如把数据转换为GBK格式:

  String username = request.getParameter("username");

  username = new String(username.getBytes("iso-8859-1”), "GBK");

  以上两种方法都是很常用的,但第一种是每个页面都要去修改,当JSP页面很多时比较麻烦,第二种就每个发送的数据都要转码,也很麻烦。

  第三种,就是采用Filter过滤器方式,将用户的所有请求都通过过滤器进行转码,这种方法就克服了以上两种方法的缺点。代码如下:

  public void doFilter(ServletRequest request, ServletResponse response,

  FilterChain chain ) throws IOException, ServletException {

  request.setCharacterEncoding("GBK");

  //response.setContentType("text/html;charset=GBK");

  chain.doFilter(request, response);

  }

  这里转码为GBK过滤器的主要代码,当然还要把这个类要在web.xml文件中部署。

  2. 处理响应结果的中文问题

  响应的结果包括Servlet、JSP和HTML三种情况,可以通过以下方式设置响应结果编码:

  对于Servlet,可以在Servlet中为其设置响应代码类型,代码如下:

  response.setContentType("text/html;charset=GBK"); 也可把这句加到上面的Filter中,如注释掉的部分。

  有人说用 response.setCharacterEncoding("GBK"); 无效,必须用 response.setContentType("text/html;charset=GBK"); 本人没试过。

  对于JSP,是比较方便的,只需要在JSP最前部分按如下方式声明:

  <%@ page contentType="text/html;charset=GBK"%>

  对于HTML,其和JSP文件基本类似,也是在页面最前部分按如下方式声明:

  

  

  

  3.  国际化资源文件的中文问题

  一个Struts应用程序中,可以配置多个资源包,无论是Action、ActionForm还是JSP都可以访问这些包中的资源。资源包就是由扩展名为.properties的文件组成的一组具有相同前缀的文件,如ApplicationResources_zh_CN.properties、ApplicationResources_zh.properties和ApplicationResources.properties。这些文件就构成一个Struts的资源包,它们都有一个统一的前缀ApplicationResources,凡是有相同前缀的资源文件就都属于一个包。

  当用MyEclipse编写资源文件时,默认是不能保存中文的,因为默认保存编码的格式是ISO-8859-1,这就需要修改为gb2312或者gbk编码格式。Windons -->Preferences-->General -->Content Types-->Text-->Java Properties File,在最下方把其Default encoding改为"UTF-8”,然后"update”就可以保存中文了。但就这样保存的中文还是不能够在页面上使用的,因为Web容器默认是使用ISO-8859-1,也就会把中文用ISO-8859-1的格式发送给客户页面,显示的还是乱码,这就是JAVA国际化的问题。JAVA是支持unicode编码格式的,unicode是国际统一通用编码,所以不管什么格式的编码转化为unicode编码肯定不会显示乱码的。这个时候就是需要把资源文件的UTG-8编码格式转化为unicode编码格式,而SUN公司又提供了这样的一种工具。在JDK的安装目录bin下,有一个叫native2ascii可执行文件,这个是专门来进行资源文件转码的。打开cmd,进入JDK的bin目录下,把资源文件拷贝到该目录下,执行该命令。比如:

  native2ascii –encoding GBK ApplicationResources.properties ApplicationResources_zh_CN.properties 就是把GBK编码格式ApplicationResources.properties转化为unicode编码格式ApplicationResources_zh_CN.properties,这样显示页面时就不会出现乱码了。

 二、Websphere 默认的字符处理编码要看:

  管理控制台--->服务器--->应用程序服务器--->server1--->java和进程管理--->进程定义--->java虚拟机--->通用jvm参数 的设置了,如为,-Dfile.encoding=GB2312 -Dclient.encoding.override=GBK 则是GBK。

  我们可以通过如下判定:

  用ieHTTPHEADERS 等工具查看POST请求中的请求参数,汉字是经过Encoding的(是按哪种字符集编码要看jsp文件的编码方式了),

  由 % 间隔的十六进制数组成,如下 jsp文件的字符集是UTF-8,form 表单提交,用ieHTTPHEADERS 工具查得请求参数为:

  struts.token.name=struts.token&struts.token=HPADE1CXRJ0PASL2V7RQFVXJLLFB1OUE&ptoId=244&

  orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0&orgId=&oscId=&oscType=H1&ptoType=01&impDate=2009-06-16

  &details=%E5%85%B7%E4%BD%93%E6%83%85%E5%86%B5

  orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0

  经UTF-8 编码的,其中文对应的是“组织名称”,E7BB84 是“组”的十六进制表示,

  E7BB87 是"织"的十六进制表示等。

  form表提交后,在ACTION中查看“组织名称”变为乱码: "缁勭粐鍚嶇О"

  通过以下代码分析:

  String JinZhi16 = Integer.valueOf("E7",16).toString();  // 把E7 转为十进制,这里JinZhi16 = 231 ,BB 对应的十进制:187

  System.out.println("JinZhi16 = "+JinZhi16);

  // 这里的231、187,132等都是通过Integer.valueOf("E7",16).toString()分别把对应的E7、BB、84 等转过来的十进制数字。

  byte[] bt = new byte[]{(byte)231,(byte)187,(byte)132,(byte)231,(byte)187,(byte)135,(byte)229,(byte)144,(byte)141,(byte)231,(byte)167,(byte)176};

  System.out.println("GB18030 = "+new String(bt,"GB18030"));

  System.out.println("GBK = "+new String(bt,"GBK"));

  System.out.println("UTF-8 = "+new String(bt,"UTF-8"));

  String aa = new String(bt,"GB18030");

  System.out.println("GBK = "+new String(aa.getBytes("GBK"),"UTF-8"));

  String encoding=System.getProperty("file.encoding");

  System.out.println("Default System Encoding: " + encoding);

  输出内容:

  JinZhi16 = 231

  GB18030 = 缁勭粐鍚嶇О

  GBK = 缁勭粐鍚嶇О

  UTF-8 = 组织名称

  GBK = 组织名称

  Default System Encoding: UTF-8

  我们发现:form表单提交 orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0(即"组织名称") 到 ACTION ,是 "缁勭粐鍚嶇О"

  这样的乱码,而 System.out.println("GB18030 = "+new String(bt,"GB18030"));  输出的也为"缁勭粐鍚嶇О" ,所以可假设其

  编码字符集也为GB18030或GBK,用通过System.out.println("GBK = "+new String(aa.getBytes("GBK"),"UTF-8")); 得知确为GBK或GB18030。GB18030是 GBK的超集,他支持3--4字节的编码,不过这两个标准都支持GB2312-80。查看WebSphere的 “通用jvm参数”的设置了是 -Dfile.encoding=GB2312 -Dclient.encoding.override=GBK,所以最后把-Dfile.encoding=GB2312 -Dclient.encoding.override=GBK 改为-Dfile.encoding=UTF-8 -Dclient.encoding.override=UTF-8 就可以解决乱码了(对get 和 post 有效)。

  修改完上述参数要从起WebSphere的服务,远程登录到安装WebSphere的机器上,你的was发布的ip 就是WebSphere所在的机器,其用户名和密码同登录到发布was 的WebSphere的控制台一样,因为本来就是同一台机器。登录到WebSphere控制台,服务器 ——>应用程序服务器 找到对应的节点名称如 "cncaitKaifaNode03" ,在控制面板 - > 服务 -> 查看以IBM开头的有"cncaitKaifaNode03" 标识的WebSphere服务,重启。

  用如下过滤器不管用。

  public class ChartFilter implements Filter{

  private String encoding = "UTF-8";

  public void init(FilterConfig config)throws javax.servlet.ServletException {

  String temp =config.getInitParameter("encoding");

  encoding = (temp == null) ? encoding : temp;

  }

  public void doFilter(ServletRequest request,

  ServletResponse response,

  FilterChain chain ) throws java.io.IOException, javax.servlet.ServletException  {

  System.out.println("-----------过滤器-----------encoding = "+encoding);

  request.setCharacterEncoding(encoding);

  response.setCharacterEncoding(encoding);

  response.setContentType("text/html; charset="+encoding);

  chain.doFilter(request, response);

  }

  public void destroy() {

  }

  }



三、共同问题:

  Tomcat 5  和 webSphere6.1 对get请求,如果有奇数个汉字的参数,则紧接着&的下一参数会追加在这个汉字参数后。如:

  String url = "/cnca/servlet/update.action?orgName=中国船级社质量认证公司&oscYM=2009-06" ,则取得orgName的值

  为中国船级社质量认证公oscYM=2009-06,而oscYM 没有取到值。

  解决的简单方法就是在 orgName=中国船级社质量认证公司之后 &oscYM=2009-06之前加一个全角空格。

  ---------------------------------------------------------------

  程序从tomcat迁移至websphere的修改

  1.普通应用部署在websphere上中文乱码问题

  解决:管理控制台--->服务器--->应用程序服务器--->server1--->java和进程管理--->进程定义--->java虚拟机--->将通用jvm参数设置为:

  根据你的jsp java文件的编码是什么而定,如果是UTF-8 则设置为 -Ddefault.client.encoding=UTF-8 -Dclient.encoding.override=UTF-8 -Dfile.encoding=UTF-8 -Duser.language=zh -Duser.region=CN

  2.修改hibernate.cfg.xml (针对我的项目cnca(自律))

  jdbc/cncaprod

  以下下是网上搜集的:

  在部署文件中设定了jdbc引用名jdbc/sample,jndi名字为jdbc/sample

  如果采用如下代码:

  javax.sql.DataSource ds = (javax.sql.DataSource)ctx.lookup("java:comp/env/jdbc/sample");

  conn = ds.getConnection();

  运行就报错:05-7-1 10:02:24:178 CST] 00000031 SystemErr R Naming-Exception: Exception occurred while the JNDI NamingManager was processing a javax.naming.Reference object.

  去掉"java:comp/env/”就好了。

  解决:确认部署后在概要表空间下的config\cells\CN7642012HNode01Cell\applications目录下相应应用的web.xml文件下有正确的配置JNDI,如:

  

  jdbc/yjjndi

  javax.sql.DataSource

  Container

  Shareable

  

  再查看同目录下的ibm-web-bnd.xmi文件中id是否和上面的id相同,如下(注意粗体部分):

  

  

  

  

  3. 对get请求

  去掉类似new String(username.getBytes("iso-8859-1”), "GBK"); 的代码段。


你可能感兴趣的:(encode)