一、编写说明
最近一个星期在开发一个小型购物商城网站(源自课程设计),从项目规模大小、时间效率、个人基础以及学习成本等综合考虑采用jsp+servlet+mybatis+mysql架构方式。开发的第三天遇到了jsp乱码问题,这个问题纠结了半天多,过程中积累了不少经验。
二、下载链接
1、mysql下载地址:
http://dev.mysql.com/downloads/
2、tomcat下载地址:
http://tomcat.apache.org/download-60.cgi
3、mybatis(java版本)下载地址:
http://www.mybatis.org/java.html
4、mysql访问软件navicat lite下载:
http://www.onlinedown.net/softdown/87700_2.htm
三、简单描述
jsp页面、mysql数据库、IE浏览器、tomcat容器以及mybatis映射文件等的编码方式都设置为UTF-8形式了。从jsp的form表单提交中文字段保存到数据库后出现了乱码问题。产生疑惑为:统一了编码方式为什么还会出现乱码问题呢。
四、相关内容如下
备注说明:// 注释是为了整理问题写上去的,实际代码不同。
1、jsp页面test.jsp
// jsp保存格式吗,设置为utf-8格式
<%@ page language="java" pageEncoding="utf-8"%>
// jsp解码格式,设置为utf-8,不设置也没问题吗
// 百度网上资料说,如果不设置此处,页面的中文显示有问题,试了把好像并没问题呢。何解,待研究。
<%@ page contentType="text/html;charset=utf-8"%>
<%
String path = request.getContextPath();
String basePath = request.getScheme()+"://"+request.getServerName()+":"+request.getServerPort()+path+"/";
%>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<base href="<%=basePath%>">
<title>jsp乱码问题</title>
// 提示浏览器采用utf-8编码格式处理
<meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>
<body>
//提交到TestServlet.java类处理表单
<form action="testServlet" method="post">
<table>
<tr>
<td>
用户昵称*
</td>
<td>
<input type="text" name="username" />
</td>
</tr>
<tr>
<td>
</td>
<td>
<input type="submit" value="提交测试"/>
</td>
</tr>
</table>
</form>
</body>
</html>
2、tomcat下web.xml配置如下
<?xml version="1.0" encoding="UTF-8"?>
<web-app version="2.4" xmlns="http://java.sun.com/xml/ns/j2ee"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://java.sun.com/xml/ns/j2ee
http://java.sun.com/xml/ns/j2ee/web-app_2_4.xsd">
<servlet>
<servlet-name>testServlet</servlet-name>
<servlet-class>com.test.TestServlet</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>testServlet</servlet-name>
<url-pattern>/testServlet</url-pattern>
</servlet-mapping>
</web-app>
3、TestServlet.java如下
// 在servlet层出现了乱码问题
package com.test;
import java.io.IOException;
import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
public class TestServlet extends HttpServlet {
public void doGet(HttpServletRequest request, HttpServletResponse response)
throws IOException, ServletException {
// 处理get提交方式
this.doPost(request, response);
}
public void doPost(HttpServletRequest request, HttpServletResponse response)
throws IOException, ServletException {
// 处理post提交方式
String username = request.getParameter("username");
// servlet层测试乱码
System.out.println("servlet = "+username); // 显示成了乱码
}
}
4、初步判定
通过的servlet-web层打印出字符串就显示成了乱码格式、那么再通过dao层插入到数据库后肯定是乱码的,问题定位在jsp页面到servlet代码之间,就要考虑jsp、IE、tomcat容器的编码方式了。前面已经说明了,全部设置成了utf-8格式了,所以进一步查看了网上许多解决方案,解决方案比较多比较乱,针对我遇到的问题,我从中提取和学习了下面的一些知识内容。
5、提取内容
一、表单post方式提交——中文字段出现乱码,也就是上面例子描述的问题了。
1、原因为tomcat的内部编码格式为ISO-8859-1,在没有设置提交的编码格式时会以ISO-8859-1的方式提交,而此时jsp编码格式为utf-8
所以导致了乱码产生。解决办法如下三种,怀着好奇心都尝试了一把。
2、方法:接收参数时进行转码、在请求页面开始处设置编码格式、过滤器处理。
3、具体实现代码如下所示:
(1)转码方式
String username = request.getParameter("username");
// 进行转码操作处理
username = new String(username.getBytes("iso-8859-1"),"utf-8");
// servlet层测试乱码
System.out.println("servlet = "+username);
(2)设置编码格式
// 在请求的开始设置为utf-8格式
request.setCharacterEncoding("utf-8");
(3)过滤器方式
web.xml配置文件中添加上filter配置
<filter>
<filter-name>JspEncodingFilter</filter-name>
<filter-class>com.test.JspEncodingFilter</filter-class>
<init-param>
<param-name>jspEncoding</param-name>
<param-value>utf-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>JspEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
对应的类如下:
package com.test;
import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
public class JspEncodingFilter implements Filter {
private String jspEncoding = null;
public void destroy() {
}
public void doFilter(ServletRequest arg0, ServletResponse arg1,
FilterChain arg2) throws IOException, ServletException {
arg0.setCharacterEncoding(jspEncoding); // 设置编码格式
arg1.setContentType("text/html;charset="+jspEncoding);
arg2.doFilter(arg0, arg1);
}
public void init(FilterConfig arg0) throws ServletException {
this.jspEncoding = arg0.getInitParameter("jspEncoding");
}
}
// 其他乱码问题待以后遇到再研究学习。
// tomcat下get方式提交解决方案等等。
五、后续问题
认识到上面这些知识后,局部解决了乱码问题。在servlet层打印出参数值没有乱码问题,通过navicat lite连接上mysql数据库发现为乱码问题。从servlet-web层到自定义的biz业务层再到mybatis的dao层,通过单元测试junit跟踪发现没有出现问题。最后将问题定位在mysql层面,我通过mysql管理工具navicat lite对原来的数据库、表、字段都设置了编码格式。
1、数据库属性中将Character set选择为utf--UTF-8 Unicode,将Collation选择为utf8_general_ci
2、对应的表、字段都选择到了utf-8设置。
重新进行插入操作,发现到了数据库还是乱码问题,接下来尝试避开navicat lite设置下mysql。
1、C:\Program Files\MySQL\MySQL Server 5.5 目录下找到了my配置文件,将latin1换成了default-character-set=utf8,character-set-server=utf8
2、启动mysql.exe进入后通过set names utf8;关闭后重启启动tomcat、mysql,从jsp页面提交一个表单,发现mysql数据库还是乱码显示
3、通过navicat lite查看的却是正常中文编码。到了这一步我费解了。
六、想法总结
通过第五步的操作,我开始有点不淡定了,mysql怎么这样呢。于是好奇地将set names gbk,发现显示没有问题。为什么utf-8出了问题呢。于是我重新卸载了mysql5.1版本、从官网下载了一个mysql5.5。安装完毕发现原始数据还在,这个又是为什么呢,我用360强力删除的。
总结1、解决问题的思路有待提高。
总结2、遇到问题要冷静、淡定,多学会总结。
备注:一不小心写成了意识流、技术文档总结能力有待提高。