编码问题2

转自:http://wanghuan8086.javaeye.com/blog/173869

 

今天在用HttpClient的PostMethod模拟浏览器用表单的post方法发送数据给服务器的时候,如果数据是中文,服务器接收的是乱码,然后看了很多乱码的文章,最后解决了,现在总结下.
  1.首先搞清楚客户端是用那种编码方式将数据编码后提交的.
浏览器在form提交后,会生成一个HTTP的头部信息"content-type",标准规定其形式为Content-type: application/x-www-form-urlencoded; charset=UTF-8
这样服务器端就可以知道form里的字符是怎么编码的了。要注意的是这里的charset=UTF-8是默认的,如果这个HTML代码里有<meta http-equiv="Content-Type" content="text/html; charset=GBK" />,那么此HTML的form表单将以GBK的编码方式提交数据,其实表单提交数据使用的编码方式是可以指定的.那现在用HttpClient,根本就没有浏览器和具体的HTML代码,其实HttpClient的PostMethod对象里已经有设定编码方式的方法

Java代码
  1. PostMethod post = new PostMethod("http://javaeye.com");   
  2. post.setRequestHeader("ContentType","application/x-www-form-urlencoded;charset=UTF-8");  

这里的编码方式可以随意指定,开始就是因为没有写这段,采用了Httpclient默认的编码方式,所以出现乱码,这里设置编码方式的方法也不唯一.ajax使用post方法提交数据的编码方式的设定也和这个类似.

  2.服务器端是如何选择那种编码方式来对数据进行解码的呢.
首先我用request.getCharacterEncoding()来看表单提交数据所使用的编码方法,奇怪的是用浏览器提交request.getCharacterEncoding()是null,而用HttpClient提交request.getCharacterEncoding()的值是UTF-8,和客户端指定的编码方式一致,后来google了下,原来是浏览器做的手脚,IE是不将表单提交数据使用的编码方式写到HTTP头部发送出去的.我发现如果用HttpClient的post提交数据,编码方式指定的话,request.getCharacterEncoding()是能得到值的,而且request对象也用此编码方式解码,不用request.setCharacterEncoding("")指定;如果request.getCharacterEncoding()是null,就要request.setCharacterEncoding("")指定编码方式,要和你提交时设定的编码方式一致.然后request.getParameter("")的值就是你想要的了.

 

你可能感兴趣的:(java,html,浏览器,服务器,Google,null)