最近翻阅《深入分析 Java Web 技术内幕》(作者:许令波),关于Tomcat上Web请求的编解码问题,少了一个小点,可能影响了部分读者的理解,我特意查证了一下,特总结如下:

1. 请求的PathInfo部分用Tomcat的Connector元素的URIEncoding属性指定的编码来解码。

具体使用可参考:https://tomcat.apache.org/tomcat-8.5-doc/config/http.html。


2. 第二先说请求体(POST正文)的解析,Tomcat按下次顺序去获取字符编码:

  1)用户通过类似代码指定:<%request.setCharsetEncoding("utf-8")%>

  2) 请求报文content-type请求头指定的编码。

  3)应用web.xml配置的统一编码(这个目前在Servlet4.0规范中)

  4) 系统默认的ISO8859-1

  

3. 另外就是QueryString部分的解析,默认情况下Tomcat采用与1)相同的URIEncoding来解析QueryString。 但同时Tomcat提供了另一个参数useBodyEncodingForURI。字面意思用报文体编码来解析QueryString。  若该参数为true.则Tomcat采用与2)相同的编码来解析QueryString。