JavaWeb中请求与响应的乱码问题

编码与解码

  • 编码:将字符转换为二进制数
汉字 编码方式 编码 二进制
‘中’ GB2312 D6D0 1101 0110-1101 0000
‘中’ UTF-16 4E2D 0100 1110-0010 1101
‘中’ UTF-8 E4B8AD 1110 0100- 1011 1000-1010 1101
  • 解码:将二进制数转换为字符

1110 0100-1011 1000-1010 1101 → E4B8AD → ’中’

  • 乱码:一段文本,使用A字符集编码,使用B字符集解码,就会产生乱码。所以解决乱码问题的根本方法就是统一编码和解码的字符集。

解决乱码问题

  • 解决乱码的方法:就是统一字符编码。

  • 浏览器与服务器默认的编码与解码字符集情况

    • 服务器编码与解码是一致的,为:ISO-8859-1
    • 浏览器编码为:
    • 浏览器解码为:GBK(支持少量中文)

    请求乱码

    GET请求

    • GET请求参数是在地址后面的。我们需要修改tomcat的配置文件。需要在server.xml文件修改Connector标签,添加URIEncoding="utf-8"属性。
    • <Connector URIEncoding="UTF-8" connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443"/>
      
    • 一旦配置好以后,可以解决当前工作空间中所有的GET请求的乱码问题。

    POST请求

    • post请求提交了中文的请求体,服务器解析出现问题。
    • 解决方法:在获取参数值之前,设置请求的解码格式,使其和页面保持一致(h5默认是utf-8)。
    •   request.setCharacterEncoding("utf-8");
      
    • POST请求乱码问题的解决,只适用于当前的操作所在的类中。不能类似于GET请求一样统一解决。因为请求体有可能会上传文件。不一定都是中文字符。

    响应乱码

    • 向浏览器发送响应的时候,要告诉浏览器,我使用的字符集是哪个,浏览器就会按照这种方式来解码(servlet(服务器)默认用ISO-8859-1来编码,浏览器默认使用GBK来解码)。
    • 修改servlet(服务器)编码格式
      •   response.setCharacterEncoding("UTF-8");
        
    • 修改浏览器解码格式
      • 解决方法一:
        •   response.setHeader("Content-Type", "text/html;charset=utf-8");
          
      • 解决方法二(常用):
        •  response.setContentType("text/html;charset=utf-8");
          

注意

所有的编码与解码设置必须在数据使用之前,通常我们可以将这些代码放在方法中的首行

你可能感兴趣的:(JavaWeb)