java URL encoding and decoding

HTML编码规则是:
字符"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不被编码,维持原值,
空格" "被转换为加号"+"。
所有其他的字符都被认为是不安全的,首先都根据指定的编码scheme被转换为1个或者多个字节
然后每个字节都被表示成"%xy"格式的由3个字符组成的字符串,xy是字节的2位16进制的表达,推荐的编码scheme为UTF-8.
所以URL中只要包含有不安全的字符都必须编码,服务端自动解码.
但是有些网站的URL确实又包含中文等不安全字符.一个是浏览器可能会自动编码,还有个就是在服务端处理.

java 提供了URLEncoder,URLDecoder分别用于URL的编码与解码,它们提供的是静态方法:
URLEncoder.encode(url,"utf-8");
URLDecoder.decode(url,"utf-8");
当我们设置Cookie时也可能考虑使用它们来编码与解码cookie的值

特殊特殊字符的含义   
————————————————————————————   
  字符   特殊字符的含义   URL编码   
  #   用来标志特定的文档位置   %23   
  %   对特殊字符进行编码   %25   
  &   分隔不同的变量值对   %26   
  +   在变量值中表示空格   %2B   
  \   表示目录路径   %2F   
  =   用来连接键和值   %3D   
  ?   表示查询字符串的开始   %3F

你可能感兴趣的:(java,html,浏览器,Scheme)