java中的URLEncoder和URLDecoder类处理编码与解码问题

 

 网页中的表单使用POST方法提交时,数据内容的类型是 application/x-www-form-urlencoded,这种类型会:

 1.字符"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不会被编码;</p>

 2.将空格转换为加号 (+) ;</p>

 3.将非文本内容转换成"%xy"的形式,xy是两位16进制的数值;</p>

 4.在每个 name=value 对之间放置 &amp; 符号。

URLEncoder类包含将字符串转换为application/x-www-form-urlencoded MIME 格式的静态方法。

web设计者面临的众多难题之一便是怎样处理不同操作系统间的差异性。这些差异性能引起URL方面的问题:例如,一些操作系统允许文件名中含有空格符,有些又不允许。大多数操作系统不会认为文件名中含有符号“#”会有什么特殊含义;但是在一个URL中,符号“#”表示该文件名已经结束,后面会紧跟一个fragment(部分)标识符。其他的特殊字符,非字母数字字符集,它们在URL或另一个操作系统上都有其特殊的含义,表述着相似的问题。为了解决这些问题,我们在URL中使用的字符就必须是一个ASCII字符集的固定字集中的元素,具体如下:1.大写字母A-Z 2.小写字母a-z 3.数字 0-9 4.标点符 - _ . ! ~ * ' (和 ,)   诸如字符: / &amp; ? @ # ; $ + = 和 %也可以被使用,但是它们各有其特殊的用途,如果一个文件名包括了这些字符( / &amp; ? @ # ; $ + = %),这些字符和所有其他字符就应该被编码。

  编码过程非常简单,任何字符只要不是ASCII码数字,字母,或者前面提到的标点符,它们都将被转换成字节形式,每个字节都写成这种形式:一个“%”后面跟着两位16进制的数值。空格是一个特殊情况,因为它们太平常了。它除了被编码成“%20”以外,还能编码为一个“+”。加号(+)本身被编码为%2B。当/ # = &amp; 和?作为名字的一部分来使用时,而不是作为URL部分之间的分隔符来使用时,它们都应该被编码。 //测试编码与解码

	public static void testCodeString(){
		String origialStr="EndUser:[email protected];算的Add Service Component:benchen , Darlen ;Remove Service Component:LF ";
		
		System.out.println("EndUser:[email protected];算的Ad".length());
		try {
			System.out.println("编码前的字符串为:"+origialStr);
			origialStr=URLEncoder.encode(origialStr,"UTF-8");
			System.out.println("编码后的字符串为:"+origialStr);
			origialStr=URLDecoder.decode(origialStr,"utf-8");
		} catch (UnsupportedEncodingException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		System.out.println("解码后的字符串为:"+origialStr);

	}
 

显示结果:

 

编码前的字符串为:EndUser:[email protected];算的Add Service Component:benchen , Darlen ;Remove Service Component:LF 

编码后的字符串为:EndUser%3Aperf_test3%40lf.com%3B%E7%AE%97%E7%9A%84Add+Service+Component%3Abenchen+%2C+Darlen+%3BRemove+Service+Component%3ALF+

解码后的字符串为:EndUser:[email protected];算的Add Service Component:benchen , Darlen ;Remove Service Component:LF 


 

 

你可能感兴趣的:(url编码解码)