JS系列之url编码

ASCII 字符

ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。

以下是部分ASCII码对照表:
JS系列之url编码_第1张图片

为什么需要对URI进行编码

对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。

Javascript中提供了3对函数用来对Url编码以得到合法的Url:

  1. escape --> unescape
  2. encodeURI --> decodeURI
  3. encodeURIComponent --> decodeURIComponent

下面的表格列出了这三个函数的安全字符(即函数不会对这些字符进行编码):
JS系列之url编码_第2张图片

escape --> unescape

  • 不对 ASCII 字母、数字进行编码
  • 不对 *@-_+./ 进行编码
  • 其他所有的字符都会被转义序列替换

这个方法属于过时产物,ECMAScript v3 反对使用该方法,应用使用 encodeURI() 和 encodeURIComponent() 替代它。

encodeURI --> decodeURI

  • 不对 ASCII 字母和数字进行编码。
  • 不对 -_.!~*'();/?:@&=+$,# 这20个ASCII 标点符号进行编码。
  • 其他所有的字符都会被转义序列替换

encodeURIComponent --> decodeURIComponent

它跟encodeURI的区别就是,encodeURI是对整个url进行编码,而encodeURIComponent是对url的个别部分进行编码。
如果 URI 组件中含有分隔符,比如 ? 和 #,则应当使用 encodeURIComponent() 方法分别对各组件进行编码

encodeURIComponent('http://www.baidu.com?name=zhang@xiao@jie&order=1');
// http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1

你可能感兴趣的:(url,javascript)