一、js内置编码,解码函数的介绍:
@.JavaScript中有三个可以对字符串编码的函数,分别是: escape,encodeURI,encodeURIComponent,相应3个解码函数:
unescape,decodeURI,decodeURIComponent 。
使用介绍:
escape()函数
定义和用法
1 escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串。
语法
escape(string)
参数 描述
string 必需。要被转义或编码的字符串。
返回值
已编码的 string 的副本。其中某些字符被替换成了十六进制的转义序列。
说明
该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其他所有的字符都会被转义序列替换。
2 encodeURI()函数 decodeURI() 函数
定义和用法
encodeURI() 函数可把字符串作为 URI 进行编码(decodeURI解码)。
语法
encodeURI(URIstring)
参数 描述
URIstring 必需。一个字符串,含有 URI 或其他要编码的文本。
返回值
URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
说明
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。
该方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:;/?:@&=+$,#
3 encodeURIComponent() 函数/ decodeURIComponent() 函数
定义和用法因此 encodeURIComponent() 函数将转义用于分隔 URI 各个部分的标点符号。
注意点:
1 encodeURI和decodeURI 主要用于URL(网址)的编码、解码,是JavaScript的自身函数,采用UTF-8编码格式对指定的字符串进行编码或解码
说明:
本项功能只是用于 encodeURI编码和decodeURI解码 的对照,可以识别和研究网址
encodeURI函数不能编码的字符:@ ~ ! @ # $ & * ( ) _ + : ? - = ; ' , . / 英文 数字
由于目前各国网页字符集的不同造成了URL编码的多种形式,例如 GBK和UTF 这2种字符集的网页中汉字URL编码方式就不一样。
encodeURI编码和decodeURI解码只能针对UTF-8字符集的网页,不能识别GBK网页编码过的汉字编码。
2 encodeURIComponent和decodeURIComponent 主要用于URL(网址)的编码、解码,是JavaScript的自身函数,
采用UTF-8编码格式对指定的字符串进行编码或解码。
与encodeURI和decodeURI的区别:
说明:
本项功能只是用于 encodeURIComponent编码和decodeURIComponent解码 的对照,可以识别和研究网址
encodeURIComponent函数相对于encodeURI函数来说,可以对更多的字符进行编码,
包括:@ # $ & + : ? = ; , / 等字符。
encodeURIComponent函数不能编码的字符:@ ~ ! * ( ) _ - ' . 英文 数字
由于目前各国网页字符集的不同造成了URL编码的多种形式,例如 GBK和UTF 这2种字符集的网页中汉字URL编码方式就不一样。
encodeURIComponent编码和decodeURIComponent解码只能针对UTF-8字符集的网页,不能识别GBK网页编码过的汉字编码。
总结:由上得知js再进行解码中文时,只能解码由utf-8格式编码的中文;如果解码GBK格式编码的中文,js会抛出“被解码的 URI 不是合法的编码“的异常;
网上http://blog.csdn.net/cuixiping/article/details/1723741这个博客重写了js类库中的方法,实现了解码GBK格式的中文,但是使用他的方法后解码utf-8格式的中文时会抛出同样的错。
具体解决方案有待研究,,如果有大牛已经有了解决方法,希望留言,,,,,,