decodeURI解码,由URIEncoder.encode("","GBK")编码的中文,问题解决

一、js内置编码,解码函数的介绍:

@.JavaScript中有三个可以对字符串编码的函数,分别是: escape,encodeURI,encodeURIComponent,相应3个解码函数:

    unescape,decodeURI,decodeURIComponent 。

使用介绍:

escape()函数
定义和用法
1 escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串。
语法
escape(string)
参数 描述
string 必需。要被转义或编码的字符串。
返回值
已编码的 string 的副本。其中某些字符被替换成了十六进制的转义序列。
说明
该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其他所有的字符都会被转义序列替换。



2 encodeURI()函数 decodeURI() 函数
定义和用法
encodeURI() 函数可把字符串作为 URI 进行编码(decodeURI解码)。
语法
encodeURI(URIstring)
参数 描述
URIstring 必需。一个字符串,含有 URI 或其他要编码的文本。
返回值
URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
说明
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。
该方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:;/?:@&=+$,#


3 encodeURIComponent() 函数/ decodeURIComponent() 函数

定义和用法
encodeURIComponent() 函数可把字符串作为 URI 组件进行编码( decodeURIComponent() 解码)。
语法
encodeURIComponent(URIstring)
参数 描述
URIstring 必需。一个字符串,含有 URI 组件或其他要编码的文本。
返回值
URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
说明
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。
其他字符(比如 :;/?:@&=+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换的。
提示和注释
提示:请注意 encodeURIComponent() 函数 与 encodeURI() 函数的区别之处,前者假定它的参数是 URI 的一部分(比如协议、主机名、路径或查询字符串)。

因此 encodeURIComponent() 函数将转义用于分隔 URI 各个部分的标点符号。


注意点:

1  encodeURI和decodeURI 主要用于URL(网址)的编码、解码,是JavaScript的自身函数,采用UTF-8编码格式对指定的字符串进行编码或解码

说明:

  本项功能只是用于 encodeURI编码和decodeURI解码 的对照,可以识别和研究网址中被编码过的汉字。
  encodeURI函数不能编码的字符:@ ~ ! @ # $ & * ( ) _ + : ? - = ; ' , . / 英文 数字
  由于目前各国网页字符集的不同造成了URL编码的多种形式,例如 GBK和UTF 这2种字符集的网页中汉字URL编码方式就不一样。
 encodeURI编码和decodeURI解码只能针对UTF-8字符集的网页,不能识别GBK网页编码过的汉字编码。

2  encodeURIComponent和decodeURIComponent 主要用于URL(网址)的编码、解码,是JavaScript的自身函数,

采用UTF-8编码格式对指定的字符串进行编码或解码。

与encodeURI和decodeURI的区别:

说明:

  本项功能只是用于 encodeURIComponent编码和decodeURIComponent解码 的对照,可以识别和研究网址中被编码过的汉字。
  encodeURIComponent函数相对于encodeURI函数来说,可以对更多的字符进行编码,
     包括:@ # $ & + : ? = ; , / 等字符。

  encodeURIComponent函数不能编码的字符:@ ~ ! * ( ) _ - ' . 英文 数字

  由于目前各国网页字符集的不同造成了URL编码的多种形式,例如 GBK和UTF 这2种字符集的网页中汉字URL编码方式就不一样。
 encodeURIComponent编码和decodeURIComponent解码只能针对UTF-8字符集的网页,不能识别GBK网页编码过的汉字编码。


总结:由上得知js再进行解码中文时,只能解码由utf-8格式编码的中文;如果解码GBK格式编码的中文,js会抛出“被解码的 URI 不是合法的编码“的异常;

            网上http://blog.csdn.net/cuixiping/article/details/1723741这个博客重写了js类库中的方法,实现了解码GBK格式的中文,但是使用他的方法后解码utf-8格式的中文时会抛出同样的错。




具体解决方案有待研究,,如果有大牛已经有了解决方法,希望留言,,,,,,




你可能感兴趣的:(js)