Request.QueryString 接受参数时,跟编码有关的一些问题

author:ghj
From:joycode
使用 Request.QueryString 接受参数时,跟编码有关的一些问题
,我们先来看以下几个请求,
看a.aspx 页面用Request.QueryString接受到的是啥信息?

  页面URL Request.QueryString["info"]接受到的值
案例一 a.aspx?info=%25

%

案例二 a.aspx?info=%bc%bc%ca%f5

????

情况分析:

案例一

a.aspx?info=%25 为何 Request.QueryString["info"]接受到的值是 % ,而不是 %25,是因为Request.QueryString 替我们在接受到值后,做了一次URL解码。 HttpUtility.UrlDecode("%25")  的计算结果就是 %

上面的这个案例一虽然看起来很简单。但是我们在一些特殊场景时候,就会因为这个而极度郁闷。

比如以下几种情况:

你有一个自己的加密算法,而这个加密算法,某些情况下会计算出带百分号的结果,而这个结果你是要通过url参数的方式传递给其它页面的。
这时候你就苦恼的发现,某些时候某个功能就不能用。

如果解决案例一碰到的情况呢?

解决方案一:

把需要传递的参数传递前作一次 HttpUtility.UrlEncode ,
记得是按照 UTF-8 的编码的 UrlEncode 。这样如果我们希望客户端接受到的是 %25  就应该传递的是 %2525 。

切记,不可在接受方每次接受后,自作聪明的都做一次 UrlEncode 。而是在发送方做 UrlEncode 。
如果接受方接受后作 UrlEncode 的话,就会出现下面情况:
发送方发送 a.aspx?info=%25 ,这时候如果接受方  接受后作 UrlEncode 的话,一切正确
发送方发送 a.aspx?info=% ,这时候如果接受方  接受后作 UrlEncode 的话,则就乱了。

另:这套方案中切记, UrlEncode  和 UrlDecode 的次数应该一一对应。不能多一次,也不能少一次。
有人就会说,这还会出现次数不对应么? 比如下面情况,一个不留意就很可能出现次数不对应。而出现不是你所期望的情况。
比如我们有这样类似的功能:

a.aspx 页面中,根据传入的 from 参数,自动跳转到 from 参数(用Request.QueryString["from"]来接受这个参数)设置的页面。
b.aspx 页面也是同样的逻辑,根据传入的 from 参数(用Request.QueryString["from"]来接受这个参数),自动跳转到指定的页面。
c.aspx 页面也是同样的逻辑,根据传入的 from 参数(用Request.QueryString["from"]来接受这个参数),自动跳转到指定的页面。


这样我们就可能书写下面的链接地址:
a.aspx?from=b.aspx 
a.aspx?from=b.aspx?from=c.aspx
a.aspx?from=b.aspx?from=c.aspx?from=http://blog.joycode.com/ghj/

下面再复杂一点,我给下面几个链接,其中都有 a 这个参数,请告诉我 a 这个参数是被那个页面接受到了?
说明:  HttpUtility.UrlEncode("&")  == "%26"     HttpUtility.UrlEncode("%")  == "%25"

地址 a 参数会被那个页面接受到
a.aspx?from=b.aspx?from=c.aspx&a=1 a 参数被 a.aspx 页面接受到了
a.aspx?from=b.aspx?from=c.aspx%26a=1 a 参数被 b.aspx 页面接受到了
a.aspx?from=b.aspx?from=c.aspx%2526a=1 a 参数被 c.aspx 页面接受到了

如果想不明白,就想想下面这句话
每一次用 Request.QueryString 获取参数时候,就作了一次 HttpUtility.UrlDecode。

解决方案二:

不用 Request.QueryString ,而是自己实现一个获取查询参数的方法。细节我在案例二讲完后再告诉大家,因为这个解决方案也处理了案例二的一些情况。

案例二

a.aspx?info=%bc%bc%ca%f5 传给我们的信息其实是使用 GB2312 编码后的“技术” 这两个汉字。
不信,你可以用下面表达式计算的结果就是 %bc%bc%ca%f5
HttpUtility.UrlEncode("技术", System.Text.Encoding.GetEncoding("GB2312"))

asp.net 系统内部,在处理 Request.QueryString 等情况时候,都是使用的 UTF-8 的编码,我们如果不存在多系统并存的问题时候,这个问题一点都不存在。
但是,当需要跟其它系统交互式后,问题就可能会出现。
如果你不了解案例二这里情况时,你就会被这个问题苦恼死。

比如下面这两个地址提到的问题:

asp.net中的server.urlencode函数和asp中的server.urlencode函数返回的值竟然不一样
http://blog.joycode.com/ghj/archive/2003/10/20/2992.aspx

php与aspx之间中文通过url如何传递?
http://topic.csdn.net/u/20071018/19/8a4066af-a08c-4214-91e9-ed4caf977e07.html

案例二的解决方案
使用带编码的 HttpUtility.ParseQueryString 函数

就是采用类似下面代码的方式,来获得指定格式编码的查询文本参数。

           System.Collections.Specialized.NameValueCollection nv =
System.Web.HttpUtility.ParseQueryString(Request.Url.Query, System.Text.Encoding.GetEncoding("GB2312"));
           Response.Write(nv["Tag"]);

 

要说我为啥知道上面几种解决方案,是因为我用 Reflector 看了 Request.QueryString 的实现代码。在查看代码时候,我们会看到这样一个 internal 方法:
System.Web.HttpValueCollection 类的内部方法:
internal void FillFromString(string s, bool urlencoded, Encoding encoding)

这个内部方法实现了,按需解密查询参数的功能,但是遗憾的是,在querystring 的处理函数中,强制指定了解析 QueryString 时,必须作一次 HttpUtility.UrlDecode。参看如下代码:

public static NameValueCollection ParseQueryString(string query, Encoding encoding)
{
    ...
    return new HttpValueCollection(query, false, true, encoding);
}

如果我们不想采用案例一的解决方案一,我们就需要自己写一个解析查询信息的代码。我们完全可以照抄 System.Web.HttpValueCollection 类的 internal void FillFromString(string s, bool urlencoded, Encoding encoding) 方法来改写。但郁闷的是:如果你用 Reflector 察看这个函数的实现时候,Reflector 出来的代码是错误的。正确的方法如下:是在施凡帮助下完成的。

自己实现从 URL 查询文本 Query 中解析出我们自己需要的文本的方法

/// <summary>
/// 根据 URL 中的 查询文本 Query 解析成一个 NameValueCollection
/// 在装配脑袋帮助下 郭红俊 改编自 System.Web.HttpValueCollection 类的内部方法:
/// internal void FillFromString(string s, bool urlencoded, Encoding encoding)
/// </summary>
/// <param name="query">需要解析的查询文本</param>
/// <param name="urlencoded">解析文本时候是否需要URL解码</param>
/// <param name="encoding">解析文本时候,按照那种URL编码进行解码</param>
/// <returns></returns>
public static NameValueCollection FillFromString(string query, bool urlencoded, Encoding encoding)
{
    NameValueCollection queryString = new NameValueCollection();
    if (string.IsNullOrEmpty(query))
    {
        return queryString;
    }

    // 确保 查询文本首字符不是 ?
    if (query.StartsWith("?"))
    {
        query = query.Substring(1, query.Length - 1);
    }

    int num1 = (query != null) ? query.Length : 0;
    // 遍历每个字符
    for (int num2 = 0; num2 < num1; num2++)
    {
        int num3 = num2;
        int num4 = -1;
        while (num2 < num1)
        {
            switch (query[num2])
            {
                case '=':
                    if (num4 < 0)
                    {
                        num4 = num2;
                    }
                    break;
                case '&':
                    goto BREAKWHILE;
            }
            num2++;
        }

    BREAKWHILE:

        string name = null;
        string val = null;
        if (num4 >= 0)
        {
            name = query.Substring(num3, num4 - num3);
            val = query.Substring(num4 + 1, (num2 - num4) - 1);
        }
        else
        {
            val = query.Substring(num3, num2 - num3);
        }
        if (urlencoded)
        {

            queryString.Add(HttpUtility.UrlDecode(name, encoding), HttpUtility.UrlDecode(val, encoding));
        }
        else
        {
            queryString.Add(name, val);
        }
        if ((num2 == (num1 - 1)) && (query[num2] == '&'))
        {
            queryString.Add(null, string.Empty);
        }
    }

    return queryString;

}

用上面的代码,我们就可以按需解析自己需要的查询参数,而不是受限的使用request.querystring 。

小结

      Request.QueryString 替我们件事情:每次接受到参数后,都做 UrlEncode ,并且是按照 UTF-8编码做的 UrlEncode 。 这在大多数情况下没有任何问题,但是一些情况下,会给我们带来麻烦,本文就是分析这些可能给我们带来麻烦的场景,以及解决方法。

参考资料:

使用 Reflector ; 查看代码时候,碰到的一个Reflector 的bug
http://blog.joycode.com/ghj/archive/2006/12/06/88646.aspx

解密不同编码的的参数。
http://blog.joycode.com/ghj/archive/2006/04/19/74894.aspx

你可能感兴趣的:(String,null,url,query,asp.net,encoding)