在写程序的时候,我们经常需要对页面进行传参数,比如page?id=1234,那么在page这个页面中就直接可以使用string id = Request.QueryString["id"];来获取参数id的值1234了。这是一个人人都知道的基础知识。
上面的方法:Request.QueryString,它会把传入的URL进行分析,并把结果保存在一个键值(key value)的Collection中,我们只要通过设置key值,就可以返回这个key所对应的value了。
假设这个URL不是通过请求进来的,我们是没有办法通过Request来获取URL的参数值的,我们是否可以通过一个字符串string url = "http://www.google.com/page?id=1234"中分析出Collection[key]=value呢?而且很多时候我们的URL的参数都是经过UrlEncode编码的,这个编码通常来说会是Encoding.UTF8或者Encoding.GetEncoding("gb2312"),需要提醒你的是:Baidu的URL是使用gb2312的,而Google是使用UTF8的。那对于传入的字符串我们如何确认是该使用gb2312还是UTF8来解码呢?
在Baidu或者Google搜索到相关的解决办法中,你会看到这样的说法,那就是通过正则表达式去匹配URL,例如:Regex urlRegex = new Regex(@"(?:^|\?|&)courseid=(\d*)(?:&|$)"); 但是我比较怀疑通过这个方法分析出来的数据完整性,它有办法确保匹配出所有数据吗?后来我想到了模拟Microsoft .NET Framework中Request的方法来解决这个问题。其实上面的string id = Request.QueryString["id"];也可以写成System.Collections.Specialized.NameValueCollection col = Request.QueryString; string strID = col[”id”];所以让我们来构造这个NameValueCollection吧!
代码部分
///</summary>publicvoidTest()
{
stringpageURL="http://www.google.com.hk/search?hl=zh-CN&source=hp&q=%E5%8D%9A%E6%B1%87%E6%95%B0%E7%A0%81&aq=f&aqi=g2&aql=&oq=&gs_rfai=";
Uriuri=newUri(pageURL);
stringqueryString=uri.Query;
NameValueCollectioncol=GetQueryString(queryString);
stringsearchKey=col["q"];
//结果searchKey="博汇数码"}
///<summary>///将查询字符串解析转换为名值集合.
///</summary>///<paramname="queryString"></param>///<returns></returns>publicstaticNameValueCollectionGetQueryString(stringqueryString)
{
returnGetQueryString(queryString,null,true);
}
///<summary>///将查询字符串解析转换为名值集合.
///</summary>///<paramname="queryString"></param>///<paramname="encoding"></param>///<paramname="isEncoded"></param>///<returns></returns>publicstaticNameValueCollectionGetQueryString(stringqueryString,Encodingencoding,boolisEncoded)
{
queryString=queryString.Replace("?","");
NameValueCollectionresult=newNameValueCollection(StringComparer.OrdinalIgnoreCase);
if(!string.IsNullOrEmpty(queryString))
{
intcount=queryString.Length;
for(inti=0;i<count;i++)
{
intstartIndex=i;
intindex=-1;
while(i<count)
{
charitem=queryString[i];
if(item=='=')
{
if(index<0)
{
index=i;
}
}
elseif(item=='&')
{
break;
}
i++;
}
stringkey=null;
stringvalue=null;
if(index>=0)
{
key=queryString.Substring(startIndex,index-startIndex);
value=queryString.Substring(index+1,(i-index)-1);
}
else
{
key=queryString.Substring(startIndex,i-startIndex);
}
if(isEncoded)
{
result[MyUrlDeCode(key,encoding)]=MyUrlDeCode(value,encoding);
}
else
{
result[key]=value;
}
if((i==(count-1))&&(queryString[i]=='&'))
{
result[key]=string.Empty;
}
}
}
returnresult;
}
///<summary>///解码URL.
///</summary>///<paramname="encoding">null为自动选择编码</param>///<paramname="str"></param>///<returns></returns>publicstaticstringMyUrlDeCode(stringstr,Encodingencoding)
{
if(encoding==null)
{
Encodingutf8=Encoding.UTF8;
//首先用utf-8进行解码stringcode=HttpUtility.UrlDecode(str.ToUpper(),utf8);
//将已经解码的字符再次进行编码.stringencode=HttpUtility.UrlEncode(code,utf8).ToUpper();
if(str==encode)
encoding=Encoding.UTF8;
else
encoding=Encoding.GetEncoding("gb2312");
}
returnHttpUtility.UrlDecode(str,encoding);
}
说明
- 对于下面的编码方式中,Baidu是使用gb2312,而Google是使用UTF8的,所以这些编码如何解释呢?解决办法就是如MyUrlDeCode方法所写的,把编码进行一次解码,再把解码后的字符串进行编码,再对字符串进行比较,如果是相同的,那就是使用了这种编码的。还要注意进行ToUpper字符串。
- //博汇数码.stringbaidu=HttpUtility.UrlDecode("wd=%B2%A9%BB%E3%CA%FD%C2%EB");
stringgoogle=HttpUtility.UrlDecode("q=%E5%8D%9A%E6%B1%87%E6%95%B0%E7%A0%81"); - 关于returnGetQueryString(queryString,null,true);如果你传入的是null,那就是表示你无法确认编码是gb2312还是UTF8,当你确认编码的,可以直接传入编码类型,比如returnGetQueryString(queryString,Encoding.UTF8,true);
- 需要注意queryString=queryString.Replace("?","");把?给过滤掉。
- %B2%A9%BB%E3%CA%FD%C2%EB =%B2%A9 %BB%E3 %CA%FD %C2%EB(博汇数码gb2312)
- %E5%8D%9A%E6%B1%87%E6%95%B0%E7%A0%81 =%E5%8D%9A %E6%B1%87 %E6%95%B0 %E7%A0%81(博汇数码utf-8)
-------------------华丽分割线-------------------
作者:听风吹雨