好久没有写文章了今天拿个小例子来练练手吧,2011年开个头。在这里先祝大家兔年大吉大利,祝愿博客园越办越好!!!
网上其它也有不少这样的方法,我是根据自己的想法来实现几个,正好也利用一个URl Get请求的方法来取得页面信息,并分析的过程,希望能给新手带来一些帮助。
先来看第一个手机号码信息查询:
我们打开http://www.ip138.com:8080/search.asp
只要我们输入自己的手机号码就会得到如下信息,那怎么样把这些信息取出来呢,当我们单击查询时看Url的变化
http://www.ip138.com:8080/search.asp?mobile=13781033951&action=mobile
那我们现在是不是只要这样写上一行代码就可以随时变化手机号呢?
"http://www.ip138.com:8080/search.asp?action=mobile&mobile=" + number.Trim()
然后我们通过下面一个方法来取得请求的页面的HTML代码,就是如上图提示界面的HtML代码
/// <summary>
/// 传入URL返回网页的html代码
/// </summary>
/// <param name="Url">URL</param>
/// <returns></returns>
public static string GetUrltoHtml(string Url)
{
try
{
System.Net.WebRequest wReq = System.Net.WebRequest.Create(Url);
// Get the response instance.
System.Net.WebResponse wResp = wReq.GetResponse();
// Read an HTTP-specific property
// if (wResp.GetType() ==HttpWebResponse)
// {
// DateTime updated =((System.Net.HttpWebResponse)wResp).LastModified;
// }
// Get the response stream.
System.IO.Stream respStream = wResp.GetResponseStream();
// Dim reader As StreamReader = New StreamReader(respStream)
using (System.IO.StreamReader reader = new System.IO.StreamReader(respStream, Encoding.Default))
{
return reader.ReadToEnd();
}}
catch (System.Exception ex)
{
//errorMsg = ex.Message;
}
return "" ;
}
通过上面的方法我们可以得到Hthl信息,
我们来分析一下这个网页的内容
具体的过程我就不多说的,大家应该都很容易能想到,我把分析后得到的代码写出来吧
/// <summary>
/// 输入手机号码得到归属地信息
/// </summary>
/// <param name="number">手机号码</param>
/// <returns>数组类型0为归属地,1卡类型,2区 号,3邮 编</returns>
public static string[] getTelldate(string number)
{
try
{
string strSource = GetUrltoHtml("http://www.ip138.com:8080/search.asp?action=mobile&mobile=" + number.Trim());
//归属地
strSource = strSource.Substring(strSource.IndexOf(number));
strSource = StripHTML(strSource);
strSource = strSource.Replace("/r", "" );
strSource = strSource.Replace("/n", "" );
strSource = strSource.Replace("/t", "" );
strSource = strSource.Replace(" ", "" );
strSource = strSource.Replace("-->", "" );
string[] strnumber = strSource.Split(new string[] { "归属地", "卡类型", "邮 编", "区 号", "更详细", "卡号" }, StringSplitOptions.RemoveEmptyEntries);
string[] strnumber1 = null ;
if (strnumber.Length > 4 )
{
strnumber1 = new string[] { strnumber[1].Trim(), strnumber[2].Trim(), strnumber[3].Trim(), strnumber[4 ].Trim() };
}
return strnumber1;
}
catch (Exception)
{
return null ;
}
}
这里还有一个过滤HTML代码的方法提供如下
/// <summary>
/// 过滤html标签
/// </summary>
/// <param name="strHtml">html的内容</param>
/// <returns></returns>
public static string StripHTML(string stringToStrip)
{
// paring using RegEx //
stringToStrip = Regex.Replace(stringToStrip, "</p(?://s*)>(?://s*)<p(?://s*)>", "/n/n", RegexOptions.IgnoreCase | RegexOptions.Compiled);
stringToStrip = Regex.Replace(stringToStrip, "<br(?://s*)/>", "/n", RegexOptions.IgnoreCase | RegexOptions.Compiled);
stringToStrip = Regex.Replace(stringToStrip, "/"", "''", RegexOptions.IgnoreCase | RegexOptions.Compiled);
stringToStrip = StripHtmlXmlTags(stringToStrip);
return stringToStrip;
}
private static string StripHtmlXmlTags(string content)
{
return Regex.Replace(content, "<[^>]+>", "", RegexOptions.IgnoreCase | RegexOptions.Compiled);
}
这样的话我们就取到我们想要的信息啦,然后生成一个数组直接调用方法Ok
在原来的基础上我们还可以把身份证信息的查询出来
方法如下
/// <summary>
/// 输入身份证号得到相应信息
/// </summary>
/// <param name="number">手机号码</param>
/// <returns>数组类型0为性别,1出生日期,2发证地</returns>
public static string[] getCardate(string number)
{
try
{
string strSource = GetUrltoHtml("http://qq.ip138.com/idsearch/index.asp?action=idcard&userid=" + number.Trim() + "&B1=%B2%E9+%D1%AF" );
strSource = strSource.Substring(strSource.IndexOf("查询结果" ));
strSource = StripHTML(strSource);
strSource = strSource.Replace("/r", "" );
strSource = strSource.Replace("/n", "" );
strSource = strSource.Replace("/t", "" );
strSource = strSource.Replace(" ", "" );
strSource = strSource.Replace("查询结果 * ++", "" );
strSource = strSource.Replace("-->", "" );
string[] strnumber = strSource.Split(new string[] { "性别:", "出生日期:", "发证地:", "点击这里查询验证身份", "提示:" }, StringSplitOptions.RemoveEmptyEntries);
string[] strnumber1 = null ;
if (strnumber.Length > 3 )
{
strnumber1 = new string[] { strnumber[1].Trim(), strnumber[2].Trim(), strnumber[3 ].Trim() };
}
return strnumber1;
}
catch (Exception)
{
return null ;
}
}
自己没事动手写了个,虽然不怎么样但是拿出来大家看看吧,呵呵,这还可以使用正则来实现,而且非常方便,
我们还以第一个查询手机号的为例子来看吧
//归属地
string ad = GetMatch(Getaddress(), "class=tdc2>(.*)</TD>").Replace(" ", "_" );
string[] str1 = ad.Split('_' );
Privoice = str1[0 ].ToString().Trim();
City = str1[1 ].ToString().Trim();
GetMatch()方法的代码如下所示。
//得到数据
public static string GetMatch(string strSource, string strRegex)
{
try
{
Regex r;
MatchCollection m;
r = new Regex(strRegex, RegexOptions.IgnoreCase);
m = r.Matches(strSource);
if (m.Count <= 0) return "" ;
return m[1].Groups[1 ].Value;
}
catch
{
return "" ;
}
}