之前做的一个小程序需要获取天气预报接口,使用的是中国天气网的免费接口:
http://m.weather.com.cn/data/101010100.html ,但最近发现这个接口的天气数据不更新了,最新的天气是2014年2月19日的。推测可能是加了什么限制,目前网上搜到的大部分天气接口都是这个。
下面的两个天气接口倒是仍然可以使用,不过一个是获取实时天气情况的,一个是获取当天整体天气情况的。对于需要获取7天内的天气情况,还需要找寻其他接口来实现。
http://www.weather.com.cn/data/sk/101010100.html
http://www.weather.com.cn/data/cityinfo/101010100.html
通过这几天的测试,终于找到了一个可用的,特提供给大家。
接口获取的就是中天气网的手机版页面中的数据,网址为: 首页-中国天气网 http://mobile.weather.com.cn/index.html。
数据是通过webclient,get方式来抓取的。这里需要指出一个需要注意的地方。
就是在webClient添加的请求头信息中加入Referer信息,否则获取的天气数据不是当天的。
获取的的数据为:
如果不加Referer头信息,获取到的数据为:
无论你什么时候获取,获取到的都是20131012这天的天气数据。奇怪的是time是最新的,一直在更新的。由此也可以看出来,他们是加了某种过滤机制无法获取真实的当天天气,这也间接解释了为什么上面提到的那个天气接口不能使用了。
说到这里那就再加一句,开头提到的天气接口 http://m.weather.com.cn/data/101010100.html 即使我加了Referer信息也不能获取当天的。
数据抓取代码:
class Program { //参考文章:中国天气网的数据接口研究 - Create Chen - 博客园 http://www.cnblogs.com/technology/p/3488176.html
static void Main(string[] args) { //实时天气 // string url = "http://mobile.weather.com.cn/data/sk/101010100.html?_=1393644135884"; //穿衣指数
string url = "http://mobile.weather.com.cn/data/zsM/101010100.html?_=1393645156001"; string html = webGetHtml(url); Console.WriteLine(html); Console.ReadKey(); } //get请求
public static string webGetHtml(string url) { // string url = "http://www.cnblogs.com/";
// http://www.cnblogs.com/babycool WebClient client = new WebClient(); //设置发出请求 的URI
client.BaseAddress = url; //添加到请求头部的信息 //GET / HTTP/1.1 //Accept: text/html, application/xhtml+xml, */* //Accept-Language: zh-CN //User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; qdesk 2.4.1263.203; Windows NT 6.1; Trident/5.0) //Accept-Encoding: gzip, deflate //Host: //Connection: Keep-Alive
client.Headers.Add("Accept", "application/json, text/javascript, */*; q=0.01"); client.Headers.Add("Accept-Language", "zh-CN,zh;q=0.8"); //注意:Referer 一定要加,否则获取的不是当天的。
client.Headers.Add("Referer", "http://mobile.weather.com.cn/"); client.Headers.Add("User-Agent", "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1;Chrome/27.0.1453.110; Trident/5.0)"); //client.Headers.Add("Connection", "Keep-Alive"); //client.Headers.Add("Accept-Encoding", "gzip, deflate"); //如果是获取网站的首页的内容 则为 client.OpenRead("/"); //如果是获取网站域名下的非首页的内容 则为client.OpenRead(url); //获取流数据
Stream webStream = client.OpenRead(url); StreamReader reader = new StreamReader(webStream, Encoding.UTF8); //获取html代码 // string html = reader.ReadToEnd();
return reader.ReadToEnd(); } }
转载请注明出处。