爬虫实战01:用Excel爬取全国空气质量数据

爬虫实战01:用Excel爬取全国空气质量数据_第1张图片
作者:猿教授

提起爬取数据,我们一般想到的是编程,其实不然,有些时候Excel就可以,不过Excel对网站的数据有要求,对,必须是Table结构!

本次实战课题:用Excel爬取全国空气质量数据

1. 找到数据入口

如图1,在Excel中依次选择菜单「数据」「获取外部数据」「自网站」,弹出「新建Web查询」页面。

爬虫实战01:用Excel爬取全国空气质量数据_第2张图片
图1 数据自网站

如图2,新建Web查询页面相当于一个Excel内嵌的浏览器。

爬虫实战01:用Excel爬取全国空气质量数据_第3张图片
图2 Excel内嵌浏览器


2. 加载目标页面

拷贝站点地址http://www.86pm25.com/paiming.htm内嵌浏览器「地址栏」,点击「转到」,等待页面加载。

注意地址栏下方的提示:单击(C)→,然后单击“导入”(C)

如图3,加载完成后,页面上每个表的左上角都有一个黄色箭头,鼠标悬停在箭头上方,提示单击可选定此表

爬虫实战01:用Excel爬取全国空气质量数据_第4张图片
图3 载入目标页


3. 导入目标数据

如图4,找到《全国空气质量实时排名》表,点击表左上角黄色箭头选中。

选中后黄色箭头→变成蓝色对钩 ✔,整个表格呈现浅蓝色背景填充,此时点击「导入」,可能有弹窗提示,也可能没有,确定后数据已经在Excel表格中了。

爬虫实战01:用Excel爬取全国空气质量数据_第5张图片
图4 选中目标数据表

看吧,用Excel爬取数据是不如编程有乐趣,但是绝对够直接了当、高效实用。


4. 作业

跟完实战,自己练习爬取以下数据:

  • 全球500强企业排行榜
  • 中国大学排行榜
  • 列车时刻表

恭喜你!获得一项元技能!!!

你可能感兴趣的:(爬虫实战01:用Excel爬取全国空气质量数据)