用python对全国火车站数量进行分析,发现东北三省竟然占了2成

“学习python数据分析,并带你感受东北充满文艺气息的火车站”

大家好,帅鸟今天给大家分享一篇有意思的文章——给全国各省火车站数量来个排名,这也是我老早之前就想做的,但是之前思路有点偏,好在迷途知返,今天终于能给大家见面了。下面一起来看看排名情况吧。

第一步:给各个火车站按省归类

走过的坑:之前我先去12306上把所有的火车站名字爬了下来,然后做个地图网站爬虫,爬取所有车站的详细地址信息,但是有几百个不常见的火车站搜不出来,遂作罢;然后又做个百度百科爬虫,逐个把火车站的地址信息提取出来,但是又是几百个火车站在百度百科没有地址信息,有的还是地铁站名(oh my god),遂又放弃。

直到前几天,我遇到了下面这个网站:

真是踏破铁鞋无觅处,得来全不费功夫

所有火车站都在,我不禁感慨了一下之前在坑里逝去的青春

简单介绍一下上面的代码,很适合初学者练手,首先将第一个网页中把各省的链接找到(province_items),提取href组成url2,再把每个省和对应的火车站数量len(trainName)存入字典中。

第二步:数据可视化

由图可以看出,从南至北火车站数量呈现递减趋势,我原本想着发达地区的火车站数量应该多一些,毕竟“要想富先修路”,但是实际并不是这样,看来东南沿海应该是水路航线多一些(我瞎猜的)。

2.画出排名前二十的柱状图

排名第一的是黑龙江,总共有302个火车站,另外我们可以发现东北三省都在前五名中,数量都在130以上,下面再深入研究一下东北三省的火车站数量。

3.画出东北三省火车站数量占比饼状图

三个省占了全国21%的比重,这个比例还是相当大的,

4.画出黑龙江省内火车站位置散点图

大家注意一下,上面热力图用的是Map函数,这里散点图用的是Geo函数,这俩是有区别的。

由图可以看出,黑龙江省内火车站相当密集,每条铁路线上火车站间隔也比较小。

03

那么为什么东北会有这么多火车站呢?

这是历史特殊时期的产物,上个世纪初期东北有丰富的煤矿资源,修建铁路主要是鬼子和毛子掠夺资源,这个就是东北三省铁路众多的主要原因。另外,东北三省虽然铁路秘籍,但是由于年代稍久了,铁路质量和规格不是很高。相对于南方来说,铁路是东北这边的主要交通工具,由于地域辽阔,修建铁路建设成本会相对较低。这就是这边有很多小火车站的原因。 

但是历史也为东北留下了一些充满文艺气息的火车站,这些火车站既有时代的烙印,也有现代的美观,下面让我们一起感受一下吧!

(亚布力南站,是我国首个滑雪场火车站,位于黑龙江省尚志市亚布力镇)

(横道河子站,西洋画里的俄罗斯城堡,位于黑龙江省海林市的横道河子)

(吉林西站,过去叫做黄旗屯站)

(旅顺站 国内保存最完整的欧式站台)

虽然我不是东北人,更没有去过以上的火车站,但是看了照片心却心生向往,以后有时间一定要亲临其境感受一下艺术的气息。

本文代码已上传,请在公众号“

python的爬虫与数据分析之路”后台输入:火车站获取

精彩回顾:

用python制作全国身份证号验证及查询系统

盘点pyhton常见的黑客技术(一)  超简单

12行python代码实现员工智能签到

北京的房价到底有多贵?我爬取了3万多条数据得出分析结果

你可能感兴趣的:(用python对全国火车站数量进行分析,发现东北三省竟然占了2成)