Divvy共享单车数据分析

本篇文章的灵感主要来源2017武汉市共享单车出行报告内容解读的炫目的展示。诸位想观看该报告的话可以点击上述链接。

  其实我不是故意鸽了那么久的。这距离我上次的文章已经快一年了。但是我不是故意的。。。主要是由于我最近要学习很多黑科技所以就把都给忘了。。以后争取做到两周一更新。好了好了。言归正传。接下来就步入正题。
  老套路。我们先分析一下原始数据集。

原始数据集.png

  看到这些数据集是不是感觉一脸懵逼。。那么我先解读一下这些数据集的列名。‘from_station_id’和‘to_station_id’:表示用户骑车的起点和终点。‘from_longitude’,‘from_laitude’,'end_latitude',‘end_longitude’:表示用户的起点和终点的经纬度。参照2017武汉市共享单车出行报告内容解读 我们可以做一下自己想要的需要展示。
  首先现在总共有五年的历史数据。那么我想看一下Divvy单车在这五年中的站点(不知道怎么说能懂。。emm....就是类似巴士站之类的站点)。那么通过编程和分析可以做出如下的图表。
stations描述.jpg

  这些密密麻麻的点就是所谓的站点。那么我们可以得知绝大多数站点都是在2013年建立的。而且2017年几乎没有新的站点兴建。
  有个问题大家应该想知道。譬如如果我们身处北京三里屯站。那么我们是否想知道有多少人从北京三里屯站骑单车跑路了。还有他们都跑到哪里去了。甚至想知道他们之中有多少人去往相同的地方。那么这个问题就有点像百度曾经展示的牛逼哄哄的人口迁移问题。那么接下来我们还是利用编程,但是此处利用echarts模板制作一个站点的迁移图:
站点迁移.gif

  可以看到站点名为177的具有很大的权重这也表示很多人从三里屯站骑车跑到了这里。具体该名字叫什么可以看一下原始数据集,在原始数据集中都有其描述。

   还有一个问题大家应该很感兴趣。那就是早晚高峰期共享单车的分布情况。那么根据现实情况我制作了热力图来展示早晚高峰期自行车的分布情况。
早高峰.gif

  其实呢由于这是芝加哥的地图显示,我也不太清楚其城市的流行度。但是从分布可知。该城市的单车分布是集中式分布。也就是说越红的区域范围表示该地区的单车分布约集中。
晚高峰.gif

  接下来就是晚高峰时期的热力图分布。仔细看一下其实分布差别并不是很大。这也说明一个情况,就是共享单车的活动范围比较集中,而且该集中范围的地区应该也是该城市的有名的地区。。。这点应该很容易理解。

  那么拿到了如此之多的历史数据,我们也可以做一下其他的数值分析,譬如。共享单车每日被骑了多少次(别想多。。。)。
共享单车每日.png

  由于小编太懒。也是有一部分数据量太大的缘故(搞起来太费时)所以我只统计了2017年第一季度的数据。从图中可以看出来2017-02-20至2017-03-06是Divvy单车高峰时期。有可能说明其在该时段成长成为了巨头。。。。。!!!!但是接下来的时间段又恢复了平均状态。。那么这也有可能说明这家公司有可能干了什么惹人怒的事情了。。。纯属猜测。。。(如有雷同纯属巧合。)
  那么再统计一下一周中周几被骑的次数最多呢?好的。接着画图。。
每周出行.png

  从图中显示周一到周五单车的出行量很大。而周六周日的出行量相对较少。。不难理解吧各位。。。工作日呀。。。得工作呀。。周末呀。。。得睡觉呀。 能睡觉谁想去骑车。。。这肯定是为什么周末单车量较少的原因。。(by the way 我觉得。。是)。
  接下来再看一下骑行60分钟以内的人的统计。其实再原始数据集中也不乏很多人连续骑了1天一夜的。但是毕竟少数。更何况我就是只想统计60分钟以内的人。。(就是那么傲娇)。。。
骑行统计.png

  从图中可以看出骑行5-13分钟的人居多。。这很符合国家以前的号召“解决人们最后一公里的路程”。。所以这也是很容易理解的。一公里撑死5分钟也骑到了。。如果13分钟还不能骑到的话。。那么你可以去医院检查检查了。。。
  好了好了。今天就先分析到这里吧。。其实还有很多点可以分析。譬如骑行公里数的分析。和目的地的分析。但是由于时间仓促。就没弄太多。。。祝大家看的愉快。。。由于代码量比较大这次就没有同往常一样边写代码边写图了。如果各位想要代码和数据的话可以联系我。。我看到的话就会发。如果单纯想要数据的话。那就直接点击Divvy共享单车数据集就可以了。
  最后一句:祝各位周一快乐。。(阴险脸。。。)

你可能感兴趣的:(Divvy共享单车数据分析)