智能数据工程第一次作业

智能数据工程试验报告

  • 学院:
  • 专业:
  • 姓名:
  • 学号:

[作业要求](作业要求.md)

一、项目名称

共享单车轨迹数据助力城市合理规划自行车道

二、项目任务和问题

       共享单车的出现为人们提供了一种便利的自行车共享方式,用户可以轻松地在任何地方使用智能手机来实现自行车的租借服务。自行车重返上路,成为城市用户喜爱的出行方式。以摩拜单车为例,目前它已拥有超过1亿注册用户,日订单量约2500万。政府也非常愿意在群众中推广共享单车的使用,因为共享单车可以降低城市的道路拥堵,减轻空气污染,提高公共交通的使用效率,健康出行。

       目前的自行车道建设却没能跟上共享单车所带来的新的骑行需求。如果没有良好的自.行车道规划,很多时候骑行的人们只能和机动车一起使用机动车道路,使人们的骑行体验大打折扣,还可能产生潜在的交通事故。因此,政府希望能够规划出更有效的自行车道来提升大众的骑行体验。

       自行车道的规划存在一定的要求和限制:建设每条专门门的自行车道都需要消耗一定的资源,如政府预算和道路空间等;自行车道作为-种公共资源,政府希望它能够更好地服务更多的人,并覆盖更长的个人骑行轨迹;为了施工和管理的便利,政府更希望这些道路的建设能够在整个路网上连成有限个区域,而不是在整个城市中分散的分布。若已获取摩拜单车的用户在使用过程的历史记录(非常有价值的轨迹信息),真实地反映了人们的骑行需求,如何利用大数据和数据挖掘技术更有效、合理地规划自行车道的建设?你的思路是什么?

三、 基本思想和关键技术

(一)、问题背景

       共享单车的出现极大地解决了人们共同面临的“最后一公里”难题。然而,在共享单车发展迅猛的时代背景下,自行车道建设以及城市规划却始终没有能够跟上脚步。
骑车,在过去的汽车时代,已经是被人们逐渐舍弃的一种出行方式,但在低碳绿色倡导的当下,骑车又被推崇而出,略过公交、地铁等常见火热的交通方式,形成一股复古的潮流。

       早在上世纪七八十年代,中国曾被称为自行车大国。当时,大多数人的出行都依赖于自行车,以至于自行车成为了中国当时结婚所要求的“三大件[1]”之一。随着经济的快速增长,越来越多的私家汽车进入了普通民众的生活,成为普通群众出行不可缺少的一部分,为大众的出行带来了极大的便利。但随之而来的却是各种城市问题:交通拥堵、空气污染等等。

       共享单车的出现为人们提供了一种便利的自行车共享方式,用户可以轻松地在任何地方使用智能手机来实现自行车的租借服务。于是自行车重返上路,成为城市用户喜爱的出行方式。以摩拜单车[2]为例,目前它已拥有超过1亿注册用户,日订单量约2500万。政府也非常愿意在群众中推广共享单车的使用,因为共享单车不仅仅可以降低城市的道路拥堵,减轻空气污染,还可以提高公共交通的使用效率,对人们的出行方式来说也是更加健康的。而这里,又不得不提出共享单车,在共享经济这个大环境下,共享单车的蜂拥而至,是共享经济满足交通出行需求的市场反应,是城市公共交通短板的折射,是人与车争夺城市空间资源的表现,更是对城市治理能力的测试。单车虽小,却是对城市规划、建设、管理的全面检视,也是政府面对新经济回答如何实现科学监管的问题。

       但是,目前的自行车道建设与共享单车的骑行需求确实非常不匹配的。如果没有良好的自行车道规划,很多时候骑行的人们没有可选的合适道路,只能和机动车一起使用机动车道路,这不仅使人们的骑行体验大打折扣,并且还可能产生潜在的交通事故。因此,政府希望能够规划出更有效的自行车道来提升大众的骑行体验。
在一定意义上,共享单车的善治既是城市经济结构优化升级的结果,也是城市治理能力提升的表现,更是智慧城市建设惠民利民的真切体现。

       共享单车停放将会占用城市公共空间,作为一种正常的、合理的空间需求,单车是有权利得到安放的。单车是以满足更多人绿色出行需求的交通工具,原有的城市空间规划没有为新型交通活动预留空间,特别是没有坚持以人为本、步行友好、交通通达的设计理念,过度追求大马路、大广场、大社区,忽视了城市微循环的功能发挥,导致公共空间无法满足居民频繁交往和慢行交通的需求。

       幸运的是摩拜单车大量的轨迹数据为我们提供了一种新的思路:利用大数据和AI技术,使用以数据为依托,在数据驱动的方式下更为合理地规划自行车道的建设。

(二)、共享单车对城市街道的影响

       共享单车的诞生与推广,对机动车出行方式带来了极大影响,共享单车出行在城市交通出行中占比的提升,也影响到城市街道的秩序和美观。共享单车对城市街道的影响主要表现为3方面[3]

1、共享单车乱停乱放,对城市街道有序运行造成不利影响

       作为一种公共资源,共享单车被赋予了自由停放的“特权”,对用户停放共享单车行为缺乏有效的约束,共享单车停放在非机动车道、人行道上,甚至有的停放在机动车道上。将共享单车停放在非机动车道上,会造成非机动车、摩托车等车流对机动车道的挤压,使交通运行速度放缓;将共享单车停放在人行道上,会使行人通行空间受限,挤压非机动车道,最终造成非机动车为避让行人而占用机动车道,进而造成交通拥堵

2、共享单车用户交通安全意识不足,致使交通事故频发

       共享单车在为人们出行带来便利的同时,也存在一定的安全隐患。不仅会造成人身伤害,还助长了破坏公共财产的不良社会风气;一些有故障的共享单车未得到及时维修,使用户骑行存在安全隐患,引发交通事故

3、共享单车比例增加,降低城市街道交叉口通行效率

       由于出行方式的转变,共享单车对城市基础设施提出了新的要求,需相应调整街道信号灯的时长,以满足单车出行方式带来的通行效率问题。

(三)、共享单车发展下的城市街道设计基本思想

       自行车道的规划需要综合考虑多方面的因素:

       预算限制:主要包括政府财政预算以及城市给自行车的余留空间大小
便于施工和管理:施工队需要派遣到各个不同的地点铺设自行车道,为了便于管理,通常倾向于使这些车道集合成k个聚类的区域,而不是大面积分散的形式
提高自行车的使用率:从政府的角度来说,希望良好规划的自行车道能提高自行车的可用性,以及覆盖更多的区域

       共享单车规划设计,可从以下3方面着手。

1、通行空间设计

       通行空间设计标准在共享单车通行空间设计过程中,不仅要遵循设计速度、最低宽度、街道坡度等设计规范标准,还要充分考虑街道周边环境,在通行需求大的骑行前提下,自行车道应设计为直线型,以此达到缩短通勤距离及时间的目的,并确保骑行不受树木等视线盲区影响,如主要城市道路;在景观需求的大前提下,则以休闲骑行为设计出发点,将自行车道沿街道两侧绿化长廊设计,在保证通行的前提下设计为曲线型,使开放与隐蔽空间有效结合。

1)、车道宽度

       自行车道宽度及隔离方式通常情况下,单人骑行时的宽度在0.6m左右,同时还应考虑骑行时的动态距离,通常取左右两侧活动空间各0.2m,进而设置自行车道宽度为1m。

2)、车道影响因素

       自行车道宽度在一定程度上还受机动车速、自行车流的影响,为减轻机动车速对共享单车的影响,自行车道宽度应与机动车道设计速度呈正相关关系。

2、停放空间设计共享单车停放空间设计可从以下方面着手。

1)、扩大停放空间

       满足合理规模共享单车的停放需求。可供共享单车停放的区域空间包括公交车站、地铁车站、公共建筑内部等。

2)、考虑公共设施

       在公交车站对共享单车停放空间进行设计时,可于公交车站就近建设共享单车停放设施,共享单车不可停放在公交站台候车区,且共享单车停放区距离公交站台路缘线单侧距离应控制在5m以上,并结合绿化带间隔建设共享单车停放设施,确保不影响公交站台候车空间

3、城市街道配套设施设计

1)、功能性标识清晰

       容易辨认,满足人们在骑行过程中观察、感受的需求。

2)、保证美观性与环境相协调性,观赏性,

       借助现代技术,依托对共享单车信息数据的采集分析,构建数据库,为共享单车的监管管理提供有力依据,打造智慧城市。

3)、重视信息采集

       重视对骑行者和行人的信息采集能力在以机动车为主导的城市街道环境下,机动车行车人员通常难以过多关注街道两侧的各种信息,因此大多数街道设计均是以机动车行车人员的信息采集能力而开展,疏忽了对骑行者、行人的信息采集能力。

三、基本思路和关键技术

(一)、研究思路

       在街道设计中,应加强对速度及停留行为的有效考虑,以实际的骑行行为和街道环境建构线性回归模型,反推环境对骑行行为支持的程度,并确定两者之间的关系,用骑行需求、骑行环境、骑行行为三者建构可骑行性评估,对街道环境进行评估。

       共享单车使用特征进行分析;其次选取影响骑行行为的各种环境指标,对建成环境与骑行行为之间关系建立线性回归模型进行分析,以确定影响骑行行为的指标、指标对骑行行为的贡献能力和解释强度;最后,将影响骑行行为的指标进行整合,用骑行需求、骑行环境、骑行行为对街道进行可骑行性评估,如图


图1.jpg

       骑行需求主要是控制街道之间由于需求差异造成的误差,当骑行环境与骑行需求均较高时,街道的骑行环境才是优越的,且因为空间自相关作用,街道的骑行行为受周边街道的骑行行为影响较大,因此在对街道骑行环境测度时应将骑行需求和周边街道的骑行行为考虑在内。街道道路的横断面属性,如道路等级、是否机非分离等均对骑行的舒适性有一定的影响,而街道上的基础设施和街道两侧的业态所隐含的信息,均可能是骑行的阻碍因素。

       骑行行为可分为骑行频次、骑行时间和骑行速度等,由于不同街道其骑行速度的差异性较小,无明显的街道环境偏好。街道被所有骑行者骑行经过的次数,考虑不同时间段街道的骑行量差别较大,对骑行频次进行全时间段分析会掩盖不同时间段内骑行频次与街道环境之间的关系,结合对不同骑行需求下的骑行环境速度对骑行行为进行分析
       可以用线性回归模型的系数代替权重值,对骑行环境进行评估,对骑行行为与街道环境建构回归模型,找出街道环境中对骑行行为有影响的指标,以这些指标的回归模型系数作为可骑行性评价体系中各指标的权重,可骑行性评价体系分骑行需求、骑行环境以及骑行行为,为方便观察三类指标对街道环境的贡献程度。

(二)、关键技术

       “PlanningBikeLanesbasedonSharingBikes’Trajectories”论文中,我们提出了一个基于贪心思想的近似解法,来实现自行车道规划方案的推荐。该算法包括两个步骤:1.基于路网距离的空间聚类;2.基于贪心的网络扩展(GreedyNetworkExpansion)。

1、算法的过程

1)首先需要寻找到k个贪心网络的起始片段

       我们可以直接选择效益函数在top-k高的k个片段作为起始片段。经过对数据集的研究,发现在共享单车轨迹起点密集处一般分布在在像大型商场这样离地铁较远的地方,被称为空间热点,而往往效益函数高的地方就在这些空间热点附近)这种方法非常直接而简单,但是,top-k高的片段往往容易集中在一起,不能很好的扩张,因此,我们采用自下而上(其实自上而下应该也是可以的)的层次空间聚类来帮助选出最合适的贪心网络起始点。

       层次空间聚类和K-means不同,它在确定的层级总会产生稳定的结果。为了简化计算,我们首先还是需要筛选出那些效益函数排名较高的路段,作为聚类的基本元素

2)接下来执行层次空间聚类算法

       接下来执行层次空间聚类算法,它每次都合并距离最近的两个聚类。由于这里明显用的是欧式距离,因此我们可以把聚类的中心点作为簇的位置来计算欧式距离。执行这个算法得到k个聚类,再从每一个聚类中选择效益函数最高的路段,这样我们就能得到更加“均匀分布”的贪心网络起始点

2、算法评价指标

       在第一步计算中,我们首先根据用户在各条道路上的骑行数据选出Top-M条用户骑行最频繁的候选路段,然后利用这些路段之间的距离进行层次空间聚类,每次我们都合并两个路网距离上最接近的路段聚类,并知道最后的结果只剩下K个聚类。最后在每个聚类(cluster)中,我们会选择骑行最频繁的路段作为下一步贪心网络扩展的起始点。

       在第二步的计算中,每一次我们都将这些起始路段的邻接路段作为候选集合,然后检验每一个候选路段所能够带来的单位长度上所有轨迹分数的提升。接下来,我们每一轮都选择能够给现有方案带来最大提升的路段作为结果,直至预算被使用完每条轨迹都会为新的路段给出一个得分


2.png

       segs(τ)表示这条轨迹被我们的建设方案所分成的连续的段数,s.l表示每一段的长度,而α则是一个调节参数,当该数值越大时,更多的分数就会被给予更连续的规划方案,因为在连续的自行车道上骑行会有更好的体验。

四、数据集和评价指标

(一)、数据集

       数据来源于某共享单车品牌用户骑行轨迹的 1%的随机抽样数据,数据中包含用户 ID、共享单车 ID、唯一编码 ID、起点坐标、终点坐标、起点时间戳、终点时间戳以及轨迹点八类属性,具体如表所示


共享单车数据示例

此外,还需要建成环境数据,例如土地利用数据、归一化植被数据、城市街道数据等。

(二)、评价指标

       评价机制的构建以普世性、整体系统、强实践性为关键,这是评价过程能够顺利完成的基础。全域自行车交通系统评价所包含的层次内容多、范围广,其公平性评判标准涉及影响要素复杂,因此,建构一个综合、完整、系统、便捷、科学合理、可操作性强的评价机制,才能为其发展、规划运行与管理下的社会公平提出可靠的依据。因此,评价机制的成立应该以几下几点原则为基础。

1、普适性原则

       本文的研究希望建立一个可以为以后道路交通基于公平性下的服务水平提供评判依据的机制,可以直观的反应使用者想评价的每一个地区,具有普世性,对未来建设提供评价依据。

2、整体性原则

       公平视角下的全域自行车交通系统评价机制是一个以宏观为导向的超多层级完备的评价系统,包含若干相互平行、相互补充由相互作用的因素,因而要以整体为考量的尺度,更能全面地评价和反映问题。虽然本研究是以遵循公平标准为导向,具有些许的主观倾向性,但是要尽量减少其中的干扰因素,要从多角度反映、客观地表述对象的特点,能够完整描述全域自行车交通系统的公平性,综合各单项标准,对城市或区域进行整体性评判。

3、强实践性原则

       构建的评价机制是一个具有普适性的体系,因而务必确保其具有较强的可操作性,同时必须保证其评价标准具有实际操作的功能,其中评价标准的选择不宜过于繁杂,结果的产生要具有实际意义,并可以对未来建设及优化提供强有力的实践依据。


评价体系.JPG

五、分析和测试结果

(一)、分析

       通过对研究区域和数据的处理,得出完整的共享单车骑行数据。在对骑行行为与骑行环境建构关系时应先对骑行行为的特征进行分析,先从整体上对骑行行为进行特征描述,其次对骑行行为进行时空间分布特征,最后对骑行需求和骑行环境各指标进行分析。

(二)、测试结果

       骑行频次是从骑行量上对街道环境进行评价,是对街道环境中各种量指标及其街道设施、周边街道的关系的反映,同时骑行频次受骑行者的出行需求和目的影响较大。通过对以上回归结果的分析,各时间段的街道骑行频次与骑行者的出行需求、道路等级、交叉口个数均相关,受街道的空间自相关影响,周边街道的繁忙度对街道的骑行频次有一定影响。未发现骑行频次与街道两侧就业店铺数量的相关性。结合前小节对各时间段回归结果的分析,得出以下结论:

1、街道骑行频次与街道道路等级、道路横断面属性等相关性较大

       通过回归模型分析发现,街道环境中的道路等级、植被覆盖率、道路坡度、是否有自行车道、街道道路的路面质量、街道人行道铺装质量、土地利用多样性、街道两侧休闲店铺的数量均对骑行行为有影响。

2、街道骑行频次与骑行者的出行需求相关性较大,

       共享单车是以需求为导向的交通方式之一 从所有时间段的回归模型系数表可以看出,通勤类出行需求、休闲类出行需求、站点类出行需求、交叉口个数、周边街道骑行频次均对骑行行为有影响。骑行起讫点的出行需求与街道骑行频次呈正相关关系,即居民的出行需求越大,骑行频次越高。骑行需求是通过用地间的功能互补性得出的,即工作时间段出行行为发生在功能互补性较高的街道之间,即两地之间的互补性越高时,联系强度越高,骑行的频次越高。因此,未来对骑行环境改善时应考虑骑行需求的差异对街道环境的影响,如骑行需求大的街道应布置更完善的自行车设施。

3、街道路面质量良好的街道,对骑行行为有吸引力,

       仅工作日早晚高峰发
可以看出街道道路的路面质量越好,街道的骑行频次越多。因龙岗区的自行车道较少,大多数人行道的宽度和铺装质量均不有利于骑行,因此居民多在机动车道上骑行,道路路面质量越好的街道,道路等级越高,基础设施越完善,而道路路面质量较差的街道,骑行需求较少且骑行舒适感较差。

4、人行道铺装质量对街道骑行频次有促进作用

        有人行道的街道相较于没有人行道的街道对骑行吸引力较大,且人行道铺装越完善,人行道宽度越宽,街道的骑行频次越高。

六、结论和讨论

       我国越来越重视城市生态文明的建设,颁布了一系列政策推动生态发展,而自行车作为绿色环保的出行方式正是顺应了这种趋势,许多城市都开始注重全域层面自行车交通的发展,从网络建设的完善到增设自行车专用道再到高速自行车道网络的布局,都能看出未来城市交通的发展方向;同时自行车的使用人群正在迅速增加,也兼顾了通勤、休闲、娱乐、健身、体验等多种功能,相信在民意与政策的双重推动之下,我国未来全域自行车交通的发展将会朝着更加公平公正的方向发展,将会越来越好。

参考链接

[1]三大件(完成某事的三种重要物品)_百度百科(baidu.com)

[2]美团单车_百度百科(baidu.com)

[3]刘琪.共享单车发展下的城市街道设计研究[J].城市住宅,2020,27(02):202-203+205.

[4] 常新. 基于共享单车轨迹数据的城市街道可骑行性研究[D].哈尔滨工业大学,2020.

[5] Jie B , He T , Ruan S , et al. Planning Bike Lanes based on Sharing-Bikes' Trajectories[C]// KDD. ACM, 2017.

[6] https://hustdanielhu.com/post/kdd2017-planning-bike-lanes-based-on-sharing-bikes-trajectories-%E8%A7%A3%E8%AF%BB/

[7]https://mp.weixin.qq.com/s?__biz=MzAwMTA3MzM4Nw==&mid=2649441578&idx=1&sn=7250a6603adaf9137d3987b01b4683d8&chksm=82c0acaeb5b725b865917e39377f217a3045677206a0b7e7cff6ea13aa6083fa11b820f4b52f#rd

你可能感兴趣的:(智能数据工程第一次作业)