2020-04-23,第 4 期,交通数据
前几期,我们分别分享了如何进行文献检索、阅读、下载,如何了解期刊的信息,以及科研常用的网站。按照这个思路继续走下去,就到了实践的环节了。
所以,本期将为大家分享一些比较典型的交通数据。
如果你对数据敏感,那么就可以拿来写论文了。
01 国内交通数据
深圳市政府数据开放平台
https://opendata.sz.gov.cn/
该数据平台算是国内做的比较好的了,数据整理的相对比较规范。其中交通运输行业的数据包括:停车场数据、卡口过车数据、车流量数据、公交站点路线数据、营运车辆GPS数据、刷卡数据、街道实时数据、路段属性数据等等。
大家可以登录该网站,仔细探索自己感兴趣的数据集,找出点子来,早日写出SCI。
OpenITS 数据开放平台
http://www.openits.cn/
OpenITS 数据开放平台不同于深圳市政府数据开放平台,该平台更加侧重于分享真正用于科研实际的数据。例如,网站中介绍的“广州市机场高速南线(三元里至机场南路段)的抽样刷卡数据”,已经用于研究高速公路行程时间预测方法评测方法。
广州市机场高速三元里至机场南路段全长约26km,在国家高速公路网编制下,机场高速属大广高速公路的一部分。该路段行驶方向分为北行:从三元里至机场南方向;南行:从机场南至三元里方向。平沙收费站至机场收费站路段为双向八车道,其余部分为双向六车道,中三元里至平沙路段在市区范围,与市区主干道和环城高速堆叠为高架桥部分。
在 OpenITS 网站中,发布者详细介绍了:数据来源(数据介绍、数据预处理)、预测结果的评价指标选用、数据分析与比较(不同算法之间的结果比较、不同数据精度的结果比较)、资源提供单位等信息。
基本是对数据集进行了全方位分析,非常有利于大家快速了解数据结构和初步的分析思路。当然,可能部分同学觉得这个数据已经被用于发表论文了,是不是就没用了。
其实不然,同一数据被重复利用的情况非常之多,尤其是一些优质数据。切入点不同,视角不同,分析的结果就不同。所以,大家需要多看论文,看别人如何使用该数据集,然后找出研究之间的差异,才能写出属于自己的文章。
更多精彩数据,大家可以前往 OpenITS 官方网站了解。
02 国外交通数据
相比于国内交通数据管理,国外的交通数据管理制度可能更加完善,这可能是由于机动车在国外推广的更早,普及更早,使得他们更早注意收集、整理这些数据用于研究。
而对于国外,大家如果平时注意的话,数据公开做的比较好的国家一般是美国、加拿大、德国、英国等。很明显,这些国家相对我国,机动化的时期要早很多。
第一个数据集,不得不分享一个非常经典的数据库。从技术层面和学术交流学习层面,这个数据库非常值得我国交通从业人员学习。那就是:
Caltrans Performance Measurement System (Caltrans PeMS)
http://pems.dot.ca.gov/
这个数据库网站可能有些同学打不开,或者间歇性打不开,这个需要大家用点智慧了
。如果要利用这个数据,首先你需要在右上角选择并注册一个账号,然后进入系统界面。
这个数据库从图中也可以看出,是加利福尼亚州的交通大数据系统。地图上显示的交通数据是从39000多个单独的探测器中实时收集的,这些传感器跨越了加利福尼亚州所有主要都会区的高速公路。
因此,数据量非常之大、之全,大家就可以愉快的做一些传统的数据分析。当然,也可以紧跟热点,利用这个数据库试试机器学习、深度学习算法的效果。
Next Generation Simulation (NGSIM) Vehicle Trajectories and Supporting Data
https://data.transportation.gov/Automobiles/Next-Generation-Simulation-NGSIM-Vehicle-Trajector/8ect-6jqj
官方介绍:下一代仿真(NGSIM)计划的研究人员收集了详细的车辆轨迹数据,这些数据分别位于加利福尼亚州洛杉矶的美国101南行和Lankershim大道,加利福尼亚州埃默里维尔的I-80东行以及佐治亚州亚特兰大的桃树街。数据是通过同步数字摄像机网络收集的。为NGSIM程序开发的定制软件应用程序NGVIDEO从视频中记录了车辆的轨迹数据。该车辆轨迹数据每十分之一秒便提供了每辆车在研究区域内的精确位置,从而得出了详细的车道位置和相对于其他车辆的位置。
官方介绍英文版:
Researchers for the Next Generation Simulation (NGSIM) program collected detailed vehicle trajectory data on southbound US 101 and Lankershim Boulevard in Los Angeles, CA, eastbound I-80 in Emeryville, CA and Peachtree Street in Atlanta, Georgia. Data was collected through a network of synchronized digital video cameras.NGVIDEO, a customized software application developed for the NGSIM program, transcribed the vehicle trajectory data from the video. This vehicle trajectory data provided the precise location of each vehicle within the study area every one-tenth of a second, resulting in detailed lane positions and locations relative to other vehicles.
可以看出,这个数据集更加侧重于交通微观数据的收集。但是,不同于PeMS,NGSIM数据库收集的数据是微观角度的,而PeMS数据库收集的数据是宏观角度的。所以,这也暗示大家可以根据研究点的不同,可以选择不同的数据集。
NGSIM数据集广泛被科研人员使用,发表的论文相当多。大家可以以NGSIM为关键词,搜索相关论文了解大家是如何使用该数据集的。
除了以上我个人认为的优质数据外,以下链接可供大家选择交流学习:
车辆运动轨迹数据集:
https://blog.csdn.net/souvenir001/article/details/52180335
Awesome Public Datasets:
https://github.com/awesomedata/awesome-public-datasets#transportation
......
实际上,还有非常多的交通数据可供大家使用。但是,可能也有同学说没有啊,我怎么找不到呢?
那么,我告诉你一个秘密。你只要了解以上数据,用起来,你就已经找到 “数据” 了。如果你再用心一点,多搜一些自己研究领域的SCI文章,读完论文记得看看参考文献与结论之间的部分,看看作者有没有公布论文中使用的数据。
如果有,恭喜你,基本这个数据是可以公开使用的,并且是得到权威期刊认证的。
大家也要注意:正如 “山不在高,有仙则名;水不在深,有龙则灵” ,数据也不在多,用心用、用心挖掘则是好数据,希望大家可以找到心怡的数据,写出高水平的文章!