GIS+=地理信息+大数据——纽约出租车大数据下载

--------------------------------------------------------------------------------------

Blog:    http://blog.csdn.net/chinagissoft

QQ群:16403743

宗旨:专注于"GIS+"前沿技术的研究与交流,将云计算技术、大数据技术、容器技术、物联网与GIS进行深度融合,探讨"GIS+"技术和行业解决方案

转载说明:文章允许转载,但必须以链接方式注明源地址,否则追究法律责任!

--------------------------------------------------------------------------------------

题记

对于大数据的理解,仁者见仁智者见智,但是最起码需要一个量级的限制,例如如果你在将你的大数据有多么牛叉,但是演示的数据量在几百万条记录,几千万条记录等,其实并没有什么说服力,可以说,一个传统意义的关系型数据库都可以轻松管理上亿条记录,那么如果再进行相关的优化,几十亿条记录进行操作也没有问题,所以我们在学习或者实践我们的大数据,最起码在量级方面需要让大家信服。


这里面我们在互联网找到了一些关于大数据量及的数据,希望能够分享给各位,也希望这些数据能够为各位在大数据的研究和实践过程中提供数据支持。


元数据描述


数据介绍:来自美国纽约的出租车数据,包括空间位置信息,时间信息等属性信息。

数据格式:csv

数据字段描述:

    • medallion:UUID
    • hack_license:UUID
    • vendor_id:类型
    • rate_code:比率
    • store_and_fwd_flag:是否是四驱
    • pickup_datatime:客人上车时间
    • dropoff_datatime:客人下车时间
    • passenger_count:载客数量
    • trip_time_in_secs:载客时间
    • trip_distance:载客距离
    • pickup_longitude:客人上车经度
    • pickup_latitude:客人上车维度
    • dropoff_longitude:客人下车经度
    • dropoff_latitude:客人下车维度
GIS+=地理信息+大数据——纽约出租车大数据下载_第1张图片


数据量:11GB的文本数据

数据下载地址:http://pan.baidu.com/s/1i3QR8O1

  1. trip_data_1.csv.zip
  2. trip_data_2.csv.zip
  3. trip_data_3.csv.zip
  4. trip_data_4.csv.zip
  5. trip_data_5.csv.zip
  6. trip_data_6.csv.zip
  7. trip_data_7.csv.zip
  8. trip_data_8.csv.zip
  9. trip_data_9.csv.zip
  10. trip_data_10.csv.zip
  11. trip_data_11.csv.zip
  12. trip_data_12.csv.zip
附带说明:由于csv一般可以通过Excel打开,但是这些csv一般都在2GB左右,所有如果需要查询相关信息,建议使用专业的csv工具打开。


illumidata工具是一个不错的选择:http://pan.baidu.com/s/1i4xvCVF



你可能感兴趣的:(大数据,数据下载)