--------------------------------------------------------------------------------------
版权所有:超图研究所(www.supermap.com)
Blog: http://blog.csdn.net/chinagissoft
QQ群:16403743
宗旨:专注于"GIS+"前沿技术的研究与交流,将云计算技术、大数据技术、容器技术、物联网与GIS进行深度融合,探讨"GIS+"技术和行业解决方案
转载说明:文章允许转载,但必须以链接方式注明源地址,否则追究法律责任!
--------------------------------------------------------------------------------------
题记
对于大数据的理解,仁者见仁智者见智,但是最起码需要一个量级的限制,例如如果你在将你的大数据有多么牛叉,但是演示的数据量在几百万条记录,几千万条记录等,其实并没有什么说服力,可以说,一个传统意义的关系型数据库都可以轻松管理上亿条记录,那么如果再进行相关的优化,几十亿条记录进行操作也没有问题,所以我们在学习或者实践我们的大数据,最起码在量级方面需要让大家信服。
这里面我们在互联网找到了一些关于大数据量及的数据,希望能够分享给各位,也希望这些数据能够为各位在大数据的研究和实践过程中提供数据支持。
元数据描述
数据介绍:来自美国纽约的出租车数据,包括空间位置信息,时间信息等属性信息。
数据格式:csv
数据字段描述:
数据量:11GB的文本数据
数据下载地址:http://pan.baidu.com/s/1i3QR8O1
illumidata工具是一个不错的选择:http://pan.baidu.com/s/1i4xvCVF