Hadoop中空间数据的存储(二)

       在前一节中,我们讲解了空间数据在Hadoop中的存储,通过将块进行可视化来分析了下Hadoop在存储空间数据的缺陷,可能远远不止这一点。今天我们就基于比较完善成熟的SpatialHadoop平台做一下同样的实验,来看下在SpatialHadoop平台中如何体现空间数据的特性。SpatialHadoop平台是由美国明尼苏达大学计算机系(提到这个大家是不是很熟悉,曾经的mapserver)Mokbel教授所带团队研发,目前平台持续更新中。

       接着上一节。

       实验准备:

                  1、数据集:全国县级行政单元(约148MB)

                  2、实验环境:SpatialHadoop2.3

       数据都是一样的。在SpatialHadoop中,数据被分为了四部分。这里我们先不去纠结为什么分为四部分。在下一节的空间索引中我会具体介绍。我们直接看下数据被切分后的结果。这里的结果少几个字段,被我删掉了,忘记保留原本了,会在下一节中体现。这里我们可以看到四个多边形,这是四个块的外包矩形,后面还有四个块的大小,包含多边形个数等要素,一看就知道是索引,下节来看下吧。

你可能感兴趣的:(大数据技术篇,SpatialHadoop,GIS系统开发,Hadoop代码编写)