空间索引思路整理

需求:查找距离目标1000米内的餐馆
解决思路:对城市内所有餐馆(点对象)建立索引存储,加快查找速度
前提背景:POI空间分布不均匀,市中心比较集中,郊区很少

解决方案:
1、使用索引,适合建立索引的数据结构是【Hash】和【树】
2、可能索引方案包括:B树,网格索引,四叉树索引、R树索引、GeoHash
3、B树是针对一维数据【单个字段】使用,空间对象(点、线、面)是多维数据

通用二维数据解决方案(点、线、面)
1、网格索引
(1)索引实现:使用Hash数据结构实现,单位网格对应于HashMap中的一个桶,该网格关联的对象对应存储在相应桶的链表中
(2)局限性:网格索引在对象空间分布均匀时效率比较高
如果空间对象分配不均匀,那么最终会得到大量空白网格,浪费存储空间
网格尺寸不好确定,太大则索引效率低,太小则形成很多空白空格

2、普通四叉树索引
(1)索引实现:递归地对空间进行四等分,从而建立一个四叉树。通过叶节点挂接数据,并且只有叶点存储数据,根节点和中间节点不存储数据
(2)局限性:
如果空间对象分配不均匀,那么最终构造出来的是层次比较深的不均衡树,最终导致查询的效率下降
同一个对象在不同叶节点中重复存储
(3)四叉树索引改进
将地理实体信息存储在完全包含它的最小矩形节点中,每个地理实体只在树中存储一次,避免了存储空间的浪费
(4)四叉树在对象空间分布均匀时效率比较高

3、R树索引
是B树在高纬空间的扩展,是一棵平衡树。R树采用了空间分割的理念,具体是使用“最小外包矩形”,从叶子节点开始用矩形将空间框起来,节点越往上,框住的空间越大,以此对空间进行分割。

思考:四叉树索引和R树思路是相反的?一个是从上到下递归划分空间,另一个是从下往上递归划分

将二维数据转换为一维数据的解决方案GeoHash(适合于点对象)
(1)索引实现:分别根据点对象的经度和纬度分别进行【区间划分】到【符合一定精度的程度】,分别编码,然后合并,最后进行base32编码得到可以比较的字符串编码
例如wx4g0ec1,它的前缀wx4g0e表示包含编码wx4g0ec1在内的更大范围。 这个特性可以用于附近地点搜索。首先根据用户当前坐标计算geohash(例如wx4g0ec1)然后取其前缀进行查询 (SELECT * FROM place WHERE geohash LIKE ‘wx4g0e%’),即可查询附近的所有地点
(2)GeoHash编码表示的是矩形区域,而不是具体点;该矩形区域内的所有兴趣点拥有相同的编码

地理围栏
地理围栏(Geo-fencing)是LBS的一种应用,就是用一个虚拟的栅栏围出一个虚拟地理边界,当手机进入、离开某个特定地理区域,或在该区域内活动时,手机可以接收自动通知和警告
实现思路:首先对地理围栏(多边形)建立R树索引,以便能快速找到覆盖目标位置的外包矩形(进而定位到多边形围栏),然后再依据射线法判断点是否在多边形内部

参考:http://blog.csdn.net/zhouxuguang236/article/details/12312099
http://blog.jobbole.com/80633/
http://www.cnblogs.com/LBSer/p/3403933.html

你可能感兴趣的:(数据结构和算法)