GeoHash算法获取附近店铺和距离

1. 简介

GeoHash算法将二维经纬度坐标直接转换成字符串,每一个字符串代表一个矩形区域,也就是说,这个矩形区域内所有的点(经纬度坐标)都共享相同的GeoHash字符串,字符串的长度越大,矩形的区域就越小,经度也就越高。字符串相似的表示距离相近,这样可以利用字符串的前缀匹配来查询附近的POI信息。

2. GeoHash算法

地球纬度区间是[-90,90],经度区间是[-180,180],通过区间法对经度和纬度分别进行计算,假如我们获取到的当前坐标为经度-0.12866, 纬度38.534413,以纬度为例:

  • 将纬度平均分成两个区间:[-90,0),[0,90],成为左区间和右区间,可以判断出38.534413属于右区间,则值为1,(如果属于左区间则值为0);

  • 接着将右区间继续划分,就变成了[0,45),[45,90],此时,38.534413属于左区间,则值为0

  • 递归上述过程,则区间的值会越来越逼近38.534413

  • 随着算法的进行,我们将会得到一个序列,序列的长度跟递归的次数有关,但是一定要保证的是经度和纬度的序列长度是一样的,我这里设置的递归长度是30,经度和纬度加起来就是60,

  • 根据算法我们最终得到经度的序列为
    [0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0,0],
    纬度的序列为
    [1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1,0],然后我们根据此序列再组合一个新的序列偶数位放经度奇数位放纬度,把2串编码组合生成新串[0, 1, 1, 0, 1, 1, 1, 1,1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0,0],实际上这个序列是一串二进制

  • 最后,我们将这个新串转换成十进制再使用0-9、b-z(去掉a, i, l, o)(base32编码)对这组十进制进行编码得到的字符串eyzgjnfr4p0p就是最终的GeoHash编码。

关于base32编码

GeoHash算法获取附近店铺和距离_第1张图片
编码会去掉两种情况:
(1)元音,去除元音防止密码泄露,增加可靠性。如:hello world -> hll wrld
(2)容易混淆的字符,如:[1, I(大写i), l(小写L)],[0,O]

Base32解码:
GeoHash算法获取附近店铺和距离_第2张图片
GeoHash算法利用Base32将全球划分成32个大的区域块。
GeoHash算法获取附近店铺和距离_第3张图片
hash值转换成经纬度:
GeoHash算法获取附近店铺和距离_第4张图片
GeoHash算法获取附近店铺和距离_第5张图片
字符串越长,表示的范围越精确。5位的编码能表示10平方千米范围的矩形区域,而6位编码能表示更精细的区域(约0.34平方千米)。
a)在纬度相等的情况下:

经度每隔0.00001度,距离相差约1米;

每隔0.0001度,距离相差约10米;

每隔0.001度,距离相差约100米;

每隔0.01度,距离相差约1000米;

每隔0.1度,距离相差约10000米。

b)在经度相等的情况下:

纬度每隔0.00001度,距离相差约1.1米;

每隔0.0001度,距离相差约11米;

每隔0.001度,距离相差约111米;

每隔0.01度,距离相差约1113米;

每隔0.1度,距离相差约11132米。

其他base64编码.
GeoHash算法获取附近店铺和距离_第6张图片
我们将二进制编码的结果填写到空间中,当将空间划分为四块时候,编码的顺序分别是左下角00,左上角01,右下脚10,右上角11,也就是类似于Z的曲线,当我们递归的将各个块分解成更小的子块时,编码的顺序是自相似的(分形),每一个子快也形成Z曲线,这种类型的曲线被称为Peano空间填充曲线。

这种类型的空间填充曲线的优点是将二维空间转换成一维曲线(事实上是分形维),对大部分而言,编码相似的距离也相近, 但Peano空间填充曲线最大的缺点就是突变性,有些编码相邻但距离却相差很远,比如0111与1000,编码是相邻的,但距离相差很大
GeoHash算法获取附近店铺和距离_第7张图片

3. 查找topK近的店铺

GeoHash算法获取附近店铺和距离_第8张图片
在上图中查找A点附近的点时,由于A点和C点是在同一个区域内,根据GeoHash算法认为A点附近只有C点,没有B点。但是实际上B点离A点甚至要比C点还要近,为了取得更精确的结果,除了目标点的GeoHash值外,还需要使用A点周围8个区域值的GeoHash值。


参考:

  1. base32;
  2. Geohash;
  3. GeoHash算法获取附近店铺和距离;
  4. 作者:NilMe;
  5. GeoHash核心原理解析;

你可能感兴趣的:(算法)