数据挖掘中基于经纬度度距离计算

传统的数据挖掘算法中计算空间邻近关系R使用的是欧几里德距离其中d为距离阈值,这里的距离都采用长度单位,而当实例为坐标点x,y坐标经纬度值时,如果还采用欧几里得距离公式,计算出的两个实例间距离s与我们给定的距离阈值d的单位无法统一。

根据两个实例的经纬度坐标直接计算两实例间的实际距离,此方法能较准确的计算出两实例间的实际距离,误差较少,为了计算方便,将地球看作是一个完美的球体,那么它的半径就是地球的平均半径,记为R,根据任意两点的经纬度就可以计算出这两点间的距离。假设A点经纬度坐标为(LonA,LatA),B点的经纬度坐标为(LonB,LatB),则计算两点间的实际距离公式表达如下:

其中R,表示地球半径赤道的平均半径取6371.004km,Pi取301415926。

你可能感兴趣的:(数据挖掘)