矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)

思路参考

思路参考文章:GIS算法基础——矢量数据压缩道格拉斯普克压缩算法(非递归实现)

GIS算法基础——矢量数据压缩道格拉斯普克压缩算法(非递归实现)_RookGISer的博客-CSDN博客

Douglas-Peucker 算法是矢量数据压缩经典算法,算法的基本思想如下:

假设组成曲线的顶点集合为 P1、P2、…Pn,假设 P1、Pn为曲线的起始点和终止点,将其虚连成一条直线, 计算曲线内点 Pi(i=2,3,…,n-1)到直线 P1Pn的距离 Di,通过比较距离的大小得到距离最大对应的点 Pk, 判断 Dk的值与预先给定的阈值之间的大小关系。若小于阈值,则舍去曲线上的全部中间顶点;反之,若大于阈值,则保留点 Pk,并以该点为界限,将首尾两点分别与该点虚连成一条直线,形成两条新的直线段 P1Pk 和 PkPn,再重复上述的步骤确定下一批压缩后的保留点。并以此类推,直到两端点之间的曲线上的顶点到两端点虚连成的直线的最大距离小于阈值为止。

图示:

Step1:

矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)_第1张图片

假设有五个点,首先连接首位,即P1-P8,找出中间各点到该直线的最大距离,从图中可以看出,P3到直线P1P8的距离最大。

***当Step1的最大距离dmax 小于 阈值 时,舍弃直线中的所有点,只保留直线两个端点。

Step2:

dmax 大于阈值,则将该点(获取最大距离的点)作为端点,重复操作,寻找dmax与阈值进行对比。若小于阈值,则将点舍弃。

矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)_第2张图片

通过上述操作,最终可实现数据的压缩。

递归实现思路:

1、计算出直线的方程。

2、遍历各点到直线的距离,保存最大距离与其点的索引,判断其与阈值的关系

     a.若小于阈值:则该直线作为压缩后的数据。

     b.若大于阈值,则该点将直线分为两段,AC  CB

3、重复2的操作。

4、得到结果。

递归伪代码:

def rdp(points, epsilon):
    dmax = 0.0
    index = 0
    for i in range(1, len(points) - 1):
        d = point_line_distance(points[i], points[0], points[-1])
        if d > dmax:
            index = i
            dmax = d

    if dmax >= epsilon:
        results = rdp(points[:index+1], epsilon)[:-1] + rdp(points[index:], epsilon)
    else:
        results = [points[0], points[-1]]

    return results

非递归思路(参考思路文章):

首先不使用递归,但是要做到将每个点都遍历一遍,选出最大距离的点,要对两端再进行遍历。参考文章作者提供了思路,采用“出栈入栈的操作”来实现非递归算法。

依旧以上面的图作为例子来讲解

矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)_第3张图片

Step1:

建立两个空栈,将首尾两个端点分别放入AB两个栈中。

矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)_第4张图片

Step2:

从直线中找到最大距离的点dmax(判断其与阈值的关系,若小于阈值,则直线为压缩后的数据),其索引为point3,将其放入栈B中。

此时,直线的端点从18 变为了 13 

我们再次执行Step2的操作,所找到的最大距离就是13直线之间的最大距离了。

矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)_第5张图片

Step3:

若13之间的点的最大距离小于阈值,则B的顶端,出栈,将其放入A栈中。

矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)_第6张图片

之后在进行Step2的操作,所求的就是直线38之间的点。

直到最后,将B栈中的所有点都压入A中,算法结束。A栈中的点即为最终的点。

(写得不是很清楚,如果不明白可以参考首行文章,或者评论)

python伪代码

def RDP(Points,threshold):
    RDPFinout = []
    if(len(Points)<=1):
        RDPFinout = Points
        return RDPFinout
    # 读的数组的长度
    IndexsFin = len(Points)
    # 创建两个数组记录索引
    A = Stack()
    B = Stack()
    Maxindex = IndexsFin - 1
    # 将首位两个点坐标入栈
    A.push(0)
    B.push(Maxindex)
    #############
    while B栈不为空:
        maxDistanceIndex = findMaxdistanceIndex(Points, A.top(), B.top())
        maxDistance = findMaxdistance(Points, A.top(), B.top())
        if(maxDistance > threshold):
            #大于阈值
            B.push(maxDistanceIndex)
        else:
            #小于阈值
            A.push(B.pop())
    ###############
    while A栈不为空:
        #输出结果,存放到数组中
        RDPFinout.append(Points[A.pop()])
    return RDPFinout

实验:

原图:

矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)_第7张图片

压缩后:

矢量数据压缩算法“Douglas-Peucker”——递归与非递归实现(python)_第8张图片

你可能感兴趣的:(python,gis算法,机器学习,人工智能)