最短路径算法:Bellman-ford算法

最短路径问题

在图结构中,求解最短路径问题有多种算法,Bellman-Ford是其中之一,它可以处理含有负权边的情况,同样是单源最短路径算法,而之前讲到的Dijkstra算法不能处理含有负权边的情况。对应的代价就是其算法时间复杂度要高一些。后面我们会分析。

这里能处理负权边是针对有向图的,因为对无向图来说,含有负权边就意味着含有负权回路,在有负权回路的这种情况下求最短路径是无解的,因为每经过一次负权回路,距离都会减少,就会无限循环下去。

在继续往下讲之前,先补充一个图最短路径的一个性质:最短路径的子路径也是最短路径,数学描述如下:有向图 G = ( V , E ) G=(V,E) G=(V,E),设 p = ( v 0 , v 1 , . . . , v k ) p=(v_0,v_1,...,v_k) p=(v0,v1,...,vk)为从点 v 0 v_0 v0到点 v k v_k vk的一条最短路径,且 0 ≤ i ≤ j ≤ k 0≤i≤j≤k 0ijk,设 p i j = ( v i , v i + 1 , . . . , v j ) p_{ij}=(v_i,v_{i+1},...,v_j) pij=(vi,vi+1,...,vj)为路径 p p p中从点 v i v_i vi到点 v j v_j vj的子路径,那么 p i j p_{ij} pij也是这两点之间的一条最短路径。可用反证法来证明:

证明:如果将路径 p p p分解为 v 0 − v i − v j − v k v_0-v_i-v_j-vk v0vivjvk,则有 w ( p ) = w ( p 0 i ) + w ( p i j ) + w ( p j k ) w(p)=w(p_{0i})+w(p_{ij})+w(p_{jk}) w(p)=w(p0i)+w(pij)+w(pjk)。假设存在一条从 v i v_i vi v j v_j vj的一条更短的路径 p i j ′ p_{ij}' pij w ( p i j ′ < w ( p i j ) ) w(p_{ij}'w(pij<w(pij))。则新路径权值为 w ( p 0 i ) + w ( p i j ′ ) + w ( p j k ) < w ( p ) w(p_{0i})+w(p_{ij}')+w(p_{jk}) < w(p) w(p0i)+w(pij)+w(pjk)<w(p),这与 p p p是最短路径相矛盾。

Bellman-Ford算法

与Dijkstra算法类似,Bellman-Ford算法也是通过不断的“松弛”操作来求得最终解。“松弛”就是如下的操作过程: w ( u , v ) w(u,v) w(u,v)表示 u u u v v v之间的权值, d [ v ] d[v] d[v]表示从源点 s s s到顶点 v v v的距离,若存在边 e ( u , v ) e(u,v) e(u,v),使得: d [ v ] > d [ u ] + w ( u , v ) d[v] > d[u] + w(u,v) d[v]>d[u]+w(u,v)(即发现了优于当前的路径),则更新 d [ v ] = d [ u ] + w ( u , v ) d[v] = d[u] + w(u,v) d[v]=d[u]+w(u,v),并更新路径 p r e v [ v ] = u prev[v] = u prev[v]=u。可以看到每一次“松弛”都会更逼近最优解。Dijkstra算法通过优先队列每次选择当前未被处理过的距离最小的顶点,对该顶点未被处理过的边进行松弛。而Bellman-Ford算法则简单的松弛所有的边,反复执行 ∣ V ∣ − 1 |V|-1 V1次( ∣ V ∣ |V| V为顶点的的个数),时间复杂度 O ( ∣ V ∣ ∣ E ∣ ) O(|V||E|) O(VE)。可以看出,Bellman-Ford松弛的次数远多于Dijkstra,所以其时间复杂度相比Dijkstra要高。

伪代码如下:

function BellmanFord(list vertices, list edges, vertex source)
    // step 1 初始化, dist[v]表示源节点到顶点v的距离值,prev[v]表示顶点v的前驱顶点
    for each vertex v in vertices
        dist[v] = inf
        prev[v] = null

    dist[source] = 0

    // step 2 迭代松弛|V|-1次
    for i from 1 to size(vertices) -1 
        for each edge(u,v) with weight(u,v)  in edges
            if dist[u] + weight(u,v) < dist[v]
                dist[v] = dist[u] + weight(u,v)
                prev[v] = u
    
    // step 3 检查是否有负权回路
    for each edge(u,v) with weight(u,v) in edges
        if dist[u] + weight(u,v) < dist[v]
            error "检测到负权回路"

    return dist[], prev[]

对算法的优化: 在实际应用中,Bellman-Ford算法其实不用迭代松弛 ∣ V ∣ − 1 |V|-1 V1次,理论上图中存在的最大的路径长度为 ∣ V ∣ − 1 |V|-1 V1,实际上往往要小于这个 ∣ V ∣ − 1 |V|-1 V1,即,在 ∣ V ∣ − 1 |V|-1 V1次迭代松弛之前就已经收敛了,计算出最短路径了,所以可在循环中设置判定,在某次循环中不再进行松弛时,表明当前已收敛,可退出步骤2,进行下一步检查是否有负权回路。

怎么理解这个算法呢? 假设某顶点与源顶点没有连通,即没有边,那么这个点就不会被松弛,距离不会被更新,依旧为无穷大。如果顶点与源顶点是连通的,在不存在负权回路的情况下,一定存在一条最短路径,这条最短路径 p = ( v 0 , v 1 , . . . , v k ) p=(v_0,v_1,...,v_k) p=(v0,v1,...,vk)为源点 s s s v v v之间的任意一条最短路径(这里 v 0 = s v_0=s v0=s v k = v v_k=v vk=v)。最大会有多少条边呢?假设图有 ∣ V ∣ |V| V个顶点,那么有 k ≤ ∣ V ∣ − 1 k≤|V|-1 kV1。在进行第一轮松弛时,被松弛的边中一定会包含边 ( v 0 , v 1 ) (v_0,v_1) (v0,v1),结合文章开头讲到的最短路径的子路径也一定是最短路径的性质, v 1 v_1 v1已经得到了其最短路径,在第二轮松弛过程中,被松弛的边中一定会包含 边 ( v 1 , v 2 ) 边(v_1,v_2) (v1,v2),经过此次松弛后, v 2 v_2 v2也已经得到了其最短路径。以此类推,在第 k k k轮松弛中,被松弛的边中一定包含了边 ( v k − 1 , v k ) (v_{k-1},v_k) (vk1,vk),之后 v k v_k vk也得到其最短路径。也就是说,凡是与源顶点最短路径经过的边数为 k k k的顶点,在第 k k k轮松弛时一定会被确认(最短路径被找到)。所以,我们需要松弛多少轮呢,最多 ∣ V ∣ − 1 |V|-1 V1次就可以了。

算法的数学证明可以参考《图论》或《算法导论》中的证明过程。

代码实现见bellman_ford.cpp。最后再分析一下时间复杂度,最坏的情况 O ( ∣ V ∣ ∣ E ∣ ) O(|V||E|) O(VE),这个比较好理解,最好的情况 O ( ∣ E ∣ ) O(|E|) O(E),一次松弛所有边的操作就可以了,对应的就是边松弛的顺序恰好是最短路径树的生成顺序。

算法的应用

其中一个应用就是路由协议了(距离向量协议),对此实现了一个路由协议测试工程,代码见router。实现了一个通过路由表的方式进行的路由算法。

你可能感兴趣的:(数据结构与算法)