在图结构中,求解最短路径问题有多种算法,Bellman-Ford是其中之一,它可以处理含有负权边的情况,同样是单源最短路径算法,而之前讲到的Dijkstra算法不能处理含有负权边的情况。对应的代价就是其算法时间复杂度要高一些。后面我们会分析。
这里能处理负权边是针对有向图的,因为对无向图来说,含有负权边就意味着含有负权回路,在有负权回路的这种情况下求最短路径是无解的,因为每经过一次负权回路,距离都会减少,就会无限循环下去。
在继续往下讲之前,先补充一个图最短路径的一个性质:最短路径的子路径也是最短路径,数学描述如下:有向图 G = ( V , E ) G=(V,E) G=(V,E),设 p = ( v 0 , v 1 , . . . , v k ) p=(v_0,v_1,...,v_k) p=(v0,v1,...,vk)为从点 v 0 v_0 v0到点 v k v_k vk的一条最短路径,且 0 ≤ i ≤ j ≤ k 0≤i≤j≤k 0≤i≤j≤k,设 p i j = ( v i , v i + 1 , . . . , v j ) p_{ij}=(v_i,v_{i+1},...,v_j) pij=(vi,vi+1,...,vj)为路径 p p p中从点 v i v_i vi到点 v j v_j vj的子路径,那么 p i j p_{ij} pij也是这两点之间的一条最短路径。可用反证法来证明:
证明:如果将路径 p p p分解为 v 0 − v i − v j − v k v_0-v_i-v_j-vk v0−vi−vj−vk,则有 w ( p ) = w ( p 0 i ) + w ( p i j ) + w ( p j k ) w(p)=w(p_{0i})+w(p_{ij})+w(p_{jk}) w(p)=w(p0i)+w(pij)+w(pjk)。假设存在一条从 v i v_i vi到 v j v_j vj的一条更短的路径 p i j ′ p_{ij}' pij′, w ( p i j ′ < w ( p i j ) ) w(p_{ij}'
w(pij′<w(pij)) 。则新路径权值为 w ( p 0 i ) + w ( p i j ′ ) + w ( p j k ) < w ( p ) w(p_{0i})+w(p_{ij}')+w(p_{jk}) < w(p) w(p0i)+w(pij′)+w(pjk)<w(p),这与 p p p是最短路径相矛盾。
与Dijkstra算法类似,Bellman-Ford算法也是通过不断的“松弛”操作来求得最终解。“松弛”就是如下的操作过程: w ( u , v ) w(u,v) w(u,v)表示 u u u与 v v v之间的权值, d [ v ] d[v] d[v]表示从源点 s s s到顶点 v v v的距离,若存在边 e ( u , v ) e(u,v) e(u,v),使得: d [ v ] > d [ u ] + w ( u , v ) d[v] > d[u] + w(u,v) d[v]>d[u]+w(u,v)(即发现了优于当前的路径),则更新 d [ v ] = d [ u ] + w ( u , v ) d[v] = d[u] + w(u,v) d[v]=d[u]+w(u,v),并更新路径 p r e v [ v ] = u prev[v] = u prev[v]=u。可以看到每一次“松弛”都会更逼近最优解。Dijkstra算法通过优先队列每次选择当前未被处理过的距离最小的顶点,对该顶点未被处理过的边进行松弛。而Bellman-Ford算法则简单的松弛所有的边,反复执行 ∣ V ∣ − 1 |V|-1 ∣V∣−1次( ∣ V ∣ |V| ∣V∣为顶点的的个数),时间复杂度 O ( ∣ V ∣ ∣ E ∣ ) O(|V||E|) O(∣V∣∣E∣)。可以看出,Bellman-Ford松弛的次数远多于Dijkstra,所以其时间复杂度相比Dijkstra要高。
伪代码如下:
function BellmanFord(list vertices, list edges, vertex source)
// step 1 初始化, dist[v]表示源节点到顶点v的距离值,prev[v]表示顶点v的前驱顶点
for each vertex v in vertices
dist[v] = inf
prev[v] = null
dist[source] = 0
// step 2 迭代松弛|V|-1次
for i from 1 to size(vertices) -1
for each edge(u,v) with weight(u,v) in edges
if dist[u] + weight(u,v) < dist[v]
dist[v] = dist[u] + weight(u,v)
prev[v] = u
// step 3 检查是否有负权回路
for each edge(u,v) with weight(u,v) in edges
if dist[u] + weight(u,v) < dist[v]
error "检测到负权回路"
return dist[], prev[]
对算法的优化: 在实际应用中,Bellman-Ford算法其实不用迭代松弛 ∣ V ∣ − 1 |V|-1 ∣V∣−1次,理论上图中存在的最大的路径长度为 ∣ V ∣ − 1 |V|-1 ∣V∣−1,实际上往往要小于这个 ∣ V ∣ − 1 |V|-1 ∣V∣−1,即,在 ∣ V ∣ − 1 |V|-1 ∣V∣−1次迭代松弛之前就已经收敛了,计算出最短路径了,所以可在循环中设置判定,在某次循环中不再进行松弛时,表明当前已收敛,可退出步骤2,进行下一步检查是否有负权回路。
怎么理解这个算法呢? 假设某顶点与源顶点没有连通,即没有边,那么这个点就不会被松弛,距离不会被更新,依旧为无穷大。如果顶点与源顶点是连通的,在不存在负权回路的情况下,一定存在一条最短路径,这条最短路径 p = ( v 0 , v 1 , . . . , v k ) p=(v_0,v_1,...,v_k) p=(v0,v1,...,vk)为源点 s s s到 v v v之间的任意一条最短路径(这里 v 0 = s v_0=s v0=s, v k = v v_k=v vk=v)。最大会有多少条边呢?假设图有 ∣ V ∣ |V| ∣V∣个顶点,那么有 k ≤ ∣ V ∣ − 1 k≤|V|-1 k≤∣V∣−1。在进行第一轮松弛时,被松弛的边中一定会包含边 ( v 0 , v 1 ) (v_0,v_1) (v0,v1),结合文章开头讲到的最短路径的子路径也一定是最短路径的性质, v 1 v_1 v1已经得到了其最短路径,在第二轮松弛过程中,被松弛的边中一定会包含 边 ( v 1 , v 2 ) 边(v_1,v_2) 边(v1,v2),经过此次松弛后, v 2 v_2 v2也已经得到了其最短路径。以此类推,在第 k k k轮松弛中,被松弛的边中一定包含了边 ( v k − 1 , v k ) (v_{k-1},v_k) (vk−1,vk),之后 v k v_k vk也得到其最短路径。也就是说,凡是与源顶点最短路径经过的边数为 k k k的顶点,在第 k k k轮松弛时一定会被确认(最短路径被找到)。所以,我们需要松弛多少轮呢,最多 ∣ V ∣ − 1 |V|-1 ∣V∣−1次就可以了。
算法的数学证明可以参考《图论》或《算法导论》中的证明过程。
代码实现见bellman_ford.cpp。最后再分析一下时间复杂度,最坏的情况 O ( ∣ V ∣ ∣ E ∣ ) O(|V||E|) O(∣V∣∣E∣),这个比较好理解,最好的情况 O ( ∣ E ∣ ) O(|E|) O(∣E∣),一次松弛所有边的操作就可以了,对应的就是边松弛的顺序恰好是最短路径树的生成顺序。
其中一个应用就是路由协议了(距离向量协议),对此实现了一个路由协议测试工程,代码见router。实现了一个通过路由表的方式进行的路由算法。