理解Bellman-Ford算法

**Bellman-Ford算法**(下文中简称为BF)与[Dijkstra算法](https://www.jianshu.com/p/9107f93be02d)一样,解决的是**单源最短路径**问题。两者不同之处在于,后者只适用于无负权边的图,而BF无此限制:无论是否有向,无论是否有负权边,只要图中**没有负权环**,则该算法可以正确地给出起点到其余各点的最短路径,否则报告负权环的存在。 很多资料(比如[维基百科](https://zh.wikipedia.org/wiki/%E8%B4%9D%E5%B0%94%E6%9B%BC-%E7%A6%8F%E7%89%B9%E7%AE%97%E6%B3%95))在解释BF时都会提到它的基础或者核心是**松弛操作**。自然地,理解BF的关键也是理解这一点,所以下面就来专门讲讲它究竟是个什么意思。 “松弛”,翻译自英文的relaxation,原本指数学上的__一种迭代求解方程组的方法__,表示通过**改进**近似解来不断地**逼近**最终解或者说最优解的方法。而我们下面可以看到,BF正是这么一个迭代改进的过程。 岔开一笔,我不知道当初数学家们为什么要选用relaxation这个词,但我觉得它的字面意义正好与它所代表的实际过程相反(在BF中尤其如此)。更糟的是,数学中另有一个“松弛”的概念,使用的是同一个词。它表示的是__一种解决问题的技巧__:如果问题难以解决,则放宽某些限制,将其转化成容易解决的问题,以求得近似的解决方案(这倒是名副其实)。所以,在理解BF时,看到“松弛”这个词,如果觉得它有误导之嫌,不妨在脑中将其替换为“逼近”或者“改进”。 那么BF中的~~松弛~~改进是个怎么样的操作呢? 首先,~~松弛~~改进的对象很明显,就是从起点到其余各点的距离。给定图G和起点s,`G[u][v]`表示边(u, v)的长度,且用`D[u]`表示从s点到某个u点**已知的(但不一定是最优的)最短路径**的长度,那么对于图中任何从该u点出发的边(u, v),如果`D[u] + G[u][v]`小于`D[v]`,则将`D[v]`~~松弛~~改进为`D[u] + G[u][v]`。我们可以用Python给出下面的实现(代码出自[Python Algorithms一书]([https://book.douban.com/subject/4915945/),稍有改动,下同): ```python3 inf = float('inf') def relax(G, u, v, D, P): o = D.get(v, inf) # 若D[v]不存在则返回inf n = D.get(u, inf) + G[u][v] if n < o: D[v], P[v] = n, u return True # 若有改进,则返回True return False ``` 其次,根据定义,它肯定是一个迭代的过程。照上面的分析和代码,我们可以将每次~~松弛~~改进和某条边对应起来。讲到这里,那么BF的核心思想其实就很容易描述了:**不断地选择一条边,做~~松弛~~改进操作,直到得出正确的解答**。 接下来的问题自然就是: 1. 这种思路能提供一个正确的算法吗?换言之,我们如何通过选择~~松弛~~改进边的顺序,使得对应的BF最终完成运行? 2. 如何选择~~松弛~~改进边的顺序,使得对应的BF效率最高? 我们先来考察如下的情况:如果对图里每条边按照随机的顺序都做一次~~松弛~~改进(称之为**一轮**~~松弛~~改进),能得到什么?能够保证起点s的任一邻点(记作u)都得到正确的`D[u]`(最短路径长度)和`P[u]`(最短路径中的上一节点)吗?显然不能。比如下图中,如果依次~~松弛~~改进(s, a)、(s, b)、(s, c)、(a, b)、(b, c),那么一轮下来,确实a点b点c点都能得到正确答案。但如果顺序变成(b, c)、(a, b)、(s, a)、(s, b)、(s, c),那么b点的答案就是错的(读者可自行推演验证)。 ![image](https://upload-images.jianshu.io/upload_images/5552774-fdb9b4a5d2861ee1.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 怎么去找这么个最优的顺序呢?这样的话,只需一轮~~松弛~~改进就可以解决问题了。其实这是不现实的。因为要得到这个最优顺序,从本质上来讲,必须得将各点以距起点s的最短距离从小到大作一个排序,而这正就是要解决的问题。这是个“循环依赖”,没有出路。 回到上图完成一轮~~松弛~~改进之时。可以发现,虽然b点的答案不一定正确,但是a点和c点的答案,不论顺序如何,都是正确的。这是一个非常关键的性质。换句话说,完成第1轮~~松弛~~改进后,对于任一节点u,如果s到u存在一条边数(注意不是长度)为1的最短路径,那么从s到u点的(某条)边数为1最短路径的就一定能解出来。推而广之,**做完第k轮~~松弛~~改进后,对于任一节点u,如果从s到u存在边数为k的最短路径,那么这样的一条最短路径一定会被找出来**。我们可以用数学归纳法进行证明。假设k-1轮后的情况已经得证,再假设s到某个点u有一条边数为k的最短路径,为[s, m1, m2, ..., mk-2, u],且s与u中间不存在边数小于k的最短路径(`D[u]`还未记录最短路径的长度),那么,通过反证法可知,[s, m1, m2, ..., mk-2]肯定是从s到mk-2的一条最短路径,据前面的假设,这条路径的值已经算出来了,进而在第k轮处理(mk-2, u)的时候,一定会对`D[u]`和`P[u]`的值有所改进(也就是说`relax`方法返回`True`),两者的值都会是最终正确的解答而且不会再发生改变了。综上,前面的命题得证。 另外,还有一个特别重要的引理:**如果一个节点数为n的图中没有负权环,那么其任意两个节点之间一定存在最短路径,且其边数不会超过n-1**。这一引理从直观上很好理解,所以这里不给出严谨的数学证明。这条引理非常重要,因为它有两个很关键的推论: 1. 在无负权环、节点数为n的图中,遵循上面的思路,我们最多只需要进行n-1轮~~松弛~~改进,就可以解决单源最短路径问题 2. 对于节点数为n的图,如果如上进行n轮~~松弛~~改进,且最后一轮还能够有所改进,则说明图中必有负权环 以上就是BF的整个思路。依此可以用Python做出如下代码实现: ```python3 def bellman_ford(G, s): D, P = {s: 0}, {s: None} for _ in G: # 轮数等于节点数 improved = False for u in G: for v in G[u]: # 任意的顺序遍历所有边 if relax(G, u, v, D, P): improved = True if not improved: # 如果某轮没有任何改进 break # 说明问题已经解决,退出循环 else: # 否则,说明第n轮也有改进,存在负权环 raise ValueError('negative cycle') return D, P ``` 很显然,上面算法的时间复杂度为O(nm),其中n和m分别为节点和边的数目。时间复杂度超过Dijkstra算法的O(mlgn),但BF的优势,正如一开始所说的,在于它允许负权边的存在而且能够检测到负权环的存在。

你可能感兴趣的:(理解Bellman-Ford算法)