我们常用的求强连通分量的算法有两个,一个是Kosaraju算法,这个算法是基于两次dfs来实现的;还有一个就是Tarjan算法,这个算法完成一次dfs就可以找到图中的强连通分支。我的这篇文章主要介绍Tarjan算法。
Tarjan算法是基于这样一个原理:如果u是某个强连通分量的根,那么:
(1)u不存在路径可以返回到它的祖先
(2)u的子树也不存在路径可以返回到u的祖先。
因此我们在实现Tarjan算法的时候,使用dfsnum[i]记录节点i被访问的时间,也可以理解为在访问该点之前已经访问的点的个数。然后使用数组low[i]记录点i或者i的子树最小可以返回到的节点(在栈中)的次序号。
这里还要说一下low[i]的更新过程,
if(v是i向下dfs的树边) low[i]=min(low[i],low[v]);//这里也就是说low[i]表示i或者i的子树所能追回到的最小的点序号。
if(v不是树边也不是横叉边) low[i]=min(low[i],dfsnum[v]);//其实这里你直接更新成low[v]代替dfsnum[v]也是可以的
根据上面的原理,我们可以发现只有当dfsnum[i]==low[i]的时候就正好是强连通分量的根。这个时候我们把在栈中的点(在遇到根之前在栈中的点)出栈,并且标记好点所属的强连通分支的编号。
整个Tarjan算法跑下来就可以完成强连通分支的求解了。