最近公共祖先(Least Common Ancestors)
对于有根树T的两个结点u、v,最近公共祖先LCA(T,u,v)表示一个结点x,满足x是u、v的祖先且x的深度尽可能大。另一种理解方式是把T理解为一个无向无环图,而LCA(T,u,v)即u到v的最短路上深度最小的点。
这里给出一个LCA的例子:
对于T=<V,E>
V={1,2,3,4,5}
E={(1,2),(1,3),(3,4),(3,5)}
则有:
LCA(T,5,2)=1
LCA(T,3,4)=3
LCA(T,4,5)=3
LCA问题算法
1.离线算法Tarjan
利用并查集优越的时空复杂度,我们可以实现LCA问题的O(n+Q)算法,这里Q表示询问的次数。Tarjan算法基于深度优先搜索的框架,对于新搜索到 的一个结点,首先创建由这个结点构成的集合,再对当前结点的每一个子树进行搜索,每搜索完一棵子树,则可确定子树内的LCA询问都已解决。其他的LCA询 问的结果必然在这个子树之外,这时把子树所形成的集合与当前结点的集合合并,并将当前结点设为这个集合的祖先。之后继续搜索下一棵子树,直到当前结点的所 有子树搜索完。这时把当前结点也设为已被检查过的,同时可以处理有关当前结点的LCA询问,如果有一个从当前结点到结点v的询问,且v已被检查过,则由于 进行的是深度优先搜索,当前结点与v的最近公共祖先一定还没有被检查,而这个最近公共祖先的包涵v的子树一定已经搜索过了,那么这个最近公共祖先一定是v 所在集合的祖先。
下面给出这个算法的伪代码描述:
LCA(u) {
Make-Set(u)
ancestor[Find-Set(u)]=u
对于u的每一个孩子v {
LCA(v)
Union(u)
ancestor[Find-Set(u)]=u
}
checked[u]=true
对于每个(u,v)属于P {
if checked[v]=true
then 回答u和v的最近公共祖先为 ancestor[Find-Set(v)]
}
}
由于是基于深度优先搜索的算法,只要调用LCA(root[T])就可以回答所有的提问了,这里root[T]表示树T的根,假设所有询问(u,v)构成集合P。
2.在线算法 倍增法
每次询问O(logN)
d[i] 表示 i节点的深度, p[i,j] 表示 i 的 2^j 倍祖先
那么就有一个递推式子 p[i,j]=p[p[i,j-1],j-1]
这样子一个O(NlogN)的预处理求出每个节点的 2^k 的祖先
然后对于每一个询问的点对a, b的最近公共祖先就是:
先判断是否 d[a] > d[b] ,如果是的话就交换一下(保证 a 的深度小于 b 方便下面的操作)然后把b 调到与a 同深度, 同深度以后再把a, b 同时往上调(dec(j)) 调到有一个最小的j 满足p[a,j]!=p[b,j] (a b 是在不断更新的), 最后再把 a, b 往上调 (a=p[a,0], b=p[b,0]) 一个一个向上调直到a = b, 这时 a or b 就是他们的最近公共祖先
LCA 问题,即 Least Common Ancestors(最近公共祖先)的意思是:给定一有根树,求其两个节点最近的公共祖先;节点的祖先即从节点至根的路径上的节点的集合。
LCA 问题可以转化为 RMQ 问题求解,方法是:从根开始对树进行一次深度优先遍历,每次沿一条边到达另一节点时记录下节点的深度,这样就得到一个序列;对于问题中的两个节点,以它们的首次出现为两端的子序列中的最小值就是最近公共祖先。规模为n的 LCA 经过转化变成了规模为2n-1的 RMQ,渐进复杂度不变,然后就可以使用 RMQ 的各种方法来解答。
但是即便LCA转换成了RMQ,比较好写的ST之类方法还是O(nlogn)的,在竞赛中更好用的似乎是 Tarjan 的 O(nα(n)) 的离线算法。算法用到了并查集,在对树的一次深度优先遍历后完成,方法大致是这样的:每次访问到一个节点,对它建立一个并查集,设定它的祖先为自己;访问它的每个子节点,并在每次访问结束后设儿子的并查集的代表顶点的祖先为自己;将自己标记为黑色,对于每个与它有关的问题,若另一节点也为黑色,则这个问题的答案就是另一节点所在的并查集的代表顶点的祖先。
至于RMQ转换成LCA其实也简单,要将原数组转换成听上去有点神秘的“Cartesian Tree”(笛卡尔树)。所谓Cartesian Tree,是一个二叉树,每个节点的值大于子节点(堆序),节点的中序遍历满足原数组顺序(排序二叉树)。看到这儿我明白了——这不就一Treap么……当然,我们是不用挨个插入 Treap 的O(nlogn) 算法的。是采用自数组从左向右扫描,每次的新数沿着旧树的右路径上升至不能上升。每个节点进入和退出右路径最多一次,所以是均摊 O(n) 的。呵呵,说起来简单,我还没实现过这个呢,什么时候真闲得慌了可以写写玩玩。
LCA 的 Tarjan 算法示例程序:
ural1471.cpp