LCA的tarjan算法理解

转自:http://scturtle.is-programmer.com/posts/30055.html 

绝对好文

tarjan算法的步骤是(当dfs到节点u时):
1 在并查集中建立仅有u的集合,设置该集合的祖先为u
1 对u的每个孩子v:
   1.1 tarjan之
   1.2 合并v到父节点u的集合,确保集合的祖先是u
2 设置u为已遍历
3 处理关于u的查询,若查询(u,v)中的v已遍历过,则LCA(u,v)=v所在的集合的祖先
 
举例说明(非证明):

LCA的tarjan算法理解_第1张图片
假设遍历完10的孩子,要处理关于10的请求了
取根节点到当前正在遍历的节点的路径为关键路径,即1-3-8-10
集合的祖先便是关键路径上距离集合最近的点
比如此时:
    1,2,5,6为一个集合,祖先为1,集合中点和10的LCA为1
    3,7为一个集合,祖先为3,集合中点和10的LCA为3
    8,9,11为一个集合,祖先为8,集合中点和10的LCA为8
    10,12为一个集合,祖先为10,集合中点和10的LCA为10
你看,集合的祖先便是LCA吧,所以第3步是正确的
道理很简单,LCA(u,v)便是根至u的路径上到节点v最近的点

为什么要用祖先而且每次合并集合后都要确保集合的祖先正确呢?
因为集合是用并查集实现的,为了提高速度,当然要平衡加路径压缩了,所以合并后谁是根就不确定了,所以要始终保持集合的根的祖先是正确的
关于查询和遍历孩子的顺序:
wikipedia上就是上文中的顺序,很多人的代码也是这个顺序
但是网上的很多讲解却是查询在前,遍历孩子在后,对比上文,会不会漏掉u和u的子孙之间的查询呢?
不会的
如果在刚dfs到u的时候就设置u为visited的话,本该回溯到u时解决的那些查询,在遍历孩子时就会解决掉了
这个顺序问题就是导致我头大看了很久这个算法的原因,也是絮絮叨叨写了本文的原因,希望没有理解错= =

最后,为了符合本blog风格,还是贴代码吧:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
int f[maxn],fs[maxn]; //并查集父节点 父节点个数
bool vit[maxn];
int anc[maxn]; //祖先
vector< int > son[maxn]; //保存树
vector< int > qes[maxn]; //保存查询
typedef vector< int >::iterator IT;
 
int Find( int x)
{
     if (f[x]==x) return x;
     else return f[x]=Find(f[x]);
}
void Union( int x, int y)
{
     x=Find(x);y=Find(y);
     if (x==y) return ;
     if (fs[x]<=fs[y]) f[x]=y,fs[y]+=fs[x];
     else f[y]=x,fs[x]+=fs[y];
}
 
void lca( int u)
{
     anc[u]=u;
     for (IT v=son[u].begin();v!=son[u].end();++v)
     {
         lca(*v);
         Union(u,*v);
         anc[Find(u)]=u;
     }
     vit[u]= true ;
     for (IT v=qes[u].begin();v!=qes[u].end();++v)
     {
         if (vit[*v])
             printf ( "LCA(%d,%d):%d\n" ,u,*v,anc[Find(*v)]);
     }
}

ref:
http://purety.jp/akisame/oi/TJU/
http://en.wikipedia.org/wiki/Tarjan%27s_off-line_least_common_ancestors_algorithm
http://techfield.us/blog/2008/11/lowest_common_ancester_tarjan_alogrithm/

你可能感兴趣的:(LCA的tarjan算法理解)