转自:http://scturtle.is-programmer.com/posts/30055.html
绝对好文
tarjan算法的步骤是(当dfs到节点u时):
1 在并查集中建立仅有u的集合,设置该集合的祖先为u
1 对u的每个孩子v:
1.1 tarjan之
1.2 合并v到父节点u的集合,确保集合的祖先是u
2 设置u为已遍历
3 处理关于u的查询,若查询(u,v)中的v已遍历过,则LCA(u,v)=v所在的集合的祖先
举例说明(非证明):
假设遍历完10的孩子,要处理关于10的请求了
取根节点到当前正在遍历的节点的路径为关键路径,即1-3-8-10
集合的祖先便是关键路径上距离集合最近的点
比如此时:
1,2,5,6为一个集合,祖先为1,集合中点和10的LCA为1
3,7为一个集合,祖先为3,集合中点和10的LCA为3
8,9,11为一个集合,祖先为8,集合中点和10的LCA为8
10,12为一个集合,祖先为10,集合中点和10的LCA为10
你看,集合的祖先便是LCA吧,所以第3步是正确的
道理很简单,LCA(u,v)便是根至u的路径上到节点v最近的点
为什么要用祖先而且每次合并集合后都要确保集合的祖先正确呢?
因为集合是用并查集实现的,为了提高速度,当然要平衡加路径压缩了,所以合并后谁是根就不确定了,所以要始终保持集合的根的祖先是正确的
关于查询和遍历孩子的顺序:
wikipedia上就是上文中的顺序,很多人的代码也是这个顺序
但是网上的很多讲解却是查询在前,遍历孩子在后,对比上文,会不会漏掉u和u的子孙之间的查询呢?
不会的
如果在刚dfs到u的时候就设置u为visited的话,本该回溯到u时解决的那些查询,在遍历孩子时就会解决掉了
这个顺序问题就是导致我头大看了很久这个算法的原因,也是絮絮叨叨写了本文的原因,希望没有理解错= =
最后,为了符合本blog风格,还是贴代码吧:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
int
f[maxn],fs[maxn];
//并查集父节点 父节点个数
bool
vit[maxn];
int
anc[maxn];
//祖先
vector<
int
> son[maxn];
//保存树
vector<
int
> qes[maxn];
//保存查询
typedef
vector<
int
>::iterator IT;
int
Find(
int
x)
{
if
(f[x]==x)
return
x;
else
return
f[x]=Find(f[x]);
}
void
Union(
int
x,
int
y)
{
x=Find(x);y=Find(y);
if
(x==y)
return
;
if
(fs[x]<=fs[y]) f[x]=y,fs[y]+=fs[x];
else
f[y]=x,fs[x]+=fs[y];
}
void
lca(
int
u)
{
anc[u]=u;
for
(IT v=son[u].begin();v!=son[u].end();++v)
{
lca(*v);
Union(u,*v);
anc[Find(u)]=u;
}
vit[u]=
true
;
for
(IT v=qes[u].begin();v!=qes[u].end();++v)
{
if
(vit[*v])
printf
(
"LCA(%d,%d):%d\n"
,u,*v,anc[Find(*v)]);
}
}
|
ref:
http://purety.jp/akisame/oi/TJU/
http://en.wikipedia.org/wiki/Tarjan%27s_off-line_least_common_ancestors_algorithm
http://techfield.us/blog/2008/11/lowest_common_ancester_tarjan_alogrithm/