Tarjan离线算法求LCA介绍
前言:首先,本人搞懂Tarjan求最近公共祖先(LCA),也是浏览了大量其他网友大牛的文章,若是看了本文仍未弄懂的,可以尝试自己做一下模板题(裸题)HDU2586,自己用数据去感受一下,或者可以换篇文章再看,或许他的文章更对你的“胃口”。
一:概念介绍
1:最近公共祖先
对于有根树Tree的两个结点u、v,其最近公共祖先LCA表示一个结点x,满足x是u、v的祖先且x的深度尽可能大。另一种理 解方式是把Tree理解为一个无向无环图,而其最近公共祖先LCA即u到v的最短路上深度最小的点。
2:并查集:详见http://baike.baidu.com/view/521705.htm
3:离线算法:
算法设计策略都是基于在执行算法前输入数据已知的基本假设,也就是说,对于一个离线算法,在开始时就需要知道问题的所有输入数据,而且在解决一个问题后就要立即输出结果,通常将这类具有问题完全信息前提下设计出的算法成为离线算法( off line algorithms)
二:Tarjan离线算法求LCA
首先根据LCA的定义,我们可以想到一种最简单的方法来求u,v的LCA:分别从u,v开始向根节点走,当这两个点走到第一个相同的节点时,这个节点就是LCA(u,v)
但是这样求效率不够,求一次的最坏的时间复杂度就是O(N),若是再多来几个询问就会超时
现在介绍一种当询问次数为Q,节点数为N时时间复杂度为O(N+Q)的离线求LCA的算法:Tarjan算法
这种算法是基于DFS和并查集来实现的。设fa[x]为x的父亲,dist[x]为x节点到根节点的距离。首先从一号根节点(记为u)开始访问他的每一个子节点(记为v),并用根节点与当前访问的子节点的距离更新dist值,即dist[v]=dist[u]+map[v][u],其中map[v][u]表示v到u的距离,然后将当前子节点当做根点用上述同样步骤递归下去,并在递归回溯后将其fa[v]值更新,这样的目的是保证子节点v的所有子树全部被访问过。
现在我们需知道第k个询问的LCA是什么,那么这个操作应在询问中两个节点的子树全部访问完的基础上再进行。对于现在状态的根点u,访问它的子节点v,若v点“作过”根点,即被递归过,才能保证v的所有子树被全部访问完,这时才能将与之有关的询问<即询问中包含v点>更新其LCA=get(v),get为并查集,即找到v所在集合的起点,因为并查集在这里的作用就是将同一子树中的子节点的父亲指向该子树的根节点,相当于归为了一个集合,这个集合的起点就是当前子树的根节点。
这样,从1号根节点出发,向下递归直到到达叶子节点位置,树中每个节点都被访问过了一次,在回溯后,为了对每个询问(记总询问次数为Q)更新LCA值访问了相关点,则时间复杂度为O(N)+O(Q),因此这是个O(N+Q)的算法!
实现代码:
这里实现是用临接链表存的根与子节点的关系,b数组中存的是询问信息,a数组存的是边的信息,下面的代码为Tarjan的主函数,若没看懂数组的含义,请接着看下面例题HDU2586
void Tarjan(int x) { fa[x]=x;//作为当前的根节点,将其父亲指向自己 vis[x]=true;//标记该点已经走过 for(int i=question[x];i;i=b[i].next) { int now_to=b[i].to; if(vis[now_to])//如果其子节点及子节点的子树全部访问完才会进入这一步,由vis判断 LCA[b[i].num]=get(now_to);//更新LCA值 } for(int i=edge[x];i;i=a[i].next) { int now_to=a[i].to; if(!vis[now_to]) { dist[now_to]=dist[x]+a[i].v;//更新dist值 Tarjan(now_to);//相当于将now_to当成根节点递归下去 fa[now_to]=x;//更新子节点的父亲 } } }
三:例题分析:HDU 2586 《How far away ?》
【题目大意】:
一个村子里有n个房子,这n个房子用n-1条路连接起来,接下来有m次询问,每次询问两个房子a,b之间的距离是多少。
【分析】:
这是个求最近公共祖先的问题,用临接链表存下每条边和询问的信息,然后跑一遍Tarjan,最后对于询问i,j的LCA,答案为dist[i]+dist[j]-2*dist[LCA(i,j)],这里dist[i]为i点到1号根节点的距离
【代码】:用时31MS,好像将更新LCA操作整体放后面也行
#include<stdio.h> #include<string.h> #include<stdlib.h> #include<algorithm> #include<iostream> #include<vector> #include<stack> #include<queue> using namespace std; #define MAXEDGE 100001 #define MAXN 40001 #define MAXM 410 struct EDGE{int to,v,next;}; struct QUESTION{int to,num,next;}; EDGE a[MAXEDGE]; QUESTION b[MAXM]; int DATA,N,M,edge[MAXN],question[MAXN],tot1=0,tot2=0,ansf[MAXM],anst[MAXM]; int fa[MAXN],LCA[MAXM],dist[MAXN];//dist[i]记录了i点到根节点的距离 bool vis[MAXN]; void add_edge(int x,int y,int value) { a[++tot1].to=y;//这条边的到达点 a[tot1].v=value;//这条边的长度 a[tot1].next=edge[x];//与这条边有相同初始点的上一条边编号 edge[x]=tot1;//更新编号 } void add_question(int x,int y,int number) { b[++tot2].to=y;//这个询问的点标号 b[tot2].num=number;//这个询问的对应编号 b[tot2].next=question[x]; question[x]=tot2; } int get(int x) { if(fa[x]==x) return x; return fa[x]=get(fa[x]); } void Tarjan(int x) { fa[x]=x;//作为当前的根节点,将其父亲指向自己 vis[x]=true;//标记该点已经走过 for(int i=question[x];i;i=b[i].next) { int now_to=b[i].to; if(vis[now_to])//如果其子节点及子节点的子树全部访问完才会进入这一步,由vis判断 LCA[b[i].num]=get(now_to);//更新LCA值 } for(int i=edge[x];i;i=a[i].next) { int now_to=a[i].to; if(!vis[now_to]) { dist[now_to]=dist[x]+a[i].v;//更新dist值 Tarjan(now_to);//相当于将now_to当成根节点递归下去 fa[now_to]=x;//更新子节点的父亲 } } } int main() { //freopen("input.in","r",stdin); //freopen("output.out","w",stdout); scanf("%d",&DATA); for(int now=1;now<=DATA;now++) { memset(vis,false,sizeof(vis)); memset(edge,0,sizeof(edge)); memset(question,0,sizeof(question)); memset(a,0,sizeof(a)); memset(b,0,sizeof(b)); memset(dist,0,sizeof(dist)); memset(fa,0,sizeof(fa)); tot1=0,tot2=0; scanf("%d%d",&N,&M); for(int i=1;i<=N;i++) fa[i]=i;//首先将所有节点的父亲节点指向自己 for(int i=1;i<=N-1;i++) { int A,B,C; scanf("%d%d%d",&A,&B,&C); add_edge(A,B,C);//建无向边,用临接链表存储 add_edge(B,A,C); } for(int i=1;i<=M;i++) { int A,B; scanf("%d%d",&A,&B); add_question(A,B,i);//这里用进行两次记录,保证在更新LCA时能顾全这两个点 add_question(B,A,i); ansf[i]=A,anst[i]=B; } Tarjan(1); for(int i=1;i<=M;i++) printf("%d\n",dist[ansf[i]]+dist[anst[i]]-2*dist[LCA[i]]); } //system("pause"); return 0; }
转载注明出处:http://blog.csdn.net/u011400953