题目:N个节点,M次询问,求两点间的最近公共祖先
一、并查集+DFS(也叫Tarjan)-------离线O(M+N)
#include <cstdio> #include <algorithm> #include <vector> using namespace std; #define N 10100 vector <int> a[N]; int vis[N],fa[N],In[N]; int l,r; void ini() { for(int i = 0; i < N; i++)a[i].clear();//存树 for(int i = 0; i < N; i++)vis[i]=0;//存是否被处理过 for(int i = 0; i < N; i++)fa[i]=i; for(int i = 0; i < N; i++)In[i]=0;//存每个节点的入度 } int get_fa(int x) { if(x==fa[x])return x; return fa[x]=get_fa(fa[x]); } void LCA(int u) { int len=a[u].size(); for(int i = 0; i < len; i++) { int v=a[u][i]; LCA(v); fa[v]=u; } vis[u]=1; if((l==u&&vis[r])) //此时l,r不在以u为根的子树上,且r那颗子树已经处理完毕,fa[r所在子树的根]=l,r共同的祖先(已经赋过值),所以get_fa(r); printf("%d\n",get_fa(r)); if(r==u&&vis[l]) printf("%d\n",get_fa(l));//同理 //printf("haha\n"); } int main() { int t;scanf("%d",&t); while(t--) { int n;scanf("%d",&n); ini(); for(int i = 1; i < n; i++) { int x,y; scanf("%d%d",&x,&y); a[x].push_back(y); In[y]++; } scanf("%d%d",&l,&r); // printf("haha\n"); for(int i = 1; i <= n; i++) if(!In[i])LCA(i); } return 0; }
二、裸RMQ--------在线(N(log N)预处理,每次 log N 查询) O(N(log N)+M(log N))
设P[i][j]表示结点i往上移动2^j步所到达的结点,P[i][j]可以通过以下递推公式计算:
利用P数组可以快速的将结点i向上移动n步,方法是将n表示为2进制数。比如n=6,二进制为110,那么利用P数组先向上移动4步(2^2),然后再继续移动2步(2^1),即P[ P[i][2] ][1]。
预处理计算P数组代码如下:
map<TreeNode*, int> nodeToId; map<int, TreeNode*> idToNode; const int MAXLOGN=20; //树中最大结点数为1<<20 int P[1 << MAXLOGN][MAXLOGN]; //allNodes存放树中所有的结点 void preProcessTree(vector<TreeNode *> allNodes) { int n = allNodes.size(); // 初始化P中所有元素为-1 for (int i = 0; i < n; i++) for (int j = 0; 1 << j < n; j++) P[i][j] = -1; for (int i = 0; i < n; i++) { nodeToId[allNodes[i]] = i; idToNode[i] = allNodes[i]; } // P[i][0]=parent(i) for (int i = 0; i < n; i++) P[i][0] = allNodes[i]->parent ? nodeToId[allNodes[i]->parent] : -1; // 计算P[i][j] for (int j = 1; 1 << j < n; j++) for (int i = 0; i < n; i++) if (P[i][j] != -1) P[i][j] = P[P[i][j - 1]][j - 1]; }
另外我们还需要预处理计算出每个结点的深度L[],预处理之后,查询node1和node2的LCA算法如下。
TreeNode* getLCA(TreeNode *node1, TreeNode *node2, int L[]) { int id1 = nodeToId[node1], id2 = nodeToId[node2]; //如果node2的深度比node1深,那么交换node1和node2 if (L[id1] < L[id2]) swap(id1, id2); //计算[log(L[id1])] int log; for (log = 1; 1 << log <= L[id1]; log++); log--; //将node1向上移动L[id1]-L[id2]步,使得node1和node2在同一深度上 for (int i = log; i >= 0; i--) if (L[id1] - (1 << i) >= L[id2]) id1 = P[id1][i]; if (id1 == id2) return idToNode[id1]; //使用P数组计算LCA(idToNode[id1], idToNode[id2]) for (i = log; i >= 0; i--) if (P[id1][i] != -1 && P[id1][i] != P[id2][i]) id1 = P[id1][i], id2 = P[id2][i]; return idToNode[id1]; }
时间复杂度分析:假设树包含n个结点,由于P数组有nlogn个值需要计算,因此预处理的时间复杂度为O(nlogn)。查询两个结点的LCA时,函数getLCA
中两个循环最多执行2logn次,因此查询的时间复杂度为O(logn)。
三、LCA转化为RMQ--------在线(N(log N)预处理,每次 O(1) 查询) O(N(log N)+M)
对于有根树T的两个结点u、v,最近公共祖先LCA(T,u,v)表示一个结点x,满足x是u、v的祖先且x的深度尽可能大。另一种理解方式是把T理解为一个无向无环图,而LCA(T,u,v)即u到v的最短路上深度最小的点。
这里给出一个LCA的例子:
例一
对于T=<V,E>
V={1,2,3,4,5}
E={(1,2),(1,3),(3,4),(3,5)}
则有:
LCA(T,5,2)=1
LCA(T,3,4)=3
LCA(T,4,5)=3
RMQ问题与LCA问题的关系紧密,可以相互转换,相应的求解算法也有异曲同工之妙。下面给出LCA问题向RMQ问题的转化方法。
对树进行深度优先遍历,每当“进入”或回溯到某个结点时,将这个结点的编号存入数组E最后一位。同时记录结点i在数组中第一次出现的位置(事实上就是进入结点i时记录的位置),记做R[i]。如果结点E[i]的深度记做D[i],易见,这时求LCA(T,u,v),就等价于求E[RMQ(D,R[u],R [v])],(R[u]<R[v]),其中RMQ(D,R[u],R [v])就是在D数组中求下标从R[u]到R[v]的最小值的下标。例如一,求解步骤如下:
数列E[i]为:1,2,1,3,4,3,5,3,1
R[i]为:1,2,4,5,7
D[i]为:0,1,0,1,2,1,2,1,0
于是有:
LCA(T,5,2) = E[RMQ(D,R[2],R[5])] = E[RMQ(D,2,7)] = E[3] = 1
LCA(T,3,4) = E[RMQ(D,R[3],R[4])] = E[RMQ(D,4,5)] = E[4] = 3
LCA(T,4,5) = E[RMQ(D,R[4],R[5])] = E[RMQ(D,5,7)] = E[6] = 3
易知,转化后得到的数列长度为树的结点数的两倍减一, 所以转化后的RMQ问题与LCA问题的规模同次。
再举一个例子帮助理解:
(1)
/ \(2) (7)
/ \ \
(3) (4) (8)
/ \
(5) (6)
一个nlogn 预处理,O(1)查询的算法.
Step 1:
按先序遍历整棵树,记下两个信息:结点访问顺序和结点深度.
如上图:
结点访问顺序是: 1 2 3 2 4 5 4 6 4 2 1 7 8 7 1 //共2n-1个值
结点对应深度是: 0 1 2 1 2 3 2 3 2 1 0 1 2 1 0
Step 2:
如果查询结点3与结点6的公共祖先,则考虑在访问顺序中
3第一次出现,到6第一次出现的子序列: 3 2 4 5 4 6.
这显然是由结点3到结点6的一条路径.
在这条路径中,深度最小的就是最近公共祖先(LCA). 即
结点2是3和6的LCA.
Step 3:
于是问题转化为, 给定一个数组R,及两个数字i,j,如何找出
数组R中从i位置到j位置的最小值..
如上例,就是R[]={0,1,2,1,2,3,2,3,2,1,0,1,2,1,0}.
i=2;j=7;
接下来就是经典的RMQ问题.
#include <cstdio> #include <cstring> #include <cmath> #include <algorithm> using namespace std; #define maxn 100010 int cnt,id; int head[maxn]; bool vis[maxn]; int dep[maxn*2+1], E[maxn*2+1], R[maxn];//R表示节点第一次出现的位置;dep表示时间戳为i时的深度;E表示时间戳为i时的节点 int f[maxn*2+1][20],d[50]; //f[] is RMQ, d[i] is 2^i struct Edge { int to,next,weight; }edges[maxn]; //邻接表 void init() { cnt=id=0; memset(vis,false,sizeof(vis)); memset(head,-1,sizeof(head)); } void insert(int a, int b, int weight) { edges[cnt].to=b; edges[cnt].next=head[a]; edges[cnt].weight=weight; head[a]=cnt++; } void DFS(int u, int d) { vis[u]=1; R[u]=id;E[id]=u;dep[id++]=d; for(int i = head[u]; i != -1; i=edges[i].next) { int v=edges[i].to; if(!vis[v]) { DFS(v,d+1); E[id]=u;dep[id++]=d; } } } void InitRMQ(const int &id,int n) { d[0]=1; for(int i = 1; i < n; i++)d[i]=2*d[i-1]; for(int i = 0; i < id; i++)f[i][0]=i; int k=int(log(double(n))/log(2.0))+1; for(int j = 1; j < k; j++) for(int i = 0; i < id; i++) { if(i+d[j-1]-1<id) f[i][j]=dep[f[i][j-1]]>dep[f[i+d[j-1]][j-1]]?f[i+d[j-1]][j-1]:f[i][j-1]; else break; } } int Query(int x, int y) { int k; k=int(log(double(y-x+1))/log(2.0)); return dep[f[x][k]]>dep[f[y-d[k]+1][k]]?f[y-d[k]+1][k]:f[x][k]; } void Answer() { int Q;scanf("%d",&Q); for(int i = 0; i < Q; i++) { int x,y; scanf("%d%d",&x,&y); //查询x,y的LCA x=R[x];y=R[y]; if(x>y)swap(x,y); printf("%d\n",E[Query(x,y)]); } } int main() { int t;scanf("%d",&t); while(t--) { init(); int n,m;scanf("%d%d",&n,&m); for(int i = 0; i < m; i++) { int a,b,c;scanf("%d%d%d",&a,&b,&c); insert(a,b,c); } DFS(1,0); InitRMQ(id,n); Answer(); } return 0; }