转载自:http://hi.baidu.com/scameeling/blog/item/60f25a8dc50347e3f01f36f0.html
一、基本概念
无向图
割点:删掉它之后(删掉所有跟它相连的边),图必然会分裂成两个或两个以上的子图。
块:没有割点的连通子图
割边:删掉一条边后,图必然会分裂成两个或两个以上的子图,又称桥。
缩点:把没有割边的连通子图缩为一个点,此时满足任意两点间都有两条路径相互可达。
求块跟求缩点非常相似,很容易搞混,但本质上完全不同。割点可以存在多个块中(假如存在k个块中),最终该点与其他点形成k个块,对无割边的连通子图进行缩点后(假设为k个),新图便变为一棵k个点由k-1条割边连接成的树,倘若其中有一条边不是割边,则它必可与其他割边形成一个环,而能继续进行缩点。
有割边的图也不定有割点,如:
3是割点,分别与(1,2)和(4,5)形成两个无割点的块 w(1,2)为割边,
有向图
强连通分量:有向图中任意两点相互可达的连通子图,其实也十分类似于无向图中的缩点
二、算法
无向图
借助两个辅助数组dfn[],low[]进行DFS便可找到无向图的割点和割边,用一个栈st[]维护记录块和“缩点”后连通子图中所有的点。
dfn[i]表示DFS过程中到达点i的时间,low[i]表示能通过其他边回到其祖先的最早时间。low[i]=min(low[i],dfn[son[i]])
设 v,u之间有边w(v,u),从v->u:
如果low[u]>=dfn[v],说明v的儿子u不能通过其他边到达v的祖先,此时如果拿掉v,则必定把v的祖先和v的儿子u,及它的子孙分开,于是v便是一个割点,v和它的子孙形成一个块。
如果low[u]>dfn[v]时,则说明u不仅不能到达v的祖先,连v也不能通过另外一条边直接到达,从而它们之间的边w(v,u)便是割边,求割边的时候有一个重边的问题要视情况处理,如果v,u之间有两条无向边,需要仍视为割边的话,则在DFS的时候加一个变量记录它的父亲,下一步遇到父结点时不扩展回去,从而第二条无向重边不会被遍历而导致low[u]==dfn[v] ,而在另外一些问题中,比如电线连接两台设备A,B 如果它们之间有两根电线,则应该视为是双连通的,因为任何一条电线出问题都不会破坏A和B之间的连通性,这个时候,我们可以用一个used[]数组标记边的id,DFS时会把一条无向边拆成两条有向边进行遍历,但我们给它们俩同一个id号,在开始遍历v->u前检查它的id是否在上一次u->v时被标记,这样如果两点之间有多条边时,每次遍历都只标记其中一条,还可以通过其他边回去,形成第二条新的路
求割点的时候,维护一个栈st 每遍历到一个顶点v则把它放进去,对它的子孙u如果dfn[u]为0,则表示还没有遍历到则先DFS(u),之后再判断low[u]和dfn[v],如果low[u]>=dfn[v],则把栈中从栈顶到v这一系列元素弹出,这些点与v形成一个块,如果u的子孙x也是一个割点,这样做会不会错把它们和v,u放在一起形成一个块呢,这种情况是不会发生的,如果发现x是一个割点,则DFS到x那一步后栈早就把属于x的子孙弹出来了,而只剩下v,u的子孙,它们之间不存在割点,否则在回溯到v之前也早就提前出栈了!画一个图照着代码模拟一下可以方便理解。
求割边也是一样的。
有向图
有向图强连通分量的算法有两个,一个是Kosaraju,另一个是Tarjan,前者需要两次DFS,代码量偏大但容易理解,后者只需要一次DFS和维护一个栈便可以,实现简单,
三、代码实现
割点和块
求割点的时候由于不知道最开始选的树根是不是只有一个儿子,这样在DFS过来中不会满足low[u]>=dfn[v]而判为割点,但有两个或两个以上儿子的根肯定也是一个割点,所以要特判!
void CutBlock(int v){ dfn[v]=low[v]=++cnt; st[++top]=v; for(int i=p[v];i!=-1;i=edge[i].pre){ int u(edge[i].d); if(dfn[u]==0){ CutBlock(u); GetMin(low[v],low[u]); if(low[u]>=dfn[v]){ //V是一个割点 block[0]=0; while (true) { block[++block[0]]=st[top]; if (st[top--] == u) //只能弹到u为止,v还可以在其他块中 break; } block[++block[0]]=v;//割点属于多个块,一定要补进去 Count(block); } } else GetMin(low[v],dfn[u]); } }
void CutEdge(int v,int fa){ dfn[v]=low[v]=++cnt; st[++top]=v; for(int i=p[v];i!=-1;i=edge[i].pre){ int u(edge[i].d); if(u==fa)continue; if(!dfn[u]){ CutEdge(u,v); GetMin(low[v],low[u]); if(low[u]>dfn[v]){//边v->u为一条割边 cutE[++numE]=E(v,u); // 将u及与它形成的连通分量的所有点存起来 ++numB; while(1){ id[st[top]]=numB; if(st[top--]==u)break; } } } else GetMin(low[v],dfn[u]); } }
有向图强连通分量
void Tarjan(int v){ dfn[v]=low[v]=++num; used[v]=1; st[++numSt]=v; for(int i=p[v];i!=-1;i=edge[i].pre){ int u(edge[i].d); if(!dfn[u])//还没有标号的点 { Tarjan(u);//先遍历它的子结点 GetMin(low[v],low[u]);//用子结点更新当前点的low值 } else if(used[u]&&GetMin(low[v],dfn[u])); } if(dfn[v]==low[v]){ scc++; while(1){ int u(st[numSt--]); id[u]=scc; used[u]=0; if(v==u)break; } } }
这里需要注意一个地方,上面标记为紫色的那行代码,相比上面两个代码,这里加了一个used[]判断点是否在栈中,为什么前面的不要,而这里需要呢,举个例子
根据dfn可以看出搜索的顺序是1->2->5->6形成一个强连通分量(2,5,6),于是开始退栈,回溯到1从3出发到达4,此时如果直接用dfn[2]更新low[4]的话,会得到low[4]=2,变小后而与dfn[4]不再相等,不能退栈,这与最后的4形成一个单独强连通分量是不符合的,所以,不在栈中的点,不能用来更新当前点的low[]值,为什么无向图不用标记呢,那时因为,边是无向的,有边从4->2同时也必有边2->4由于2之前被标记过,而遍历到当前结点4又不是通过w(2,4)这条边过来的,则必还存在另一条路径可以使2和4是相通的,(即图中的4-3-1-2),从而2,4是双连通的。
顺便总结一下LCA的离线算法
离线是指把所有的问题都存起来,类似邻接表的形式,能根据点v找到它关的点u,处理完后一次性回答所有的答案。
DFS到v时,用used[]标记为已访问,下面分两部分完成
1、在Q个查询中对所有与v相关连的ui,uj,uk,如果检查发现used[]为真,则说明它们的最近公共祖先为ui当前能往上最大程度找到的祖先,这个可借助并查集实现,记录结果用以后面输出。
2、对v所有子结点u(不同于上面的u),进行DFS() ,DFS结束后,设置u的父亲为v,即fa[u]=v;
时间复杂度为O(m+Q ),Q为查询的总数,dist[]记录根到当前点的距离,如果最后要求任意两点v和u之间的距离,则为dist[v]+dist[u]-2*dist[lca(v,u)]
void LcaTarjan(int v){
used[v]=1;
fa[v]=v;
for(int i=q[v];i!=-1;i=e[i].pre){ //对跟v相关每个问题,尝试进行回答
int u(e[i].d),id(e[i].id);
if(used[u])ans[id]=Find(u);
}
for(int i=p[v];i!=-1;i=edge[i].pre){
int u(edge[i].d),w(edge[i].w);
if(!used[u]){
dist[u]=dist[v]+w;
LcaTarjan(u);
fa[u]=v;
}
}
}
四、例题
pku1523>>
先求割点,第二问其实就是求块,一个割点存在k个块中,删掉后,便形成k个子图
pku2942>>
求块后,对每块有:如果存在奇圈,则可以分开开会,否则全T掉,判断奇圈可以用DFS二分染色的方法,当前点染为白色,它所有相邻点染为黑色,如果最后发现某条边两个端点同色,则存在奇圈。
pku3694>>
求割边后,并标记,这时新图形成一棵树,但并不需要缩点,否则反而不好处理,每加一条边w(v,u)进去,必会形成一个圈,剩下的问题但是如何找圈,事先求出v,u的最小公共祖先,加入边w(v,u)后,则这个圈的一部分便是从v到lca(v,u)之间的树边,另一部分是u到lca(v,u)之间的树边,由于一个图中割边的总条数不会超过n,所以可用割边关联的两个顶点中的一个来记录它的位置,这样在沿v或u向lca(v,u)往上找时,快速判断它与它父亲之间相连的边是否为割边,是的话ans-- 并标记为非,因为w(v,u)的加入形成了环,环中原来所有的割边都会变成非割边。用fa[v]表示v的父亲,set[v]表示v的祖先,虽然初始都表示v的父亲,但在LCA时要区分使用,一个只记录它的直接父亲,另一个并查集时压缩路径会改变。
pku 3352>> pku3177>>
求割边,缩点后,形成一棵树,统计度为1的点个数t,需要连的边数则为(t+1)/2 ,pku3177只是多了重边处理,方法见上。
hdu3394>> 求块,如果一个块的顶点数等于边数,则这个块只有一个环,如果边数大于点数,则必有多个环,容易知道在一个K环的块中,每条边也必属于K个环,这样可以计算出在一个环和多个环里的边总数,剩下的便是不在环中的边。