浅谈 Tarjan 算法之强连通分量(危

引子

果然老师们都只看标签拉题。。。

2020.8.19新初二的题集中出现了一道题目(现已除名),叫做Running In The Sky。

OJ上叫绮丽的天空

发现需要处理环,然后通过一些神奇的渠道了解到有个东西叫缩点。

紧接着搜了一下缩点,发现了 Tarjan 算法。

然后又翻了翻算法竞赛,于是一去不复返……


一些定义

给定一张有向图。对于图中任意两个节点 x , y x, y x,y,存在从 x x x y y y 的路径,也存在 y y y x x x 的路径。则称该有向图为“强连通图”。

有向图的强连通子图被称为强连通分量 S C C SCC SCC ( S t r o n g l y (Strongly (Strongly C o n n e c t e d Connected Connected C o m p o n e n t ) Component) Component)

显然,环一定是强连通图。因为如果在有向图中存在 x x x y y y 的路径,且存在 y y y x x x 的路径,那么 x , y x, y x,y 一定在同一个环中。

对于一个有向图,如果从 r o o t root root 可以到达图中所有的点,则称其为“流图”,而 r o o t root root 为流图的源点。

r o o t root root 为原点对流图深度优先遍历,每个点只访问一次,在过程中,所有发生递归的边 ( x , y ) (x, y) (x,y) 构成的一棵树叫做这个流图的搜索树

在深度优先遍历时,对每个访问到的节点分别进行整数 1... n 1...n 1...n 标记,该标记被称为时间戳,记为 d f n [ x ] dfn[x] dfn[x]

流图中的每条有向边 ( x , y ) (x, y) (x,y) 必然是以下四种中的一种:

  1. 前向边,指搜索树中 x x x y y y 的祖先节点

  2. 后向边,指搜索树中 y y y x x x 的祖先节点

  3. 树枝边,指搜索树里的边,满足 x x x y y y 的父节点。

  4. 其他边(好像也叫横叉边),指除了上面三种情况的边。且一定满足 d f n [ y ] < d f n [ x ] dfn[y] < dfn[x] dfn[y]<dfn[x]


Tarjan算法之强连通分量

Tarjan 算法基于有向图的深度优先遍历,能够在线性时间中求出一张有向图的各个强连通分量。

其核心思想就是考虑两点之间是否存在路径可以实现往返。

我们在后文中,都会结合搜索树(本身就是深度优先遍历的产物)来考虑,这样就可以在深度优先遍历的同时完成我们的目标。

对于流图,前向边作用不大,因为当前搜索树中一定存在 x x x y y y 的路径。

后向边就很重要了,因为它一定可以和搜索树中 x x x y y y 的路径组成环。

横叉边需要判断一下,如果这条横叉边能到达搜索树上 x x x 的祖先(显然, x x x 的祖先一定可以到达 x x x)。记这个祖先为 z z z,则这条横叉边一定能和它到 z z z 的路径, z z z x x x 的路径组成环。

为了找到横叉边与后向边组成的环,我们考虑在深度优先遍历的同时维护一个栈。

当遍历到 i i i 节点时,栈里一定有以下一些点:

  1. 搜索树上 i i i 的所有祖先集合 j j j。若此时存在后向边 ( i , j ) (i, j) (i,j),则 ( i , j ) (i, j) (i,j) 一定与 j j j i i i 的路径形成环。
  2. 已经访问过的点 k k k,且满足从 k k k 出发一定能找到到 j j j 的路径。此时, ( i , k ) (i, k) (i,k) k k k j j j 的路径, j j j i i i 的路径一定会形成环。

于是我们引入回溯值的概念。回溯值 l o w [ x ] low[x] low[x] 表示以下节点的最小时间戳:

  1. 该点在栈中。
  2. 存在一条从流图的搜索树中以 x x x 为根的子树为起点出发的有向边,以该点为终点。(也就是以它为起点能继续往下遍历到的点)

如果当前的 l o w [ x ] low[x] low[x] 表示的最小时间戳代表的点集全是2类点,则易得 l o w [ x ] = d f n [ x ] low[x] = dfn[x] low[x]=dfn[x] 时强连通分量存在,且 x x x 是此强连通分量的根(整个强连通分量中时间戳最小的节点)。

如果表示的点集存在1类点。则当前点一定属于强连通分量,且该强连通分量的根为整个强连通分量中时间戳最小的节点。

当我们判断了存在以当前点为根的强连通分量后,从栈中不断取出点,直到取出的点与当前点相等,我们就得到了整个强连通分量的信息。

整理更新回溯值的方法:

  1. 如果当前点第一次被访问,入栈,且 l o w [ x ] = d f n [ x ] low[x] = dfn[x] low[x]=dfn[x]
  2. 遍历从 x x x 为起点的每一条边 ( x , y ) (x, y) (x,y)。若 y y y 被访问过,且 y y y 在栈中,那么 l o w [ x ] = m i n ( l o w [ x ] , d f n [ y ] ) low[x] = min(low[x], dfn[y]) low[x]=min(low[x],dfn[y])。若 y y y 没被访问过,递归访问 y y y,在回溯之后更新 l o w [ x ] = m i n ( l o w [ x ] , l o w [ y ] ) low[x] = min(low[x], low[y]) low[x]=min(low[x],low[y])。(典型 d p dp dp思想)

具体实现

int dfn[MAXN], low[MAXN];
// 时间戳及回溯值。
vector <int> scc[MAXN];
// 储存最后求出的各个强连通分量的信息。
int key[MAXN];
// key[i]表示i在编号为key[i]的强连通分量中。

stack<int> st; // 栈。
bool vis[MAXN];
// 记录是否在栈中。
int num = 0, cnt = 0; 
// num 时间戳标记。cnt 强连通分量标记。

void tarjan(int x) {
	num++; 
	dfn[x] = num;
	low[x] = num;
	st.push(x); 
	vis[x] = true;		
    // 第一次遍历到,记录时间戳,入栈,记录当前回溯值		
	for(int i = 0; i < map_first[x].size(); i++) { // 枚举每条边。
		int j = map_first[x][i];
		if(!dfn[j]) { // 如果当前边的终点没被遍历过。
			tarjan(j); // 递归遍历。
			low[x] = min(low[x], low[j]);
            // 维护回溯值。
		}
		else if(vis[j]) // 如果遍历过且在栈中。
			low[x] = min(low[x], dfn[j]);
            // 维护回溯值。
	}
	if(dfn[x] == low[x]) { // 如果存在以当前点为根的强连通分量。			
		cnt++;
		int now = 0;
		while(x != now) { // 找出栈中所有在当前强连通分量中的点。
			now = st.top();
			st.pop();
			vis[now] = false; 
			key[now] = cnt;	// 存所在编号。
			scc[cnt].push_back(now); // 存点。
		}
	}	
}

缩点

缩点。其实就是指的把环看成一个点来进行后面的图论算法。而把环看成的这个点的点权在题目中会具体说明。

比较常见的缩点后的点权是整个环路的所有点的点权和。

如下图:

1 -> 2 -> 4 -> 5 -> 2 -> 3

显然上图存在环路。在经过缩点后,我们可以将它变成这样:

1 -> 2(value[2] + value[4] + value[5]) -> 3

思路比较简单,我就直接分析代码了。。。

具体实现

for(int i = 1; i <= n; i++) 
    for(int j = 0; j < map_first[i].size(); j++) {
        // 枚举原图中的每一条边。
        int v = map_first[i][j];
        if(key[i] == key[v]) 
        // 如果这个边的两端属于同一个强连通分量,则直接放弃这条连边。
            continue;
        map_second[key[i]].push_back(key[v]);
        // 将两个点对应的强连通分量的编号相连,加入新图。
        // 显然,单个点也属于一个强连通分量。
    }

现在,我们再来看看引子中提到的那道题吧。。。

题目描述

一天的活动过后,所有学生都停下来欣赏夜空下点亮的风筝。 C u r t i s Curtis Curtis N i s h i k i n o Nishikino Nishikino想要以更近的视角感受一下,所以她跑到空中的风筝上去了(这对于一个妹子来说有点匪夷所思)! 每只风筝上的灯光都有一个亮度 k i k_i ki. 由于风的作用,一些风筝缠在了一起。但是这并不会破坏美妙的气氛,缠在一起的风筝会将灯光汇聚起来,形成更亮的光源!

C u r t i s Curtis Curtis N i s h i k i n o Nishikino Nishikino已经知道了一些风筝间的关系,比如给出一对风筝 ( a , b ) (a,b) (a,b), 这意味着她可以从 a a a 跑到 b b b 上去,但是不能返回。

现在,请帮她找到一条路径(她可以到达一只风筝多次,但只在第一次到达时她会去感受上面的灯光), 使得她可以感受到最多的光亮。同时请告诉她这条路径上单只风筝的最大亮度,如果有多条符合条件的路径,输出能产生最大单只风筝亮度的答案。

输入格式

第一行两个整数 n n n m m m n n n 是风筝的数量, m m m 是风筝间关系对的数量。

接下来一行 n n n 个整数 k i k_i ki

接下来 m m m 行, 每行两个整数 a a a b b b, 即 C u r t i s Curtis Curtis 可以从 a a a 跑到 b b b

输出格式

一行两个整数。 C u r t i s Curtis Curtis 在计算出的路径上感受到的亮度和,这条路径上的单只风筝最大亮度。

样例输入

5 5
8 9 11 6 7
1 2
2 3
2 4
4 5
5 2

样例输出

41 11

分析

显然这道题是有环的对吧。

如果我们不考虑环的情况,其实就是一个很板白菜的题目。

我们可以采用拓扑排序的思路,遍历整个图,然后对于每个路径维护一下到当前点的最大距离,并维护一个这个路径上的最大值。

然后考虑有环,很简单,事先 Tarjan 缩点嘛/xyx

并且这道题是要累加路径上的点的和。所以缩点后的点就是当前强连通分量包含的所有点的点权和。

AC代码

#include  
#include 
#include 
#include 
#include 
#include 
using namespace std;

const int MAXN = 200005;
int n, m;
int value[MAXN];

vector<int> map_first[MAXN]; 
// 原图。 
int dfn[MAXN], low[MAXN];

struct data {
	int ma, sum;
	data() {
		ma = 0;
		sum = 0;
	}
	data(int Ma, int S) {
		ma = Ma;
		sum = S;
	}
} scc[MAXN]; 
// Tarjan 求出的强连通分量中,维护两个信息。
// 1.ma 表示整个强连通分量的最大值。 
// 2.sum 表示整个强连通分量的点权和,即缩点后的点权。 
int key[MAXN];

stack<int> st;
bool vis[MAXN];
int num = 0, cnt = 0;

void tarjan(int x) { // tarjan 算法。 
	num++;
	dfn[x] = num;
	low[x] = num;
	st.push(x);
	vis[x] = true;				
	for(int i = 0; i < map_first[x].size(); i++) {
		int j = map_first[x][i];
		if(!dfn[j]) {
			tarjan(j);
			low[x] = min(low[x], low[j]);
		}
		else if(vis[j]) 
			low[x] = min(low[x], dfn[j]);
	}
	if(dfn[x] == low[x]) {			
		cnt++;
		int now = 0;
		while(x != now) {
			now = st.top();
			st.pop();
			vis[now] = false;
			key[now] = cnt;		
			scc[cnt].ma = max(scc[cnt].ma, value[now]);
			scc[cnt].sum += value[now];
			// 维护一下强连通分量的两个信息。 
		}
	}	
}

vector<int> map_second[MAXN]; // 新图。 
int in[MAXN]; // 拓扑排序,统计点的入度。 
int dp[MAXN][2];
// dp[i][0]表示到i点的最长路径。 
// dp[i][1]表示路径上的最大点权。 

void T_Sort() { // 拓扑。 
	queue<int> q;
	for(int i = 1; i <= cnt; i++) {
		dp[i][0] = scc[i].sum;
		dp[i][1] = scc[i].ma;
	}
	for(int i = 1; i <= cnt; i++) 
		if(!in[i]) 
			q.push(i);
	while(!q.empty()) {
		int x = q.front();
		q.pop();
		for(int i = 0; i < map_second[x].size(); i++) {
			int v = map_second[x][i];
			in[v]--;
			if(!in[v]) 
				q.push(v);
			if(dp[v][0] < dp[x][0] + scc[v].sum) {
				dp[v][0] = dp[x][0] + scc[v].sum;
				dp[v][1] = max(dp[x][1], scc[v].ma);
				// 更新最长路径及最大点权。 
			}
			if(dp[v][0] == dp[x][0] + scc[v].sum) 
				dp[v][1] = max(dp[v][1], dp[x][1]);
			// 如果有两条最长路径则记录两条路径中的最大值。 
		}
	}
}

int main() {
	scanf ("%d %d", &n, &m);
	for(int i = 1; i <= n; i++) {
		scanf ("%d", &value[i]);
		key[i] = i;
	}
	for(int i = 1; i <= m; i++) {
		int u, v;
		scanf ("%d %d", &u, &v);
		map_first[u].push_back(v);
	}
	
	for(int i = 1; i <= n; i++)
		if(!dfn[i]) // 如果当前点没被遍历,则跑一遍 Tarjan。 
			tarjan(i); 
			
	for(int i = 1; i <= n; i++) 
		for(int j = 0; j < map_first[i].size(); j++) {
			int v = map_first[i][j];
			if(key[i] == key[v])
				continue;
			map_second[key[i]].push_back(key[v]);
			in[key[v]]++;
		}
	// 缩点,存新图。 
	
	T_Sort();
	int ans = 1;
	for(int i = 2; i <= cnt; i++) // 统计答案。 
		if(dp[i][0] > dp[ans][0] || (dp[i][0] == dp[ans][0] && dp[i][1] > dp[ans][1])) 
			ans = i;
	printf("%d %d", dp[ans][0], dp[ans][1]);
	return 0;
} 

你可能感兴趣的:(图论,数据结构,算法,图论)