1 并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。
需要实现的操作有:合并两个集合,判断两个元素是否属于一个集合。
这里介绍的主要是普通的并查集,很多情况下使用的并查集是需要扩展的,根据使用情况的不同,有很多差别,这里仅仅是最基本的算法。
2. 复杂度
T=O(n*α(n)) , 其中α(x),对于x=宇宙中原子数之和,α(x)不大于4。事实上,路经压缩后的并查集的复杂度是一个很小的常数即O(α(n))。
(α(n)是阿克曼(Ackermann)函数的反函数。这比O(log(n))还要快。)
3. 伪代码
没有使用路径压缩和启发式的方法。
使用路径压缩,改进getfather。
另外,还可以改进union,把数量少的集合合并到数量大的集合中,不过这就要记录
每个集合中的元素数量,相当于增加了O(N)的存储空间,而且在getfather中也应该
保持对元素数量的维护,相对代码复杂度偏高,代码如下(复杂度变为 O(α(n)) ):
int father[MAXN], Rank[MAXN];
//初始化n个元素
void Init(int n)
{
int i;
for (i = 1; i <= n; i++)
father[i] = i;
Rank[i] = 0;
}
//查询树的根
int find(int x) {
if (father[x] == x)return x;
return father[x] = find(father[x]);
}
//合并x和y所属的集合
void Unite(int x, int y) {
x = find(x);
y = find(y);
if (x == y)return;
if (Rank[x] > Rank[y]) {
father[y] = x;
}
else {
father[x] = y;
if (Rank[x] == Rank[y])Rank[x]++;
}
}
//判断x和y是否属于同一个集合
bool same(int x, int y) {
return find(x)== find(y);
}
直接上这一道经典到不能再经典的并查集题目:
Time Limit: 1000MS | Memory Limit: 10000K | |
Total Submissions: 26553 | Accepted: 7718 |
Description
Input
Output
Sample Input
100 7 1 101 1 2 1 2 2 2 3 2 3 3 1 1 3 2 3 1 1 5 5
Sample Output
3题意:
三类动物A、B、C构成食物链循环,告诉两个动物的关系(同类或天敌),判断那个关系是和前面已有的冲突。
分析:
并查集的高级应用。
假设father[A]=B ,rank[A]=0表示A与B同类;rank[A]=1 表示B可以吃A;rank[A]=2 表示A可以吃B。
对于一组数据 d x y,若x与y的根节点相同,利用(rank[y]-rank[x]+3)%3!=d-1若不相等说明为假话;
若x与y根节点不同,说明两者不在同一集合里,进行组合。让x的根fx成为y的根fy的父节点(father[fy]=fx),rank[fy]的值需要仔细归纳得出。
#include
#include
#define MAXN 50001
int father[MAXN], Rank[MAXN];
void Init(int n)
{
int i;
for (i = 1; i <= n; i++)
father[i] = i;
memset(Rank, 0, sizeof(Rank));
}
int Find_Set(int x)
{
if (x != father[x])
{
int fx = Find_Set(father[x]);
Rank[x] = (Rank[x] + Rank[father[x]]) % 3; //注意 是rank[father[x]]而不是rank[fx]
//(儿子relation + 父亲relation) % 3 = 儿子对爷爷的relation 下面会有归纳证明
father[x] = fx;
/*这个还是有必要解释一下的,原本Rank[x]是x与父节点father[x]的关系,而由于父节点father[x]在不断变化
直到变成根节点(所以Rank[x]也要不断更新直到确定与根节点的关系)
如何更新?我们可以总结出如下规律:
//我们可以用动物之间“相对”的关系来确定一个并查集。
//0 - 这个节点与它的父节点是同类
//1 - 这个节点被它的父节点吃
//2 - 这个节点吃它的父节点。
i j j是儿子与父亲的关系,i是父亲与爷爷的关系
爷爷 父亲 儿子 儿子与爷爷
0 0 (i + j) % 3 = 0
0 1 (i + j) % 3 = 1
0 2 (i + j) % 3 = 2
1 0 (i + j) % 3 = 1
1 1 (i + j) % 3 = 2
1 2 (i + j) % 3 = 0
2 0 (i + j) % 3 = 2
2 1 (i + j) % 3 = 0
2 2 (i + j) % 3 = 1
嗯,这样可以看到,(儿子relation + 父亲relation) % 3 = 儿子对爷爷的relation
这就是路径压缩的节点算法
所以每次都用Rank[x] = (Rank[x] + Rank[father[x]]) % 3;来更新x 与 x的父亲的父亲 的关系
即x(儿子)与爷爷的关系,而这个变化的爷爷节点会不断延伸至根节点(递归寻根),所以
只有通过不断地更新关系最后当到达根节点时,Rank[x]就是x与根节点的关系。*/
}
return father[x];
}
bool Union(int x, int y, int type)
{
int fx, fy;
fx = Find_Set(x);
fy = Find_Set(y);
if (fx == fy)
{
if ((Rank[y] - Rank[x] + 3) % 3 != type)return true;
//通过上面的关系图可以得到,若不符合上述关系则返回true表示 错误的说法要+1
else return false;
}
father[fy] = fx;
Rank[fy] = (Rank[x] - Rank[y] + type + 3) % 3;
/*这个怎么来的呢?
首先x和y是不同根的(fx!=fy),此时进行并根操作(father[fy]=fx),fy的父亲变为fx,
即fx是总根节点,有fx←x,fx←fy←y。
由上面的关系: (儿子relation + 父亲relation) % 3 = 儿子对爷爷的relation可以得到:
(Rank[x]+type+3)%3即可得到 fx 与 y 的关系, 设为Rank[fx←y]
这是因为Rank[x]为fx与x关系,type是x与y的关系(即d - 1)
而同理(Rank[fy] + Rank[y] + 3) % 3=Rank[fx←y]
这是因为有fx←fy←y,而此时Rank[fy]是要求的,所以可以得到:
Rank[fy]=(Rank[fx←y]-Rank[y]+3)%3
将Rank[fx←y]=(Rank[x] + type + 3) % 3代入即可得:
Rank[fy] = (Rank[x] - Rank[y] + type + 3) % 3;*/
return false;
}
int main()
{
//freopen("in.txt", "r", stdin);
int n, k;
int sum, i;
int d, x, y;
scanf("%d %d", &n, &k);
//cin>>n>>k;
Init(n);
sum = 0;
for (i = 0; i>d>>x>>y; //用cin会超时
if (x>n || y>n || (x == y && d == 2))
sum++;
else if (Union(x, y, d - 1)) //传d-1 方便关系式的表达
sum++;
}
printf("%d\n", sum);
return 0;
}
http://blog.csdn.net/tiantangrenjian/article/details/7085575