并查集(Disjoint set或者Union-find set)是一种简单的用途广泛的算法和数据结构。并查集是若干个不相交集合,能够实现较快的合并和判断元素所在集合的操作,应用很多,如其求无向图的连通分量个数等。
并查集可以方便地进行以下三种操作:
1、Make_Set(x) 把每一个元素初始化为一个集合
初始化后每一个元素的父亲节点是它本身,每一个元素的祖先节点也是它本身(也可以根据情况而变)。
2、Find_Set(x) 查找一个元素所在的集合
查找一个元素所在的集合,其精髓是找到这个元素所在集合的祖先。这个才是并查集判断和合并的最终依据。
判断两个元素是否属于同一集合,只要看他们所在集合的祖先是否相同即可。
合并两个集合,也是使一个集合的祖先成为另一个集合的祖先,具体见示意图。
3、Union(x,y) 合并x,y 所在的两个集合
合并两个不相交集合操作很简单:
利用Find_Set找到其中两个集合的祖先,将一个集合的祖先指向另一个集合的祖先。如图
并查集的优化:
1、Find_Set(x)时 路径压缩
寻找祖先时我们一般采用递归查找,但是当元素很多亦或是整棵树变为一条链时,每次Find_Set(x)都是O(n)的复杂度,有没有办法减小这个复杂度呢?
答案是肯定的,这就是路径压缩,即当我们经过"递推"找到祖先节点后,"回溯"的时候顺便将它的子孙节点都直接指向祖先,这样以后再次Find_Set(x)时复杂度就变成O(1)了,如下图所示;可见,路径压缩方便了以后的查找。
这两种技术可以互补,可以应用到另一个上,每个操作的平均时间仅为$O(\alpha(n))$,$\alpha(n)$是n = f(x) = A(x,x)的反函数,并且A是急速增加的阿克曼函数。因为$\alpha(n)$是其的反函数,$\alpha(n)$对于可观的巨大n还是小于5。因此,平均运行时间是一个极小的常数。
2、Union(x,y)时 按秩合并
即合并的时候将元素少的集合合并到元素多的集合中,这样合并之后树的高度会相对较小。
有了背景知识,我们来看如何利用它来解决:
给一个整数数组, 找到其中包含最多连续数的子集,比如给:15, 7, 12, 6, 14, 13, 9, 11,则返回: 5:[11, 12, 13, 14, 15] 。最简单的方法是sort然后scan一遍,但是要o(nlgn),有什么O(n)的方法吗?
首先,Make_Set(x)将每个元素变成一个并查集,然后扫描,Union(x-1, x),Union(x, x+1)。
接下来的问题是怎么快速找到x-1,x+1的位置?那么需要引入查找为常数复杂度的哈希表。
1 #include <iostream> 2 #include<hash_map> 3 using namespace std; 4 5 const int MAX = 100; 6 int Father[MAX]; 7 int Rank[MAX]; 8 9 void MakeSet(int x){ 10 Father[x] = x; 11 Rank[x] = 1; 12 } 13 14 int FindFather(int x){ 15 if(x != Father[x]) 16 Father[x] = FindFather(Father[x]); 17 return Father[x]; 18 } 19 20 void Union(int x, int y){ 21 int a = FindFather(x); 22 int b = FindFather(y); 23 if(a == b) 24 return; 25 else{ 26 int ar = Rank[a]; 27 int br = Rank[b]; 28 if(ar <= br){ 29 Father[a] = b; 30 Rank[b] += Rank[a]; 31 }else{ 32 Father[b] = a; 33 Rank[a] += Rank[b]; 34 } 35 } 36 } 37 38 int main() 39 { 40 const int length = 15; 41 int arr[length] = {15, 7, 12, 6, 14, 13, 10, 11, 4, 5, 8, 3, 2, 16, 17}; 42 hash_map<int,int> ihmap; 43 for(int i = 0; i < length; ++i) 44 { 45 MakeSet(i); 46 ihmap[arr[i]]=i; 47 } 48 49 for(int i = 0; i < length; ++i) 50 { 51 hash_map<int,int>::iterator tmp; 52 tmp = ihmap.find(arr[i]-1); 53 if(tmp != ihmap.end()) 54 { 55 Union(i,tmp->second); 56 } 57 tmp = ihmap.find(arr[i]+1); 58 if(tmp != ihmap.end()) 59 { 60 Union(i,tmp->second); 61 } 62 } 63 int max = Rank[0]; 64 int father = 0; 65 for(int i = 1; i< length; ++i) 66 if(Rank[i]>max){ 67 max = Rank[i]; 68 father = i; 69 } 70 cout<<max<<endl; 71 72 for(int i = 0; i< length; ++i) 73 if(Father[i] == father) 74 cout<<arr[i]<<' '; 75 cout<<endl; 76 77 return 0; 78 }
转自:http://blog.csdn.net/doc_sgl/article/details/11667301