并查集(按秩合并+路径压缩)基础讲解

并查集入门

并查集算法在很多算法中都会简单的涉及,比如最小生成树的kruskal算法等。其主要功能是检查不同元素是否属于同一个连通块。主要运用是在图相关的内容中。

并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。

内容讲解

主要特征

  1. 在不同的不相交集合中选出一个代表元素,称为代表元
    一般这个代表元代表这个集合。查找一个元素只需要查找这个元素所在集合的代表元即可确定它所在集合。
  2. 每个不相交集合都是以代表元为根节点的森林
    一般代表元构成集合根节点,剩下元素构成森林各层的节点。
  3. 并查集元素存储形式采用数组表示法
    因为并查集所有的操作只需要维护元素对父节点的指向,所以存储形式采用一个数组pre[x]=a来存储,其中x代表当前元素,a代表x元素的父节点。

主要操作

并查集的主要操作分为三个内容:初始化,合并,查找。

初始化

构建数组pre[max]和rank[x](rank[x]是在按秩合并时用的,如果题目要求不严格可以不构建)。rank[x]代表x这个元素在自己集合构成的森林中的层数。因为并查集还未合并,所以每个元素代表一个集合,即他自己就是代表元,并且层数是0,初始化方式是pre[x]=x;rank[x]=0;

#define NUM 100//char或者别的格式皆可,看元素是什么格式
int pre[NUM];//char或者别的格式皆可,看元素是什么格式
int rank[NUM];
int creat(int i)//代表第i个元素需要初始化
{
	pre[i]=i;
	rank[i]=0;
}

合并

这里用到了一个小技巧——按秩合并。
按秩合并可以通过减少森林的深度,来节约之后搜索的时间。
举个简单的例子,合并以下两个集合
并查集(按秩合并+路径压缩)基础讲解_第1张图片
如果将A集合合并到D集合,不难发现,合并后的层数依旧是三层
并查集(按秩合并+路径压缩)基础讲解_第2张图片
如果将D合并到A上,那么深度就会变成四层。
并查集(按秩合并+路径压缩)基础讲解_第3张图片
多一层子节点的搜索就会变多,按秩合并就是通过减少层数来减少搜索次数,从而优化时间复杂度。

void Union(int i,int j)
{
    i=Find_pre(i);
    j=Find_pre(j);
    if(i==j) return ;
    if(rank[i]>rank[j]) pre[j]=i;
    else
    {
        if(rank[i]==rank[j]) rank[j]++;  
        pre[i]=j;
    }
}

查找

首先给一种最常规的算法
查找如果是自己就说明本身是代表元,如果不是自己就往前查找直到找到代表元。

int Find_pre(int i)
{
   if(pre[i]==i)
       return pre[i];
    return  Find_pre(pre[i]);       
}

然后介绍并查集的另一个技巧——路径压缩。
路径压缩是为了防止如图出现的不平衡状态。
并查集(按秩合并+路径压缩)基础讲解_第4张图片
如果并查集是这种形式那么搜索后面的元素那么就会需要O(n)的复杂度,如果所有的元素全部搜索那么就会达到O(n2)的复杂度。
所以采取按秩合并的方法,合并后的形式就会成为
并查集(按秩合并+路径压缩)基础讲解_第5张图片
这样搜索每一个元素所需时间复杂度为O(1),全搜索时间为O(n)比最差情况快了很多
下面是递归代码

int find(int n)//路径压缩
{
	if (pre[n] == n) 
		return n;
	else
	{
		int temp = find(pre[n]);
		pre[n] = temp;
		return temp;
	}
}

尽管递归好理解并且好写,但是如果数据过大,递归有可能会爆栈,所以以下给出相对优化的非递归算法。

int find(int x)
{
    int k, j, r;
    r = x;
    while(r != parent[r])
        r = parent[r];
    k = x;        
    while(k != r) 
    {
        j = parent[k]; 
        parent[k] = r; 
        k = j; 
    }
    return r; 
}

你可能感兴趣的:(算法)