二分图最大匹配

这一篇是总结一下二分图的剩余内容,其中最主要的部分是二分图最大匹配算法。

一. 二分图最大匹配:

1. 二分图最大匹配算法具体在做什么:

        二分图的最大匹配算法,其实就是要找出二分图中一个最大的匹配。那么什么是二分图中的匹配?二分图的匹配本质上是一个集合G',也就是一个原本二分图G的子集。对于G' = (V,E),任取其中的两条边,这两条边关联的顶点是不重合的,就可以说这个二分图G的子集是它的一个匹配。比如下面的例子:

例图1
例图2
例图3

        看上面的例子,原始的二分图为例图1,很容易可以看出,例图2和例图3都是例图1的子图。例图2中的子图,存在1-2,2-3,3-4这三条边,取出1-2,2-3这两条边来分析,它们有公共点2,因此例图2这个子图不是原二分图的匹配。例图3中的子图,有两条边1-2,3-4。取这两条边来分析,没有公共点,所以是原图的一个匹配。而最大二分匹配,就是希望找到一个包含尽可能多的点,的一个原图的匹配。(边尽可能多,点尽可能多,其实是等价的。因为如果是一个匹配,那么必然满足点的数量是边的数量的2倍)


2. 如何来找最大的匹配:

2.1 算法前提:

 增广路径:与最大流算法类似,二分图最大匹配算法也需要引入一个属于二分图的增广路径来实现。这里增广路径的定义,是一种交叉路径的方式,具体看下图:

例图4

上图中,黄色的边,代表已经找出的边,将边连接的两个顶点加入匹配的集合。

增广路径要求:

       1. 初始节点是一个没有加入到匹配的点,也就是说,与它相连的边,不能有黄色边。比如说例图4中的1和4。

       2. 满足交叉路径,比如说例图4的黄色边称为匹配边,黑色边称为未匹配边的话,增广路径要求边的顺序按照未匹配边,匹配边,未匹配边...未匹配边的顺序排列,比如说上面的1-2,2-3,3-4。

      3. 如上所述,一条增广路径,除了以未匹配边开始以外,还必须以未匹配边结束,并且结束的这条未匹配边,末尾的节点必须也是一个没有加入到匹配的点。这样定义的意义在于,保证增广路径中未匹配边肯定比匹配边多一条,那么考虑将匹配边全部变为未匹配边,未匹配边变成匹配边,就可以在匹配集合中加入一组点和边,具体例子如下:

例图5

                                        不难理解,上面说的这种变换一定是可行的。

2.2 算法流程:

       这里分析一下最常见的匈牙利算法,这个算法的时间复杂度是,n为二分图一侧点的数量,m为图中边的数量。所以这里其实可以有一步小的优化,就是将二分图起始的一侧变为点的数量小的一侧,不过问题不大。常见的优化还有,用最大流算法dinic来优化,dinic跑这里的二分图最大匹配算法的话,时间复杂度大约是。(dinic跑最大流算法,虽然是的复杂度,但是其实它是十分接近,实际复杂度大约是n的0.6次方)

      匈牙利算法其实也比较简单,比如说取二分图一侧的节点集合为起始点,最外层的循环,就是要遍历一下每一个节点是否可以找到一条增广路径,如果能找到,那么匹配集合中边的数量就可以加1。而且只能加1,因为一条增广路径,为匹配边的数量只会比匹配边的数量多1。

      接下来要分析如何找增广路径,其实就是用一个dfs,从当前节点出发,比如将二分图的节点集合分为A和B,从A集合的点出发,到B集合中的一个点,如果这个节点没有被加入匹配中,那么可以直接将当前的两个节点,和连接它们的边凑成一组送进匹配中;如果这个节点已经加入了匹配,那么就要用上面提到的增广路径了,一旦发现它有增广路径,代表的含义其实是,这个B集合的节点给了A集合的那个起点,后面的点也能各自找到自己对应的点加入匹配。

              ok这么说肯定很晦涩,也很难理解。接下来看下面的例子:

例图6

        例图6为原始的二分图,可以分为{1,2,3,4}和{5,6,7,8}两个集合。不妨以左侧的,{1,2,3,4}集合的点,为起始点来分析。

        首先从1开始,与1相连的有两条边,1-5和1-7,不妨设先访问了1-5这条边,5未加入匹配集合,因此将1,5加入匹配的集合(实际上就是匹配的数量++,然后记录5的匹配前驱是1),此时的状态如下图:

例图7

       接下来访问到2这个节点,2先访问到5,发现5已经加入了匹配集合(实际实现时,是发现5有对应的匹配前驱)。此时进入第二种情况,查找是否有增广路径,从2到5是一条未匹配边,接下来是一条匹配边,这一步其实很容易实现,因为5在匹配集合中,所以与5连接的,匹配边的另一个点,一定就是5的匹配前驱,也就是1,所以实现时,可以直接找到匹配边的另一个顶点。

       此时到了1之后,相当于又开始了找是否有合适的匹配点的过程,与初始时类似。因为5在这次找的过程中已经访问过(增广路径的点肯定不能复用),因此找到的下一个点是7,发现7不在匹配集合中,所以1-7可用,满足了一条非匹配,匹配,非匹配,且结尾的节点不在匹配集合的要求,这条路径可行,更新7的匹配前驱为1,5的匹配前驱为2:

例图8

        接下来从节点3出发,同样先访问到5的话,找增广路径。根据5的前驱,找到2,2再去找的话,发现6未加入匹配集合,因此将这次的结果更新到匹配集合中,更新6的匹配前驱为2,5的匹配前驱为3:

例图9

        接下来更新4,4找到5,根据5的匹配前驱又到了3;3没有其他连接的边,所以此时没有增广路径,4不能加入匹配中。至此,整个过程结束,最大匹配次数为3,有3条边,6个点。

        此时可能会想,如果3有其他某条相连的边的话,通过某种增广方法,在访问到4时,3连的不是5,那么就有了。确实有了,但是换个角度想,如果有了这条边,恰好4也能增广进来的话,用这个算法,4也一样可以把与3连的边“挤到”另外一个点上啊。

最后,给出一道最大二分匹配的模板题目,以及一份匈牙利算法的AC代码,题目【模板】二分图最大匹配,代码:

#include

using namespace std;

int n,m,e,cnt=0,match[510];

vector next_v[510];

bool visited[510];

bool dfs(int from){

    for(int i = 0;i < next_v[from].size();i++){

        if(!visited[next_v[from][i]]){

            visited[next_v[from][i]] = true;

            if(match[next_v[from][i]] == 0){

                match[next_v[from][i]] = from;

                return true;

            }

            else if(dfs(match[next_v[from][i]])){

                match[next_v[from][i]] = from;

                return true;

            }

        }

    }

    return false;

}

int main(){

    scanf("%d%d%d",&n,&m,&e);

    int u,v;

    for(int i = 0;i < e;i++){

        scanf("%d%d",&u,&v);

        next_v[u].push_back(v);

    }

    for(int i = 1;i <= n;i++){

        memset(visited,0,sizeof(visited));

        if(dfs(i))cnt++;

    }

    printf("%d\n",cnt);

    return 0;

}

二. 一些其他常见相关内容:

最大独立集:点的总数 - 最大匹配集合中点的数量

最小点覆盖:最大匹配中点的数量

最小边覆盖:最大匹配中边的数量

       上面这些问题的概念,以及证明,这里都不再赘述。就是简单给出一些常见内容,有什么需要补充的知识可以自行补充。

你可能感兴趣的:(二分图最大匹配)