关于KM算法的详细解释

【背景(神犇不要鄙视)】
本沙茶今年AHOI的时候,遇到裸的最佳匹配的题,竟然把KM算法搞忘了,幸亏是WJMZBMR神犇保佑,临时乱弄一通,想起来了……这MS反映出了本沙茶以前在看某些经典算法的时候看得不深,木有理解透彻……
前几天又遇到一道最佳匹配的题,发现KM算法竟然又忘了……米办法,只有把这个搞死人的算法的具体过程重新看了一遍,终于懂了……
【KM算法及其具体过程】
(1)可行点标:每个点有一个标号,记lx[i]为X方点i的标号,ly[j]为Y方点j的标号。如果对于图中的任意边(i, j, W)都有lx[i]+ly[j]>=W,则这一组点标是可行的。特别地,对于lx[i]+ly[j]=W的边(i, j, W),称为可行边
(2)KM算法的核心思想就是通过修改某些点的标号(但要满足点标始终是可行的),不断增加图中的可行边总数,直到图中存在仅由可行边组成的完全匹配为止,此时这个匹配一定是最佳的(因为由可行点标的的定义,图中的任意一个完全匹配,其边权总和均不大于所有点的标号之和,而仅由可行边组成的完全匹配的边权总和等于所有点的标号之和,故这个匹配是最佳的)。一开始,求出每个点的初始标号:lx[i]=max{e.W|e.x=i}(即每个X方点的初始标号为与这个X方点相关联的权值最大的边的权值),ly[j]=0(即每个Y方点的初始标号为0)。这个初始点标显然是可行的,并且,与任意一个X方点关联的边中至少有一条可行边
(3)然后,从每个X方点开始DFS增广。DFS增广的过程与最大匹配的Hungary算法基本相同,只是要注意两点:一是只找可行边,二是要把搜索过程中遍历到的X方点全部记下来(可以用vst搞一下),以进行后面的修改;
(4)增广的结果有两种:若成功(找到了增广轨),则该点增广完成,进入下一个点的增广。若失败(没有找到增广轨),则需要改变一些点的标号,使得图中可行边的数量增加。方法为:将所有在增广轨中(就是在增广过程中遍历到)的X方点的标号全部减去一个常数d,所有在增广轨中的Y方点的标号全部加上一个常数d,则对于图中的任意一条边(i, j, W)(i为X方点,j为Y方点):
<1>i和j都在增广轨中:此时边(i, j)的(lx[i]+ly[j])值不变,也就是这条边的可行性不变(原来是可行边则现在仍是,原来不是则现在仍不是);
<2>i在增广轨中而j不在:此时边(i, j)的(lx[i]+ly[j])的值减少了d,也就是原来这条边不是可行边(否则j就会被遍历到了),而现在可能是;
<3>j在增广轨中而i不在:此时边(i, j)的(lx[i]+ly[j])的值增加了d,也就是原来这条边不是可行边(若这条边是可行边,则在遍历到j时会紧接着执行DFS(i),此时i就会被遍历到),现在仍不是;
<4>i和j都不在增广轨中:此时边(i, j)的(lx[i]+ly[j])值不变,也就是这条边的可行性不变。
这样,在进行了这一步修改操作后,图中原来的可行边仍可行,而原来不可行的边现在则可能变为可行边。那么d的值应取多少?显然,整个点标不能失去可行性,也就是对于上述的第<2>类边,其lx[i]+ly[j]>=W这一性质不能被改变,故取所有第<2>类边的(lx[i]+ly[j]-W)的最小值作为d值即可。这样一方面可以保证点标的可行性,另一方面,经过这一步后,图中至少会增加一条可行边。
(5)修改后,继续对这个X方点DFS增广,若还失败则继续修改,直到成功为止;

下面分析整个算法的时间复杂度:每次修改后,图中至少会增加一条可行边,故最多增广M次、修改M次就可以找到仅由可行边组成的完全匹配(除非图中不存在完全匹配,这个可以通过预处理得到),故整个算法的时间复杂度为O(M * (N + 一次修改点标的时间))。而一次修改点标的时间取决于计算d值的时间,如果暴力枚举计算,这一步的时间为O(M),优化:可以对每个Y方点设立一个slk值,表示在DFS增广过程中,所有搜到的与该Y方点关联的边的(lx+ly-W)的最小值(这样的边的X方点必然在增广轨中)。每次DFS增广前,将所有Y方点的slk值设为+∞,若增广失败,则取所有不在增广轨中的Y方点的slk值的最小值为d值。这样一次修改点标的时间降为O(N),总时间复杂度降为O(NM)。

需要注意的一点是,在增广过程中需要记下每个X、Y方点是否被遍历到,即fx[i]、fy[j]。因此,在每次增广前(不是对每个X方点增广前)就要将所有fx和fy值清空。

代码:

void  init_d()
{
    re(i, n) E[i].pre 
=  E[i].next  =  i; m  =  n;
}
void  add_edge( int  a,  int  b,  int  len)
{
    E[m].a 
=  a; E[m].b  =  b; E[m].len  =  len; E[m].pre  =  E[a].pre; E[m].next  =  a; E[a].pre  =  m; E[E[m].pre].next  =  m ++ ;
}
inline 
int  dist( int  x,  int  y,  int  x0,  int  y0)
{
    
return  abs(x  -  x0)  +  abs(y  -  y0);
}
bool  dfs( int  x)
{
    
int  y, x0; fx[x]  =  _FLAG;
    
for  ( int  p = E[x].next; p  !=  x; p = E[p].next) {
        y 
=  E[p].b;
        
if  (lx[x]  +  ly[y]  >  E[p].len) {
            
if  (lx[x]  +  ly[y]  -  E[p].len  <  slk[y]) slk[y]  =  lx[x]  +  ly[y]  -  E[p].len;
        } 
else   if  (fy[y]  !=  _FLAG) {
            fy[y] 
=  _FLAG; x0  =  z[y];
            
if  (x0  ==   - 1   ||  dfs(x0)) {z[y]  =  x;  return   1 ;}
        }
    }
    
return   0 ;
}
void  solve()
{
    re(i, n) {
        lx[i] 
=   - INF;
        
for  ( int  p = E[i].next; p  !=  i; p = E[p].next)  if  (E[p].len  >  lx[i]) lx[i]  =  E[p].len;
    }
    re(i, n0) {ly[i] 
=   0 ; z[i]  =   - 1 ;}
    
int  d;
    re(i, n) {
        re(j, n0) slk[i] 
=  INF; _FLAG ++ ;
        
while  ( ! dfs(i)) {
            d 
=  INF; re(j, n0)  if  (fy[j]  !=  _FLAG  &&  slk[j]  <  d) d  =  slk[j];
            re(j, n) 
if  (fx[j]  ==  _FLAG) lx[j]  -=  d;
            re(j, n0) {slk[j] 
=  INF;  if  (fy[j]  ==  _FLAG) ly[j]  +=  d;}
            _FLAG
++ ;
        }
    }
    res 
=   0 ; re(i, n) res  +=  lx[i]; re(i, n0) res  +=  ly[i];
}


 

你可能感兴趣的:(关于KM算法的详细解释)