最小生成树——Prim算法、Kruskal算法和Boruvka算法

最小生成树

概述

实际上是最小权重生成树的简称。在一给定的加权无向图G = (V, E) 中,(u, v) 代表连接顶点 u 与顶点 v 的边,而 w(u, v) 代表此边的权重,若存在 T 中的顶点是所有V,T的边是E的子集中,且T中没有环,而且 w(T) 最小,则此 T 为 G 的最小生成树。

简单来讲,最小生成树(树无环)包含了图中所有的点,并包含了能联通全部顶点的最小权重的n-1条边。

本文使用的寻找最小生成树的三个算法,Prim算法、Kruskal算法和Boruvka算法,都是贪心算法的应用。

性质

  1. 一个图可以有多个生成树,但是如果每条边的权重都不同(distinct),则只有一个最小生成树。

在每条边权重都不同的情况下:

  1. Cut property:如果S是V(G)的一个合适的非空子集,e(v, w)是一条连接S中的点v和不在S中的点w的一条权重最小的边,v ∈ S 而且 w ∈/ S,那么e(v, w)一定是某个(所有)最小生成树中的一条边。 这是Kruskal算法的基础

  2. Cycle Property:如果C是图G中的一个环,那么C中具有最大权重的边e一定不属于某个(所有)最小生成树

  3. 如果在最小生成树中添加一条边,则肯定会构成环。这与Cycle property一起成为证明生成树的定理。

实际应用

最小生成树的目的是创建最经济的联通子图。可以有以下应用:
1. 城市之间的交通系统
2. 石油管道规划


Prim算法

1.概览

普里姆算法(Prim算法),图论中的一种算法,可在加权连通图里搜索最小生成树。即由此算法搜索到的边子集所构成的树中,不但包括了连通图里的所有顶点(Vertex or Node),且其所有边的权值之和最小。该算法于1930年由捷克数学家沃伊捷赫·亚尔尼克(英语:Vojtěch Jarník)发现;并在1957年由美国计算机科学家罗伯特·普里姆(英语:Robert C. Prim)独立发现;1959年,艾兹格·迪科斯彻再次发现了该算法。因此,在某些场合,普里姆算法又被称为DJP算法、亚尔尼克算法或普里姆-亚尔尼克算法。

2.算法简单描述

1).输入:一个加权连通图G (V, E),其中顶点集合为V,边集合为E;一系列非负边权重值 w(u, v)。

2).初始化:Vnew = {x},其中x为集合V中的任一节点(算法起始点),Enew = {},为空;

3).重复下列操作,直到Vnew = V:

a.在集合E中选取权值最小的边(u, v),其中u为集合Vnew中的元素,即已经被选择的点,而v不在Vnew集合当中,即与被选择的点相连的未被选择的点,并且v∈V(如果存在有多条满足前述条件即具有相同权值的边,则可任意选取其中之一);

b.将v加入集合Vnew中,将(u, v)边加入集合Enew中;

4).输出:使用集合Vnew和Enew来描述所得到的最小生成树。

图例 说明 不可选 可选 已选(Vnew)
此为原始的加权连通图。每条边一侧的数字代表其权值。 - - -
顶点D被任意选为起始点。顶点A、B、E和F通过单条边与D相连。A是距离D最近的顶点,因此将A及对应边AD以高亮表示。 C, G A, B, E, F D
下一个顶点为距离D或A最近的顶点。B距D为9,距A为7,E为15,F为6。因此,F距D或A最近,因此将顶点F与相应边DF以高亮表示。 C, G B, E, F A, D
算法继续重复上面的步骤。距离A为7的顶点B被高亮表示。 C B, E, G A, D, F
在当前情况下,可以在C、E与G间进行选择。C距B为8,E距B为7,G距F为11。E最近,因此将顶点E与相应边BE高亮表示。 C, E, G A, D, F, B
这里,可供选择的顶点只有C和G。C距E为5,G距E为9,故选取C,并与边EC一同高亮表示。 C, G A, D, F, B, E
顶点G是唯一剩下的顶点,它距F为11,距E为9,E最近,故高亮表示G及相应边EG。 G A, D, F, B, E, C
现在,所有顶点均已被选取,图中绿色部分即为连通图的最小生成树。在此例中,最小生成树的权值之和为39。 A, D, F, B, E, C, G

3.简单证明prim算法

反证法:假设prim生成的不是最小生成树

1).设prim生成的树为T

2).假设存在Gmin使得cost(Gmin) < cost(T) 则在Gmin中存在(u, v)不属于T

3).将(u, v)加入T中可得一个环,且(u, v)不是该环的最长边(这是因为(u, v)∈Gmin)

4).这与prim每次生成最短边矛盾

5).故假设不成立,命题得证.

4.算法代码实现(未检验)

#define MAX  100000
#define VNUM  10+1                                             //这里没有ID为0的点,so id号范围1~10

int edge[VNUM][VNUM]={/*输入的邻接矩阵*/};
int lowcost[VNUM]={0};                                         //记录Vnew中每个点到V中邻接点的最短边
int addvnew[VNUM];                                             //标记某点是否加入Vnew
int adjecent[VNUM]={0};                                        //记录V中与Vnew最邻近的点


void prim(int start)
{
     int sumweight=0;
     int i,j,k=0;

     for(i=1;i//顶点是从1开始
     {
        lowcost[i]=edge[start][i];
        addvnew[i]=-1;                                         //将所有点至于Vnew之外,V之内,这里只要对应的为-1,就表示在Vnew之外
     }

     addvnew[start]=0;                                        //将起始点start加入Vnew
     adjecent[start]=start;

     for(i=1;i1;i++)                                        
     {
        int min=MAX;
        int v=-1;
        for(j=1;jif(addvnew[j]!=-1&&lowcost[j]//在Vnew之外寻找最短路径
            {
                min=lowcost[j];
                v=j;
            }
        }
        if(v!=-1)
        {
            printf("%d %d %d\n",adjecent[v],v,lowcost[v]);
            addvnew[v]=0;                                      //将v加Vnew中

            sumweight+=lowcost[v];                             //计算路径长度之和
            for(j=1;jif(addvnew[j]==-1&&edge[v][j]//此时v点加入Vnew 需要更新lowcost
                    adjecent[j]=v;                             
                }
            }
        }
    }
    printf("the minmum weight is %d",sumweight);
}

5.时间复杂度

这里记顶点数v,边数e

邻接矩阵:O(v2) 邻接表:O(elog2v)


Kruskal算法

1.概览

Kruskal算法是一种用来寻找最小生成树的算法,由Joseph Kruskal在1956年发表。用来解决同样问题的还有前面Prim算法和Boruvka算法等。和Boruvka算法不同的地方是,Kruskal算法在图中存在相同权值的边时也有效。

2.算法简单描述

1).输入:一个加权连通图G (V, E),其中顶点集合为V,边集合为E;一系列非负边权重值 w(u, v)。

2).初始化:新建图G’,G’中拥有原图中相同的全部e个顶点,但没有边。

3).将原图Graph中所有e个边按权值从小到大排序

4).循环:从权值最小的边开始遍历每条边 直至图Graph中所有的节点都在同一个连通分量中

if 这条边连接的两个节点于图Graphnew中不在同一个连通分量中

       添加这条边到图Graphnew中

实际上进行的就是环的判断,如果添加新的边进入图中会产生环,则跳过这条边。

图例描述:

图例 说明 已选(Vnew)
首先第一步,我们有一张图Graph,有若干点和边
将所有的边的长度排序,用排序的结果作为我们选择边的依据。这里再次体现了贪心算法的思想。资源排序,对局部最优的资源进行选择,排序完成后,我们率先选择了边AD。这样我们的图就变成了左图 AD
在剩下的变中寻找。我们找到了CE。这里边的权重也是5 AD,CE
依次类推我们找到了6,7,7,即DF,AB,BE。 AD,CE,DF,AB,BE
下面继续选择, BC或者EF尽管现在长度为8的边是最小的未选择的边。但是现在他们已经连通了(对于BC可以通过CE,EB来连接,类似的EF可以通过EB,BA,AD,DF来接连)。所以不需要选择他们。类似的BD也已经连通了(这里上图的连通线用红色表示了)。最后就剩下EG和FG了。当然我们选择了EG。最后成功的图就是左 AD,CE,DF,AB,BE,EG

3.简单证明Kruskal算法

对图的顶点数n做归纳,证明Kruskal算法对任意n阶图适用。

归纳基础:

n=1,显然能够找到最小生成树。

归纳过程:

假设Kruskal算法对n≤k阶图适用,那么,在k+1阶图G中,我们把最短边的两个端点a和b做一个合并操作,即把u与v合为一个点v’,把原来接在u和v的边都接到v’上去,这样就能够得到一个k阶图G’(u,v的合并是k+1少一条边),G’最小生成树T’可以用Kruskal算法得到。

我们证明T’+{(u,v)}是G的最小生成树。

用反证法,如果T’+{(u,v)}不是最小生成树,最小生成树是T,即W(T) < W(T’+{(u,v)})。显然T应该包含(u,v),否则,可以用(u,v)加入到T中,形成一个环,删除环上原有的任意一条边,形成一棵更小权值的生成树。而T-{(u,v)},是G’的生成树。所以W(T-{(u,v)})<=W(T’),也就是W(T)<=W(T’)+W((u,v))=W(T’+{(u,v)}),产生了矛盾。于是假设不成立,T’+{(u,v)}是G的最小生成树,Kruskal算法对k+1阶图也适用。

由数学归纳法,Kruskal算法得证。

4.代码算法实现

typedef struct          
{        
    char vertex[VertexNum];                                //顶点表         
    int edges[VertexNum][VertexNum];                       //邻接矩阵,可看做边表         
    int n,e;                                               //图中当前的顶点数和边数         
}MGraph; 

typedef struct node  
{  
    int u;                                                 //边的起始顶点   
    int v;                                                 //边的终止顶点   
    int w;                                                 //边的权值   
}Edge; 

void kruskal(MGraph G)  
{  
    int i,j,u1,v1,sn1,sn2,k;  
    int vset[VertexNum];                                    //辅助数组,判定两个顶点是否连通   
    int E[EdgeNum];                                         //存放所有的边   
    k=0;                                                    //E数组的下标从0开始   
    for (i=0;ifor (j=0;jif (G.edges[i][j]!=0 && G.edges[i][j]!=INF)  
            {  
                E[k].u=i;  
                E[k].v=j;  
                E[k].w=G.edges[i][j];  
                k++;  
            }  
        }  
    }     
    heapsort(E,k,sizeof(E[0]));                            //堆排序,按权值从小到大排列       
    for (i=0;i//初始化辅助数组   
    {  
        vset[i]=i;  
    }  
    k=1;                                                   //生成的边数,最后要刚好为总边数   
    j=0;                                                   //E中的下标   
    while (k//得到两顶点属于的集合编号   
        if (sn1!=sn2)                                      //不在同一集合编号内的话,把边加入最小生成树   
        {
            printf("%d ---> %d, %d",E[j].u,E[j].v,E[j].w);       
            k++;  
            for (i=0;iif (vset[i]==sn2)  
                {  
                    vset[i]=sn1;  
                }  
            }             
        }  
        j++;  
    }  
}

5.时间复杂度

O(n) = elog2e //e为图中的边数


Boruvka算法

1.概述

Brouvka算法又名Sollin算法。是最小生成树最古老的一个算法之一,其实是Prim算法和Kruskal算法的综合,每次迭代同时扩展多课子树,直到得到最小生成树T。适用于并行处理一个图。

2.算法简单描述**

1.用定点数组记录每个子树(一开始是单个定点)的最近邻居。(类似Prim算法)
2.对于每一条边进行处理(类似Kruskal算法)
如果这条边连成的两个顶点同属于一个集合,则不处理,否则检测这条边连接的两个子树,如果是连接这两个子树的最小边,则更新(合并)

由于每次循环迭代时,每棵树都会合并成一棵较大的子树,因此每次循环迭代都会使子树的数量至少减少一半,或者说第i次迭代每个分量大小至少为。所以,循环迭代的总次数为O(logn)。每次循环迭代所需要的计算时间:对于第2步,每次检查所有边O(m),去更新每个连通分量的最小弧;对于第3步,合并个子树。所以总的复杂度为O(E*logV)。

转自:
https://www.cnblogs.com/biyeymyhjob/archive/2012/07/30/2615542.html
http://dsqiu.iteye.com/blog/1689178

你可能感兴趣的:(算法)