C++算法:加权连通图的最小生成树(Kruskal)

文章目录

  • 前言
  • 一、什么是最小生成树
  • 二、代码实现
    • 1、构建图
    • 2、生成树
  • 总结
    • 原创文章,未经许可,严禁转载


前言

最小生成树算法就是在众多可行的方案中选择代价最小的方法。生活中我们经常会遇到类似可以抽象成最小生成树的例子:比如你要给家中布电线,我们将每个用电器看作是顶点,那你可以从总闸布设到每一电器的电线,也可以从就近点接线。假设我们用从就近点接线,那就存在如何布线更节约的问题。这就是最小生成树可以解决的问题。


一、什么是最小生成树

用数学话来说,存在一个有n个顶点的带权连通图G。如果存在一个包含了G中所有顶点以及部分边的子图G,且子图G的各边权值和最小,并且还不形成回路。那么我们就可以称子图G是图G的最小生成树。前面所说的在家布电线的问题,我们可以将各电器看作是顶点,将电线看作是边。那我们可以给出如下图:
C++算法:加权连通图的最小生成树(Kruskal)_第1张图片
图中蓝点代表了电器,黑线代表了各电器之间可以布线,红字代表了此段距离。没有连通的点说明不能在此两者之间布线。从生活经验来说,我们直接选距离最短的两个点开始布线就是了呗?

计算机科学家:约瑟夫·伯纳德克鲁斯卡(Krusdal)的想法和我们一样,他最著名的工作是计算加权图的最小生成树(MST) 的Kruskal 算法。该算法首先按权重对边进行排序,然后继续通过有序列表向部分 MST 添加一条边,前提是添加新边不会创建循环。

二、代码实现

按照算法逻辑,我们先把图中的边清空,可以得到如下顶点图:
C++算法:加权连通图的最小生成树(Kruskal)_第2张图片
然后我们用代码一步步将图中的顶点按距离的远近一步步连上,最终得到最小树。

1、构建图

很显然用二维数组来生成这个图会方便很多,数组的行列下标分别代表了一个顶点,存储的值就是边权(我们例子中的电器之间的距离)并没有方向的问题,我们要求的只是连通。

代码如下(示例):

#include 
#include 
#include 

using namespace std;

typedef struct {  //边构造
    int start;
    int end;
    int val;
}edge;

class Graph{
    private:
        int vertex;      //顶点数
        int** matrix;    //有向图关系矩阵
        int* sign;    //标记边所属集合
        vector<edge> edges;      //存储所有边
        vector<edge> mst;    //存储最小生成树
        int weight = 0;    //最小生成树的权重和

    public:
        Graph(const int n ,vector<vector<int>> &arr){
            vertex = n;           
            matrix = new int* [vertex];          //生成有向图关系矩阵
            sign = new int[vertex];               
            for (int i=0; i<vertex; i++) sign[i]=i;   //初始顶点集合标记为自身,表示图是各点独立的森林
            for (int i = 0; i < 9; ++i){
                matrix[i] = new int[9];
                for (int j=0; j<9; j++){
                    matrix[i][j] = 0;
                }
            }
            edge tmp;
            for (int i=0; i<15; ++i){          
                matrix[arr[i][0]][arr[i][1]] = arr[i][2];   //生成有向图矩阵,演示用
                tmp.start = arr[i][0];                      //生成所有边
                tmp.end = arr[i][1];
                tmp.val = arr[i][2];
                edges.push_back(tmp);
            }
        }

        ~Graph(){
            delete[] matrix;
            delete[] sign;
        }
        
		void show(){            //显示矩阵,演示用,和逻辑无关
            for (int i=0; i<9; ++i){
                for (int j=0; j<9; ++j){
                    cout << matrix[i][j] << " ";
                }
                cout << endl;
            }
        }

这里我们把顶点间的距离用arr数组来表示,每个元素有3个值,表示了顶点i,j之间存在边,边权为x。如{0,1,9}就表示了顶点0和顶点1存在权重为9的边。在布线例子中,就是0号电器到1号电器的距离为9。以此类推,然后我们将其存储到matrix这个二维数组中。代码和前面用数组表示的游戏技能树差不多,笔者也是直接复制过来的,删除了一些不需要的代码就行,很方便。这样我们就生成了最前面图一中所示的图。代码中有个show函数,可以打印出矩阵来看看:

0 9 0 5 9 0 0 0 0 
0 0 0 3 0 7 0 0 0 
0 0 0 13 0 8 10 0 0 
0 0 0 0 0 0 2 0 12 
0 0 0 0 0 0 0 5 4 
0 0 0 11 0 0 0 0 0 
0 0 0 0 0 0 0 6 0 
0 0 0 0 0 0 0 0 1 
0 0 0 0 0 0 0 0 0 

可以看出,顶点8没有连出的边。图中肯定是有的,这是我们只插入了单向的原因,顶点7、4、3都有连接到顶点8的边,在求最小生成树的过程中,我们不需要双向连接,当然你把8->7、8->4、8->3的边写入图中也没有问题,其它顶点也一样。因为从前面的定义我们知道,最小生成树不能有环,所以后面代码中肯定有判断是否形成的环的部分。

2、生成树

代码如下(示例):

        int is_inset(edge &e){          //判断边的两个顶点是在哪个集合中,修改标记
            if (sign[e.start] == sign[e.end]) return 0;
            int dest = sign[e.end];
            sign[e.end] = sign[e.start];
            for (int j=0; j<vertex; j++){
                if(sign[j]==dest) sign[j]=sign[e.start];
            }   
            return 1;
        }
       
        void kruskal(){
            sort(edges.begin(), edges.end(), [](auto a, auto b){return a.val < b.val;});  //对边以val排序
            int i = 0;
            while (mst.size() < vertex-1){
                if (is_inset(edges[i])){
                    mst.push_back(edges[i]);
                    weight += edges[i].val;
                }
                i++;
            }
            for (int i=0; i<mst.size(); i++) cout << mst[i].start << " -- " << mst[i].end << endl; 
            cout << "The weight of the MST tree: " << weight <<endl;
        }

这部分有两个函数,函数kruskal非常简单,按val的值从小到大取出边,交给is_inset函数判断后,放入mst向量。显然is_inset函数才是这个算法的关键。

这里我们采用了一个数组,数组的下标就是顶点编号,我们将此数组的各个值先默认设置为它的下标,这代表了如图二所示的只有根节点的森林,每一顶点都是以它自己为根节点的一棵树。很显然当两个顶点不在一个集合中(sign以顶点为下标的值不同),表示它们没连上。当一条边的两个顶点都在一个集合中(sign以顶点为下标的值相同),肯定这条边的两个顶点已经在同一个集合中,也就是已经连上,再添加就形成环了。比如下图的顶点3和5,{3, 5, 11}就是不需要的边。

然后,当两个顶点被一条边连上了,代码中就是mst中加入了一条边,此时我们将这条边的end顶点在sign数组中的标记改为start顶点的值。并把所有其它标记为end值的顶点都改成start的标记。这个过程其实可以用不相交集合完成。最后生成如下:
C++算法:加权连通图的最小生成树(Kruskal)_第3张图片kruskal函数打印出来的结果:

7 -- 8
3 -- 6
1 -- 3
4 -- 8
0 -- 3
6 -- 7
1 -- 5
2 -- 5
The weight of the MST tree: 36

总结

kruskal算法是以边找顶点的办法,从权重低的边找起,不产生环就加入生成树。逻辑很简单,只要理解了in_inset函数的代码运行逻辑就行。既然有以边找点的算法,聪明的计算机科学家们肯定也想到了以点找边的办法,那就是Prim算法。下回分解…

原创文章,未经许可,严禁转载

你可能感兴趣的:(数据结构与算法,算法,c++,开发语言)