[ZZ] C++ Multiset

cpp语言中,multiset是<set>库中一个非常有用的类型,它可以看成一个序列,插入一个数,删除一个数都能够在O(logn)的时间内完成,而且他能时刻保证序列中的数是有序的,而且序列中可以存在重复的数。

     我们通过一个程序来看如何使用multiset。

#include <string>
#include <iostream>
#include <set>
using namespace std;
void main(){
    intx;
    scanf("%ld",&x);
    multiset<int>h;//建立一个multiset类型,变量名是h,h序列里面存的是int类型,初始h为空
    while(x!=0){
        h.insert(x);//将x插入h中
        scanf("%ld",&x);
    }    
    while(!h.empty()){// 序列非空 h.empty()==true时 表示h已经空了
        __typeof(h.begin()) c=h.begin();//c指向h序列中第一个元素的地址,第一个元素是最小的元素
        printf("%ld ",*c);//将地址c存的数据输出
        h.erase(c);//从h序列中将c指向的元素删除
    }
}
对于输入数据32 61 12 2 12 0,该程序的输出是2 12 12 32 61。

我们可以看到,当一个变量h被定义为multiset类型时。所有关于它的操作可以写成如下格式:

h.函数名(形参);

当要在h中插入一个数x时,语法为h.insert(x);当在h中删除指针c指向的元素*c时,语法为h.erase(c)。

注意,如果我们把h.erase(c)写成h.erase(*c),那么该语句就会把h中所有和*c相等的元素都删掉,大家要注意

如果要查找最大的元素并赋值给k,语法是int k=*(h.end()--),注意multiset类型的尾地址存的内容是空的。

如果要想知道当前序列中比k大的元素最小的是多少,那么可以这样 int p=*(h.upper_bound(k)),其中h.upper_bound(k)表示比k大的最小的数的地址。

不光是int类型,multiset还可以存储其他的类型诸如 string类型,结构(struct或class)类型。而我们一般在编程当中遇到的问题经常用到多关键字的类型,即struct或class。例如下面的例子:

struct rec{
    int x,y;
};
multiset<rec>h;
以上的代码是没有任何用处的,因为multiset并不知道如何去比较一个自定义的多关键字类型。怎么办呢?我们可以定义multiset里面rec类型变量之间的小于关系的含义(这里以x为第一关键字为例),具体过程如下:

我们定义一个比较类cmp,cmp内部的operator函数的作用是比较rec类型a和b的大小(以x为第一关键字,y为第二关键字):

struct cmp{
    bool operator()(const rec&a,const rec&b){
        return a.x<b.x||a.x==b.x&&a.y<b.y;
    }
};

 然后我们将语句"multiset<rec>h;” 改成"multiset<rec,cmp>h;"这样以后,我们就告诉了序列h如何去比较里面的元素(这种方法属于重载运算符,在编程当中经常用到,这里就不详细介绍了)

此时rec以及multiset的定义部分完整代码可参考如下:

struct rec{
    int x,y;
};
struct cmp{
    bool operator()(const rec&a,const rec&b){
        return a.x<b.x||a.x==b.x&&a.y<b.y;
    }
};
multiset<rec,cmp>h;
通过以上代码,我们就能建立一个集合h使得该集合能够存储和排序多关键字类型

我们来看一个小应用:求从一个点到另一个点的最短路长度,边都是正权。

正权边的最短路问题可以用dijkstra算法来解决,而优化dijkstra算法可以用heap。这里我们来看如何用multiset实现dijkstra+heap。

以下代码省去了输入输出和图的建立。我们光看求最短路的部分。注意,这里的多关键字类型名称还是rec,multiset集合的名称还是h;多关键字类型rec中,x是第一关键字,y是第二关键字,y代表图中点的编号,而x则代表当前点y与源点的最短距离。

d[0]=0;//源点是0
reca;
a.x=0;//第一关键字x表示距离
a.y=0;//第二关键字y表示点的编号
h.insert(a);//将a插入序列中
while(!h.empty()){//h集合中的元素是否为空
      __typeof(h.begin()) c=h.begin();
    rect=(*c);//取最小值
    h.erase(c);//将最小值删去
    for(inti=tail[t.y];i;i=next[i]){
        intj=p[i];//枚举和t.y相邻的点
        reca;//建立一个结构类变量a
        if(d[j]==-1){//d[j]==-1表示j还没有被访问
            d[j]=t.x+w[i];//w[i]表示边i的边权
            a.x=d[j];
            a.y=j;//将j的相关信息保存在rec类型a中
            h.insert(a);
        }elseif(d[j]>t.x+w[i]){//最短路算法的松弛操作
            a.x=d[j];
            a.y=j;//将j在序列中的信息存储到a中
            c=h.upper_bound(a);//找到序列h中a之后的元素的地址
            c--;//地址减一就是a所在的地址
            h.erase(c);//删掉a
            a.x=t.x+w[i];
            d[j]=a.x;//更新最短路的值
            h.insert(a);//插入
        }
    }
}
有了multiset类型,我们就不用再去写平衡树一类的东西了,从而大大降低了编程复杂度

你可能感兴趣的:(C++)