C++ STL 之所以得到广泛的赞誉,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封装了许多复杂的数据结构算法和大量常用数据结构操作。vector封装数组,list封装了链表,map和set封装了二叉树等,在封装这些数据结构的时候,STL按照程序员的使用习惯,以成员函数方式提供的常用操作,如:插入、排序、删除、查找等。让用户在STL使用过程中,并不会感到陌生。
关于set,必须说明的是set关联式容器。set作为一个容器也是用来存储同一数据类型的数据类型,并且能从一个数据集合中取出数据,在set中每个元素的值都唯一,而且系统能根据元素的值自动进行排序。应该注意的是set中数元素的值不能直接被改变。C++ STL中标准关联容器set, multiset, map, multimap内部采用的就是一种非常高效的平衡检索二叉树:红黑树,也成为RB树(Red-Black Tree)。RB树的统计性能要好于一般平衡二叉树,所以被STL选择作为了关联容器的内部结构。
关于set有下面几个问题:
(1)为何map和set的插入删除效率比用其他序列容器高?
大部分人说,很简单,因为对于关联容器来说,不需要做内存拷贝和内存移动。说对了,确实如此。set容器内所有元素都是以节点的方式来存储,其节点结构和链表差不多,指向父节点和子节点。结构图可能如下:
A
/ \
B C
/ \ / \
D E F G
因此插入的时候只需要稍做变换,把节点的指针指向新的节点就可以了。删除的时候类似,稍做变换后把指向删除节点的指针指向其他节点也OK了。这里的一切操作就是指针换来换去,和内存移动没有关系。
(2)为何每次insert之后,以前保存的iterator不会失效?
iterator这里就相当于指向节点的指针,内存没有变,指向内存的指针怎么会失效呢(当然被删除的那个元素本身已经失效了)。相对于vector来说,每一次删除和插入,指针都有可能失效,调用push_back在尾部插入也是如此。因为为了保证内部数据的连续存放,iterator指向的那块内存在删除和插入过程中可能已经被其他内存覆盖或者内存已经被释放了。即使时push_back的时候,容器内部空间可能不够,需要一块新的更大的内存,只有把以前的内存释放,申请新的更大的内存,复制已有的数据元素到新的内存,最后把需要插入的元素放到最后,那么以前的内存指针自然就不可用了。特别时在和find等算法在一起使用的时候,牢记这个原则:不要使用过期的iterator。
(3)当数据元素增多时,set的插入和搜索速度变化如何?
如果你知道log2的关系你应该就彻底了解这个答案。在set中查找是使用二分查找,也就是说,如果有16个元素,最多需要比较4次就能找到结果,有32个元素,最多比较5次。那么有10000个呢?最多比较的次数为log10000,最多为14次,如果是20000个元素呢?最多不过15次。看见了吧,当数据量增大一倍的时候,搜索次数只不过多了1次,多了1/14的搜索时间而已。你明白这个道理后,就可以安心往里面放入元素了。
insert(),在集合中插入元素(可以插入数组,后面会讲)
erase(),删除集合中的元素
size() ,返回当前set容器中的元素个数
count()–返回某个值元素的个数(根据set的特性,就是判断这个元素在不在,返回0或1)
begin() ,返回set容器的第一个元素的迭代器
end() ,返回set容器的最后一个元素的迭代器
clear() ,删除set容器中的所有的元素
empty() ,判断set容器是否为空(空返回真)
lower_bound()–返回指向大于(或等于)某值的第一个元素的迭代器
upper_bound()–返回大于某个值元素的迭代器
写一个程序练一练这几个简单操作吧:
#include
#include
using namespace std;
int main()
{
int a[]={0,1,2,3,4};
set<int> s;
s.insert(a,a+5);//插入元素,插入某个值s.insert(8);
set<int>::iterator t1=s.begin();//返回set容器的第一个元素的迭代器
set<int>::iterator t2=s.end();//,返回set容器的最后一个元素的迭代器
cout<<"set内元素的个数="<for(;t1!=t2;++t1)
{
cout<<*t1<<" ";
}
cout<1);
cout<<"1 还在不在呢? "<1)<cout<<"第一个大于等于1的数为 "<<*s.lower_bound(1)<cout<<"第一个大于1的数为 "<<*s.upper_bound(2)<if(s.empty())
cout<<"set容器内已清空"<return 0;
}
find()–返回一个指向被查找到元素的迭代器,如果没找到则返回end()。
#include
#include
using namespace std;
int main()
{
int i;
int arr[5] = {0,1,2,3,4};
set<int> iset(arr,arr+5);
iset.insert(6);
iset.erase(1);
set<int>::iterator ite1;
ite1 = iset.find(1);
cout<<"iset.find(1)="<<*ite1<cout<<"iset.end()="<<*iset.end()<if(ite1==iset.end())
cout<<"1 not found"<cout<6);
cout<<"iset.find(5)="<<*ite1<cout<<"iset.end()="<<*iset.end()<if(ite1==iset.end())
cout<<"found"<return 0;
}
/*
一方面说明了如果找不到一个值(被删除或没有)就会返回end();
但是为什么找最后一个值也为end(),却不相等呢?
我的理解是,find(最后一个值)与end()开辟的空间位置不同,也就是迭代器位置不同
*/
(1)元素不是结构体时
//自定义比较函数mycomp
struct mycomp
{
bool operator()(const int &a,const int &b)
{
return a.data-b.data>0;
}
};
set<int,mycomp>s;
set<int,mycomp>::iterator it;
(2)元素是结构体时
struct info
{
string name;
float score;
bool operator<(const info &a) const
{
return a.scoresets;
set ::iterator it;