之前,我们介绍了STL中树形结构容器:set、map、multiset、multimap。
在C++98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时的效率可达到O(logN),即最差情况下需要比较红黑树的高度次,但当树中的结点非常多时,查询效率也不理想。最好的查询是,进行很少的比较次数就能够将元素找到,因此在C++11中,STL又提供了4个unordered系列的关联式容器,这四个容器与红黑树结构的关联式容器使用方式基本类似,只是其底层结构不同。
//方式一: 构造一个某类型的空容器。
unordered_set<int> us1; //构造int类型的空容器
//方式二: 拷贝构造某同类型容器的复制品。
unordered_set<int> us2(us1); //拷贝构造同类型容器us1的复制品
//方式三: 使用迭代器拷贝构造某一段内容。
string str("abcedf");
unordered_set<char> us3(str.begin(), str.end()); //构造string对象某段区间的复制品
unordered_set当中常用的成员函数如下:
成员函数 | 功能 |
---|---|
insert | 插入指定元素 |
erase | 删除指定元素 |
find | 查找指定元素 |
size | 获取容器中元素的个数 |
empty | 判断容器是否为空 |
clear | 清空容器 |
swap | 交换两个容器中的数据 |
count | 获取容器中指定元素值的元素个数 |
unordered_set当中迭代器相关函数如下:
成员函数 | 功能 |
---|---|
begin | 获取容器中第一个元素的正向迭代器 |
end | 获取容器中最后一个元素下一个位置的正向迭代器 |
实例:
#include
#include
using namespace std;
int main()
{
unordered_set<int> us;
//插入元素(去重)
us.insert(1);
us.insert(4);
us.insert(3);
us.insert(3);
us.insert(2);
us.insert(2);
us.insert(3);
//遍历容器方式一(范围for)
for (auto e : us)
{
cout << e << " ";
}
cout << endl; //1 4 3 2
//删除元素方式一
us.erase(3);
//删除元素方式二
unordered_set<int>::iterator pos = us.find(1); //查找值为1的元素
if (pos != us.end())
{
us.erase(pos);
}
//遍历容器方式二(迭代器遍历)
unordered_set<int>::iterator it = us.begin();
while (it != us.end())
{
cout << *it << " ";
it++;
}
cout << endl; //4 2
//容器中值为2的元素个数
cout << us.count(2) << endl; //1
//容器大小
cout << us.size() << endl; //2
//清空容器
us.clear();
//容器判空
cout << us.empty() << endl; //1
//交换两个容器的数据
unordered_set<int> tmp{ 11, 22, 33, 44 };
us.swap(tmp);
for (auto e : us)
{
cout << e << " ";
}
cout << endl; //11 22 33 44
return 0;
}
unordered_multiset容器与unordered_set容器的底层数据结构是一样的,都是哈希表,其次,它们所提供的成员函数的接口都是基本一致的,这两种容器唯一的区别就是,unordered_multiset容器允许键值冗余,即unordered_multiset容器当中存储的元素是可以重复的。
实例:
#include
#include
using namespace std;
int main()
{
unordered_multiset<int> ums;
//插入元素(允许重复)
ums.insert(1);
ums.insert(4);
ums.insert(3);
ums.insert(3);
ums.insert(2);
ums.insert(2);
ums.insert(3);
for (auto e : ums)
{
cout << e << " ";
}
cout << endl; //1 4 3 3 3 2 2
return 0;
}
//方式一: 指定key和value的类型构造一个空容器。
unordered_map<int, double> um1; //构造一个key为int类型,value为double类型的空容器
//方式二: 拷贝构造某同类型容器的复制品。
unordered_map<int, double> um2(um1); //拷贝构造同类型容器um1的复制品
//方式三: 使用迭代器拷贝构造某一段内容。
unordered_map<int, double> um3(um2.begin(), um2.end()); //使用迭代器拷贝构造um2容器某段区间的复制品
unordered_map当中常用的成员函数如下:
成员函数 | 功能 |
---|---|
insert | 插入键值对 |
erase | 删除指定key值的键值对 |
find | 查找指定key值的键值对 |
size | 获取容器中元素的个数 |
empty | 判断容器是否为空 |
clear | 清空容器 |
swap | 交换两个容器中的数据 |
count | 获取容器中指定key值的元素个数 |
除了上述的成员函数之外,unordered_map容器当中还实现了[ ]
运算符重载函数
[key]
,然后再返回该键值对中value的引用。unordered_map当中迭代器相关函数如下:
成员函数 | 功能 |
---|---|
begin | 获取容器中第一个元素的正向迭代器 |
end | 获取容器中最后一个元素下一个位置的正向迭代器 |
实例:
#include
#include
#include
using namespace std;
int main()
{
unordered_map<int, string> um;
//插入键值对方式一:构造匿名对象插入
um.insert(pair<int, string>(1, "one"));
um.insert(pair<int, string>(2, "two"));
um.insert(pair<int, string>(3, "three"));
//遍历方式一:范围for
for (auto e : um)
{
cout << e.first << "->" << e.second << " ";
}
cout << endl; //1->one 2->two 3->three
//插入键值对方式二:调用make_pair函数模板插入
um.insert(make_pair(4, "four"));
um.insert(make_pair(5, "five"));
um.insert(make_pair(6, "six"));
//遍历方式二:迭代器遍历
unordered_map<int, string>::iterator it = um.begin();
while (it != um.end())
{
cout << it->first << "->" << it->second << " ";
it++;
}
cout << endl; //1->one 2->two 3->three 4->four 5->five 6->six
//插入键值对方式三:利用[]运算符重载函数进行插入(常用)
um[7] = "seven";
um[8] = "eight";
um[9] = "nine";
for (auto e : um)
{
cout << e.first << "->" << e.second << " ";
}
cout << endl; //9->nine 1->one 2->two 3->three 4->four 5->five 6->six 7->seven 8->eight
//删除键值对方式一:根据key值删除
um.erase(5);
//删除键值对方式二:根据迭代器删除
unordered_map<int, string>::iterator pos = um.find(7); //查找键值为7的键值对
if (pos != um.end())
{
um.erase(pos);
}
for (auto e : um)
{
cout << e.first << "->" << e.second << " ";
}
cout << endl; //9->nine 1->one 2->two 3->three 4->four 6->six 8->eight
//修改键值对方式一:通过find获得迭代器,通过迭代器修改
pos = um.find(1);
if (pos != um.end())
{
pos->second = "one/first";
}
//修改键值对方式二:利用[]运算符重载函数进行修改(常用)
um[2] = "two/second";
for (auto e : um)
{
cout << e.first << "->" << e.second << " ";
}
cout << endl; //9->nine 1->one/first 2->two/second 3->three 4->four 6->six 8->eight
//容器中key值为3的键值对的个数
cout << um.count(3) << endl;
//容器的大小
cout << um.size() << endl;
//清空容器
um.clear();
//容器判空
cout << um.empty() << endl;
//交换两个容器的数据
unordered_map<int, string> tmp{ { 2021, "before" }, { 2022, "now" } };
um.swap(tmp);
for (auto e : um)
{
cout << e.first << "->" << e.second << " ";
}
cout << endl; //2021->before 2022->now
return 0;
}
unordered_multimap容器与unordered_map容器的底层数据结构是一样的,都是哈希表,其次,它们所提供的成员函数的接口都是基本一致的,这两种容器唯一的区别就是,unordered_multimap容器允许键值冗余,即unordered_multimap容器当中存储的键值对的key值是可以重复的。
实例:
#include
#include
#include
using namespace std;
int main()
{
unordered_multimap<int, string> umm;
//插入键值对(允许键值重复)
umm.insert(make_pair(2022, "吃饭"));
umm.insert(make_pair(2022, "睡觉"));
umm.insert(make_pair(2022, "打豆豆"));
for (auto e : umm)
{
cout << e.first << "->" << e.second << " ";
}
cout << endl; //2022->吃饭 2022->睡觉 2022->打豆豆
return 0;
}
注意:由于unordered_multimap容器允许键值对的键值冗余,调用[ ]
运算符重载函数时,应该返回键值为key的哪一个键值对的value的引用存在歧义,因此在unordered_multimap容器当中没有实现[ ]
运算符重载函数。
map容器与unordered_map容器的差别和set容器与unordered_set容器的差别类似,下面我们以set容器和unordered_set容器的测试为例。
说到一个容器的性能,我们最关心的实际就是该容器增删查改的效率。我们可以通过下列代码测试set容器和unordered_set容器insert、find以及erase的效率。
#include
#include
#include
#include
using namespace std;
int main()
{
int N = 1000;
vector<int> v;
v.reserve(N);
srand((unsigned int)time(NULL));
//随机生成N个数字
for (int i = 0; i < N; i++)
{
v.push_back(rand());
}
/****************插入效率测试****************/
//将这N个数插入set容器
set<int> s;
clock_t begin1 = clock();
for (auto e : v)
{
s.insert(e);
}
clock_t end1 = clock();
//将这N个数插入unordered_set容器
unordered_set<int> us;
clock_t begin2 = clock();
for (auto e : v)
{
us.insert(e);
}
clock_t end2 = clock();
//分别输出插入set容器和unordered_set容器所用的时间
cout << "set insert: " << end1 - begin1 << endl;
cout << "unordered_set insert: " << end2 - begin2 << endl;
/****************查找效率测试****************/
//在set容器中查找这N个数
clock_t begin3 = clock();
for (auto e : v)
{
s.find(e);
}
clock_t end3 = clock();
//在unordered_set容器中查找这N个数
clock_t begin4 = clock();
for (auto e : v)
{
us.find(e);
}
clock_t end4 = clock();
//分别输出在set容器和unordered_set容器中查找这N个数所用的时间
cout << "set find: " << end3 - begin3 << endl;
cout << "unordered_set find: " << end4 - begin4 << endl;
/****************删除效率测试****************/
//将这N个数从set容器中删除
clock_t begin5 = clock();
for (auto e : v)
{
s.erase(e);
}
clock_t end5 = clock();
//将这N个数从unordered_set容器中删除
clock_t begin6 = clock();
for (auto e : v)
{
us.erase(e);
}
clock_t end6 = clock();
//分别输出将这N个数从set容器和unordered_set容器中删除所用的时间
cout << "set erase: " << end5 - begin5 << endl;
cout << "unordered_set erase: " << end6 - begin6 << endl;
return 0;
}
当N比较小时,两者的效率时差不多的,我们稍微将N设置大一些,将N设为10000000。
而当N为10000000时,set容器和unordered_set容器增删查改的效率的差异就很明显了,unordered_set优于set。
根据测试结果可以得出以下结论:
因此,当处理数据量较小时,选用xxx容器与unordered_xxx容器的差异不大;当处理数据量较大时,建议选用对应的unordered_xxx容器。
当需要存储的序列为有序时,应该选用map/set容器。