STL vector 容器介绍
介绍
这篇文章的目的是为了介绍
std::vector
,如何恰当地使用它们的成员函数等操作。本文中还讨论了条件函数和函数指针在迭代算法中使用,如在
remove_if()
和
for_each()
中的使用。通过阅读这篇文章读者应该能够有效地使用
vector
容器,而且应该不会再去使用
C
类型的动态数组了。
Vector总览
vector
是
C++
标准模板库中的部分内容,它是一个多功能的,能够操作多种数据结构和算法的模板类和函数库。
vector
之所以被认为是一个容器,是因为它能够像容器一样存放各种类型的对象,简单地说,
vector
是一个能够存放任意类型的动态数组,能够增加和压缩数据。
为了可以使用
vector
,必须在你的头文件中包含下面的代码:
#
include
<vector>
|
vector
属于
std
命名域的,因此需要通过命名限定,如下完成你的代码:
using
std::vector;
vector<
int
> vInts;
|
或者连在一起,使用全名:
std::vector<
int
> vInts;
|
建议使用全局的命名域方式:
using
namespace
std;
|
在后面的操作中全局的命名域方式会造成一些问题。
vector
容器提供了很多接口,在下面的表中列出
vector
的成员函数和操作。
Vector成员函数
函数
|
表述
|
c.assign(beg,end)
c.assign(n,elem)
|
将
[beg; end)
区间中的数据赋值给
c
。
将
n
个
elem
的拷贝赋值给
c
。
|
c.at(idx)
|
传回索引
idx
所指的数据,如果
idx
越界,抛出
out_of_range
。
|
c.back()
|
传回最后一个数据,不检查这个数据是否存在。
|
c.begin()
|
传回迭代器重的可一个数据。
|
c.capacity()
|
返回容器中数据个数。
|
c.clear()
|
移除容器中所有数据。
|
c.empty()
|
判断容器是否为空。
|
c.end()
|
指向迭代器中的最后一个数据地址。
|
c.erase(pos)
c.erase(beg,end)
|
删除
pos
位置的数据,传回下一个数据的位置。
删除
[beg,end)
区间的数据,传回下一个数据的位置
。
|
c.front()
|
传回地一个数据。
|
get_allocator
|
使用构造函数返回一个拷贝。
|
c.insert(pos,elem)
c.insert(pos,n,elem)
c.insert(pos,beg,end)
|
在
pos
位置插入一个
elem
拷贝,传回新数据位置。
在
pos
位置插入
n
个
elem
数据。无返回值。
在
pos
位置插入在
[beg,end)
区间的数据。无返回值。
|
c.max_size()
|
返回容器中最大数据的数量。
|
c.pop_back()
|
删除最后一个数据。
|
c.push_back(elem)
|
在尾部加入一个数据。
|
c.rbegin()
|
传回一个逆向队列的第一个数据。
|
c.rend()
|
传回一个逆向队列的最后一个数据的下一个位置。
|
c.resize(num)
|
重新指定队列的长度。
|
c.reserve()
|
保留适当的容量。
|
c.size()
|
返回容器中实际数据的个数。
|
c1.swap(c2)
swap(c1,c2)
|
将
c1
和
c2
元素互换。
同上操作。
|
vector<Elem> c
vector <Elem> c1(c2)
vector <Elem> c(n)
vector <Elem> c(n, elem)
vector <Elem> c(beg,end)
c.~ vector <Elem>()
|
创建一个空的
vector
。
复制一个
vector
。
创建一个
vector
,含有
n
个数据,数据均已缺省构造产生
。
创建一个含有
n
个
elem
拷贝的
vector
。
创建一个以
[beg;end)
区间的
vector
。
销毁所有数据,释放内存。
|
Vector操作
函数
|
描述
|
operator
[]
|
返回容器中指定位置的一个引用。
|
创建一个vector
vector
容器提供了多种创建方法,下面介绍几种常用的。
创建一个
Widget
类型的空的
vector
对象:
vector<Widget> vWidgets;
// ------
// |
// |- Since vector is a container, its member functions
// operate on iterators and the container itself so
// it can hold objects of any type.
|
创建一个包含
500
个
Widget
类型数据的
vector
:
vector<Widget> vWidgets(500);
|
创建一个包含
500
个
Widget
类型数据的
vector
,并且都初始化为
0
:
vector<Widget> vWidgets(500, Widget(0));
|
创建一个
Widget
的拷贝:
vector<Widget> vWidgetsFromAnother(vWidgets);
|
向vector添加一个数据
vector
添加数据的缺省方法是
push_back()
。
push_back()
函数表示将数据添加到
vector
的尾部,并按需要来分配内存。例如:向
vector<Widget>
中添加
10
个数据,需要如下编写代码:
for
(int i= 0;i<10; i++)
vWidgets.push_back(Widget(i));
|
获取vector中制定位置的数据
很多时候我们不必要知道
vector
里面有多少数据,
vector
里面的数据是动态分配的,使用
push_back()
的一系列分配空间常常决定于文件或一些数据源。如果你想知道
vector
存放了多少数据,你可以使用
empty()
。获取
vector
的大小,可以使用
size()
。例如,如果你想获取一个
vector v
的大小,但不知道它是否为空,或者已经包含了数据,如果为空想设置为
-1
,你可以使用下面的代码实现:
int
nSize = v.empty() ? -1 :
static_cast
<
int
>(v.size());
|
访问vector中的数据
使用两种方法来访问
vector
。
1、
vector::at()
2、
vector::operator[]
operator[]
主要是为了与
C
语言进行兼容。它可以像
C
语言数组一样操作。但
at()
是我们的首选,因为
at()
进行了边界检查,如果访问超过了
vector
的范围,将抛出一个例外。由于
operator[]
容易造成一些错误,所有我们很少用它,下面进行验证一下:
分析下面的代码:
vector<
int
> v;
v.reserve(10);
for
(
int
i=0; i<7; i++)
v.push_back(i);
try
{
int
iVal1 = v[7]; // not bounds checked - will not throw
int
iVal2 = v.at(7); // bounds checked - will throw if out of range
}
catch
(
const
exception& e)
{
cout << e.what();
}
|
我们使用
reserve()
分配了
10
个
int
型的空间,但并不没有初始化。如下图所示:
你可以在这个代码中尝试不同条件,观察它的结果,但是无论何时使用
at()
,都是正确的。
删除vector中的数据
vector
能够非常容易地添加数据,也能很方便地取出数据,同样
vector
提供了
erase()
,
pop_back()
,
clear()
来删除数据,当你删除数据的时候,你应该知道要删除尾部的数据,或者是删除所有数据,还是个别的数据。在考虑删除等操作之前让我们静下来考虑一下在
STL
中的一些应用。
Remove_if()算法
现在我们考虑操作里面的数据。如果要使用
remove_if()
,我们需要在头文件中包含如下代码::
#
include
<algorithm>
|
Remove_if()
有三个参数:
1、
iterator _First
:指向第一个数据的迭代指针。
2、
iterator _Last
:指向最后一个数据的迭代指针。
3、
predicate _Pred
:一个可以对迭代操作的条件函数。
条件函数
条件函数是一个按照用户定义的条件返回是或否的结果,是最基本的函数指针,或者是一个函数对象。这个函数对象需要支持所有的函数调用操作,重载
operator()()
操作。
remove_if()
是通过
unary_function
继承下来的,允许传递数据作为条件。
例如,假如你想从一个
vector<CString>
中删除匹配的数据,如果字串中包含了一个值,从这个值开始,从这个值结束。首先你应该建立一个数据结构来包含这些数据,类似代码如下:
#
include
<functional>
enum
findmodes
{
FM_INVALID = 0,
FM_IS,
FM_STARTSWITH,
FM_ENDSWITH,
FM_CONTAINS
};
typedef
struct
tagFindStr
{
UINT iMode;
CString szMatchStr;
} FindStr;
typedef
FindStr* LPFINDSTR;
|
然后处理条件判断:
class
FindMatchingString
:
public
std::unary_function<CString,
bool
>
{
public
:
FindMatchingString(
const
LPFINDSTR lpFS) : m_lpFS(lpFS) {}
bool
operator()(CString& szStringToCompare)
const
{
bool
retVal =
false
;
switch
(m_lpFS->iMode)
{
case
FM_IS:
{
retVal = (szStringToCompare == m_lpFDD->szMatchStr);
break
;
}
case
FM_STARTSWITH:
{
retVal = (szStringToCompare.Left(m_lpFDD->szMatchStr.GetLength())
== m_lpFDD->szWindowTitle);
break
;
}
case
FM_ENDSWITH:
{
retVal = (szStringToCompare.Right(m_lpFDD->szMatchStr.GetLength())
== m_lpFDD->szMatchStr);
break
;
}
case
FM_CONTAINS:
{
retVal = (szStringToCompare.Find(m_lpFDD->szMatchStr) != -1);
break
;
}
}
return
retVal;
}
private
:
LPFINDSTR m_lpFS;
};
|
通过这个操作你可以从
vector
中有效地删除数据:
// remove all strings containing the value of
// szRemove from vector<CString> vs.
FindStr fs;
fs.iMode = FM_CONTAINS;
fs.szMatchStr = szRemove;
vs.erase(std::remove_if(vs.begin(), vs.end(), FindMatchingString(&fs)), vs.end());
|
Remove_if()能做什么?
你可能会疑惑,对于上面那个例子在调用
remove_if()
的时候还要使用
erase()
呢?这是因为大家并不熟悉
STL
中的算法。
Remove(),remove_if(
)
等所有的移出操作都是建立在一个迭代范围上的,那么不能操作容器中的数据。所以在使用
remove_if()
,实际上操作的时容器里数据的上面的。思考上面的例子:
1、
szRemove
= “o”.
2、
vs
见下面图表中的显示。
观察这个结果,我们可以看到
remove_if()
实际上是根据条件对迭代地址进行了修改,在数据的后面存在一些残余的数据,那些需要删除的数据。剩下的数据的位置可能不是原来的数据,但他们是不知道的。
调用
erase()
来删除那些残余的数据。注意上面例子中通过
erase()
删除
remove_if()
的结果和
vs.enc()
范围的数据。
压缩一个臃肿的vector
很多时候大量的删除数据,或者通过使用
reserve()
,结果
vector
的空间远远大于实际需要的。所有需要压缩
vector
到它实际的大小。
resize()
能够增加
vector
的大小。
Clear()
仅仅能够改变缓存的大小,所有的这些对于
vector
释放内存等九非常重要了。如何来解决这些问题呢,让我们来操作一下。
我们可以通过一个
vector
创建另一个
vector
。让我们看看这将发生什么。假定我们已经有一个
vector v
,它的内存大小为
1000
,当我们调用
size()
的时候,它的大小仅为
7
。我们浪费了大量的内存。让我们在它的基础上创建一个
vector
。
std::vector<CString> vNew(v);
cout << vNew.capacity();
|
vNew.capacity()
返回的是
7
。这说明新创建的只是根据实际大小来分配的空间。现在我们不想释放
v
,因为我们要在其它地方用到它,我们可以使用
swap()
将
v
和
vNew
互相交换一下?
vNew.swap(v);
cout << vNew.capacity();
cout << v.capacity();
|
有趣的是:
vNew.capacity()
是
1000
,
而
v.capacity()
是
7
。
现在是达到我的目的了,但是并不是很好的解决方法,我们可以像下面这么写:
std::vector<CString>(v).swap(v);
|
你可以看到我们做了什么?我们创建了一个临时变量代替那个命名的,然后使用
swap()
,
这样我们就去掉了不必要的空间,得到实际大小的
v
。
结论
我希望这个文档可以给那些使用
STL
vector
容器的开发者很有价值的参考。我也希望通过阅读这篇文章你可以放心地使用
vector
来代替
C
语言中的数据了。