3.3.3 vector的内存管理与效率
1.?使用reserve()函数提前设定容量大小
关于STL容器,最令人称赞的特性之一就是只要不超过它们的最大值,就可以自动增长到足以容纳用户放进去的数据的大小。(这个最大容量值,只要调用名叫max_size的成员函数就可以获得)对于vector和string,如果需要更多空间,就会以类似realloc的思想来增长大小。vector容器支持随机访问,因此为了提高效率,它内部是使用动态数组的方式实现的。在通过reserve()函数来申请特定大小的内存空间时候总是按指数边界来增大其内部缓冲区。当进行insert或push_back等增加元素的操作时,如果此时动态数组的内存不够用,就要动态的重新分配当前大小的1.5~2倍的新内存区,再把原数组的内容复制过去。所以,在一般情况下,其访问速度同一般数组相比,只有在重新分配发生时,其性能才会下降。正如例3.15中的代码一样,进行pop_back操作时,capacity并不会因为vector容器里的元素减少而有所下降,还会维持操作之前的大小。对于vector容器来说,如果有大量的数据需要进行push_back,应当使用reserve()函数提前设定其容量大小,否则会出现许多次容量扩充操作,导致效率低下。
reserve成员函数允许开发者最小化必须进行的重新分配的次数,因而可以避免真分配的开销和迭代器、指针、引用失效。但在解释reserve为什么可以那么做之前,需要先简要介绍有时候令人困惑的4个相关成员函数,如下所述。在标准容器中,只有vector和string提供了所有这些函数。
(1)size()可以获得容器中有多少元素,但不能获得容器为它容纳的元素分配的内存大小。
(2)capacity()可以获得容器在它已经分配的内存中可以容纳多少元素。那是容器在那块内存中总共可以容纳多少元素,而不是还可以容纳多少元素。如果想知道一个vector或string中有多少没有被占用的内存,则必须从capacity()中减去size()。如果size和capacity返回同样的值,容器中就没有剩余空间了,而下一次插入(通过insert或push_back等)会引发上面的重新分配步骤。
(3)resize(Container::size_type n)用来强制把容器改为容纳n个元素。调用resize函数之后,size函数将会返回n。如果n小于当前大小,容器尾部的元素会被销毁。如果n大于当前大小,新默认构造的元素会添加到容器尾部。如果n大于当前容量,在元素加入之前会进行重新分配。
(4)reserve(Container::size_type n)强制容器把它的容量改为不小于n,提供的n不小于当前所需的大小。因为容量需要增加,这一般会强迫进行一次重新分配。如果n小于当前容量,vector会忽略它,则这个调用什么都不做,string可能把它的容量减少为size()和n中大的数,但string的大小没有改变。
综上所述,只要有元素需要插入而且容器的容量不足时就会发生重新分配(包括它们维护的原始内存分配和回收,对象的拷贝和析构和迭代器、指针和引用的失效)。所以,避免重新分配的关键是使用reserve尽快把容器的容量设置为足够大,最好在容器被构造之后立刻进行。
例如,假定想建立一个容纳1~1000值的vector
vector
for (int i = 1; i <= 1000; ++i) v.push_back(i);
在大多数STL实现中,这段代码在循环过程中将会导致2~10次重新分配。(10这个数没什么奇怪的。记住vector在重新分配发生时一般把容量翻倍,而1000约等于210。)
把代码改为使用reserve,如下所示:
vector
v.reserve(1000);
for (int i = 1; i <= 1000; ++i) v.push_back(i);
则这在循环中不会发生重新分配。
由大小和容量之间的关系可以预言什么时候插入将引起vector或string执行重新分配,而且,可以预言什么时候插入会使指向容器中的迭代器、指针和引用失效。例如,给出这段代码:
string s;
...
if (s.size() < s.capacity()) {
s.push_back('x');
}
push_back的调用不会使指向这个string中的迭代器、指针或引用失效,因为string的容量保证大于它的大小;如果不是执行push_back,代码在string的任意位置进行一个insert,仍然可以保证在插入期间没有发生重新分配,但是,与伴随string插入时迭代器失效的一般规则一致,所有从插入位置到string结尾的迭代器、指针、引用将失效。
通常有两种情况使用reserve来避免不必要的重新分配。第一种可用的情况是当知道有多少元素将最后出现在容器中时,就像上面的vector代码,就可以提前reserve适当数量的空间;第二种情况是保留可能需要的最大的空间,然后添加完全部数据后,再修整掉任何多余的容量。
2.?使用“交换技巧”来修整vector过剩空间/内存
有一种方法来把它从曾经最大的容量减少到它现在需要的容量,这样的方法常常被称为“收缩到合适”(shrink to f?it)。该方法只需一条语句:vector
表达式vector
3.?用swap方法强行释放vector所占内存
template < class T> void ClearVector( vector
{
vector
vtTemp.swap( v );
}
vector
nums.push_back(1);
nums.push_back(3);
nums.push_back(2);
nums.push_back(4);
vector
/* 或者v.swap(vector
/*或者{ std::vector
// 时自动析构*/
4.?Vector 内存管理成员函数的行为测试
【例3.16】 vector内存管理成员函数的行为测试。
#include
#include
using namespace std;
int main(){
vector
cout<<"容器大小:"< /*1个元素,容器容量为1*/ iVec.push_back(1); cout<<"容器大小:"< /*2个元素,容器容量为2*/ iVec.push_back(2); cout<<"容器大小:"< /*3个元素,容器容量为4*/ iVec.push_back(3); cout<<"容器大小:"< /*4个元素,容器容量为4*/ iVec.push_back(4); cout<<"容器大小:"< /*5个元素,容器容量为8*/ iVec.push_back(5); cout<<"容器大小:"< /*6个元素,容器容量为8*/ iVec.push_back(6); cout<<"容器大小:"< /*7个元素,容器容量为8*/ iVec.push_back(7); cout<<"容器大小:"< /*8个元素, 容器容量为8*/ iVec.push_back(8); cout<<"容器大小:"< /*9个元素, 容器容量为16*/ iVec.push_back(9); cout<<"容器大小:"< /* vs2005/8 容量增长不是翻倍的,如 9个元素 容量9 10个元素 容量13 */ /* 测试effective stl中的特殊的交换 swap() */ cout<<"容器大小:"< vector cout<<"临时的vector cout<<"临时的vector cout<<"交换后,当前vector的大小为:"< cout<<"交换后,当前vector的容量为:"<< iVec.capacity()< return 0; } 例3.16的程序的执行结果如图3-2所示。 例3.16中展示了vector在不同情况下占用内存空间的大小情况:vector是按照容器现在容量的一倍进行增长。vector容器分配的是一块连续的内存空间,每次容器的增长,并不是在原有连续的内存空间后再进行简单的叠加,而是重新申请一块更大的新内存,并把现有容器中的元素逐个复制过去,同时销毁旧的内存。这时原有指向旧内存空间的迭代器已经失效,所以当操作容器时,迭代器要及时更新。