std::vector动态扩展策略

最近几天重温了《STL源码剖析》这部著作,对一些知识点做个记录。

vector的技术实现,关键在于其对大小的控制以及重新配置时的数据移动效率。一旦vector旧有空间满载,如果客户端每新增一个元素,vector内部只是扩充一个元素的空间,实为不智,因为所谓扩大空间(不论多大),一如稍早所说,是“配置新空间/数据移动/释放旧空间”的大工程,时间成本很高,应该加入某种未雨绸缪的考虑。

所谓动态增加大小,并不是在原空间之后接续新空间(因为无法保证原空间之后上油可供配置的空间),而是以原大小的两倍另外配置一块较大空间,然后将原内容拷贝过来,然后才开始在原内容之后构造新元素,并释放原空间。因此,对vector的任何操作,一旦引起空间重新配置,指向原vector的所有迭代器旧都失效了。(摘自《STL源码剖析》)

先来看下vector是如何拓展空间的

int main()
{
	std::vector vec;
	int lastCapacity = 0;
	for (size_t i = 0; i < 100; i++)
	{
		vec.push_back(i);
		if (lastCapacity!= vec.capacity())
		{
			lastCapacity = vec.capacity();
			std::cout << i << "->" << lastCapacity << "->" << &vec[0] << "\n";
		}
		
	}
	getchar();
}

运行结果:

std::vector动态扩展策略_第1张图片

可以看到新增一个元素没有剩余空间时,就会扩展新的空间(新增加的空间约为0.5倍的旧空间),并把内容移动到新的地址。

由于需要不断移动数据,因此频繁新增元素(不断开辟新空间/移动数据)会带来额外的时间开销。

 

简单测试下效率影响:

int main()
{
	std::string str;
	for (size_t i = 0; i <256; i++)
	{
		str.append("A");
	}

	int len = 10000;
	std::vector vec,vec2;
	int t0 = clock();
	for (size_t i = 0; i < len; i++)
	{
		vec.push_back(str);
	}
	int t1 = clock();
	vec2.reserve(len);
	for (size_t i = 0; i < len; i++)
	{
		vec2.push_back(str);
	}
	int t2 = clock();
	std::cout << t1 - t0 << ":" << t2 - t1 << "\n";
	getchar();
	return 0;
}

测试结果:

 

std::vector动态扩展策略_第2张图片

通过测试结果看,频繁新增元素带来的时间开销还是比较大的,这还是数据比较少的情况,数据越多效率影响会越大。

 

你可能感兴趣的:(C++)