目录
一.vector使用
1.vector构造
2.vector迭代器使用
3.vector容量操作
4.vector增删查改
二.vector迭代器失效问题
三.memcpy拷贝问题
四.vector分部模拟实现
1.私有成员
2.typedef
3.3种构造函数
4.拷贝构造、赋值运算符重载函数
5.析构函数
6.迭代器
7.大小、容量
8.reserve函数
9.resize函数
10.尾插、尾删函数
11.下标运算符重载函数
12.插入函数
13.删除函数
14.清理函数
五.vector类模拟实现总代码
前言:vector类的学习,可以模仿string,并且有很多地方都与string类类似,因此在这里的相关说明就会比较简洁一些。
在使用之前我们先介绍一下vector:
1. vector是表示可变大小数组的序列容器。2. 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。3. 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。4. vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。5. 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。6. 与其它动态序列容器相比(deques, lists and forward_lists), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起lists和forward_lists统一的迭代器和引用更好。
介绍OK,开始使用vector。
① vector() 无参构造
② vector(size_t n, const value_type& val = value_type()) 构造并初始化n个val
③ vector(const vector& x) 拷贝构造
④ vector(InputIterator first, InputIterator last) 使用迭代器进行初始化构造
vector v1;
vector v2(10, 5);
vector v3(v2);
vector v4(++v2.begin(), --v2.end());
string s = "hello world";
vector v5(s.begin(), s.end());
① begin + end 正向
② rbegin + rend 反向
③ iterator 正向迭代器
④ reverse_iterator 反向迭代器
⑤ const_iterator 常量迭代器
⑥ const_reverse_iterator 常量反向迭代器
// 正向遍历
vector::iterator it = v.begin();
while (it != v.end())
{
*it -= 1;
cout << *it << " ";
++it;
}
cout << endl;
// 反向遍历
vector::reverse_iterator rit = v.rbegin();
while (rit != v.rend())
{
*rit -= 1;
cout << *rit << " ";
++rit;
}
cout << endl;
// const迭代器
vector::const_iterator it = v.begin();
while (it != v.end())
{
*it -= 1;
cout << *it << " ";
++it;
}
cout << endl;
① size() 获取数据个数
② capacity() 获取容量大小
③ empty() 判断是否为空
④ resize() 改变vector的size
⑤ reserve() 改变vector的capacity
void test_vector()
{
//vector v;
//cout << v.max_size() << endl;
size_t sz;
std::vector foo;
foo.reserve(100);
//foo.resize(100);
sz = foo.capacity();
std::cout << "making foo grow:\n";
for (int i = 0; i < 100; ++i) {
foo.push_back(i);
if (sz != foo.capacity()) {
sz = foo.capacity();
std::cout << "capacity changed: " << sz << '\n';
}
}
//vector countV;
//countV.resize(100, 1);
//countV.resize(10);
// string vector等都有一个特点,删除数据,一般是不会主动缩容
foo.resize(10);
cout << foo.size() << endl;
cout << foo.capacity() << endl;
}
① push_back() 尾插
② pop_back() 尾删
③ find 查找(位于算法algorithm中)
④ insert 在pos之前插入
⑤ erase 删除pos位置
⑥ swap 交换
⑦ operator[] 让vector像数组一样被访问
void test_vector1()
{
// 遍历
vector v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.insert(v.begin(), -1);
v.insert(v.begin(), -2);
v.insert(v.begin(), -3);
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
v.insert(v.begin() + 7, 300);
//v.insert(v.begin()+8, 300);
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
v.erase(v.begin());
v.erase(v.begin());
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
void test_vector2()
{
// 遍历
vector v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//vector::iterator pos = find(v.begin(), v.end(), 3);
auto pos = find(v.begin(), v.end(), 3);
if (pos != v.end())
{
cout << "找到了" << endl;
v.erase(pos);
}
else
{
cout << "没有找到" << endl;
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
v.push_back(0);
v.push_back(9);
v.push_back(3);
v.push_back(1);
// 默认是升序
//sort(v.begin(), v.end()); // <
// 排降序,仿函数
// sort(v.begin(), v.end(), greater()); // >
greater g;
sort(v.begin(), v.end(), g); // >
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装。
因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果可能是程序崩溃。
迭代器失效一共有两种:①野指针 ②意义变了
这里主要通过insert和erase来演示迭代器失效的问题:
(1)insert
①野指针:
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)
{
for (size_t i = 0; i < size(); ++i)
{
tmp[i] = _start[i];
}
delete _start;
}
_start = tmp;
}
_finish = _start + sz;
_endofstorage = _start + n;
}
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
// 扩容
if (_finish == _endofstorage)
{
size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
}
// 挪动数据
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
这是一个正常实现的insert函数,但是这里如果测试时如果发生扩容就会发现报错,原因是pos在发生扩容时,因为扩容的过程中是创建了一个临时tmp数组并开辟了扩容后的空间,将原数组拷贝tmp后将原数组给delete掉,这时再重新把tmp拷贝给_start数组。
这时的_start的地址已经不是原来的地址了,已经有了新的地址。这时,pos所指向的位置就不再是一个有效的空间了,就出现了野指针的问题。
修改方式:
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)
{
for (size_t i = 0; i < size(); ++i)
{
tmp[i] = _start[i];
}
delete _start;
}
_start = tmp;
}
_finish = _start + sz;
_endofstorage = _start + n;
}
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
// 扩容
if (_finish == _endofstorage)
{
size_t n = pos - _start;
size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
pos = _start + n;
}
// 挪动数据
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
这里通过n来保存原来pos和_start间的距离,然后在_start更新地址后,也更新pos的指向位置,就可以避免野指针的问题。
②意义变了:
实现了该insert函数之后,我们想要在一个数组中的偶数前加上20,按照原遍历方式:
void test_vector()
{
// 在所有的偶数的前面插入20
vector v;
//v.reserve(10);
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
v.push_back(6);
vector::iterator it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
it = v.insert(it, 20);
}
++it;
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
这里在*it为2时,会插入20,插入结束之后,it就变为刚插入的20,这时再++it,那么*it又为2了,就会导致死循环,这就是迭代器的意义变了。
修改方式:
void test_vector()
{
// 在所有的偶数的前面插入20
vector v;
//v.reserve(10);
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
v.push_back(6);
vector::iterator it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
it = v.insert(it, 20);
++it;
}
++it;
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
在插入之后多进行一次++it,就可以让it会到它原来的位置处,就可以避免因意义变了导致的迭代器失效问题。
(2)erase
iterator erase(iterator pos)
{
assert(pos >= _start && pos <= _finish);
iterator it = pos + 1;
while (it != _finish)
{
*(it - 1) = *it;
++it;
}
--_finish;
return pos;
}
void test_vector()
{
vector v;
//v.reserve(10);
v.push_back(1);
v.push_back(2);
v.push_back(2);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(4);
v.push_back(5);
cout << v.size() << ":" << v.capacity() << endl;
auto pos = find(v.begin(), v.end(), 4);
if (pos != v.end())
{
v.erase(pos);
}
cout << *pos << endl;
*pos = 10;
cout << *pos << endl << endl;
cout << v.size() << ":" << v.capacity() << endl;
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
这里在删除掉了4之后,pos的意义就变了,这里的pos就是原来pos的下一个元素了。
因此迭代器失效了。
void test_vector8()
{
std::vector v;
v.push_back(1);
v.push_back(2);
v.push_back(2);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(4);
v.push_back(4);
v.push_back(5);
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
it = v.erase(it);
}
++it;
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
这里我们想要删除偶数的数据,按照原来的方法进行,但是这里在删除掉一个偶数时,it就已经变为下一个元素了,而这时再次++,就会导致it的意义变了。
修改方式:
void test_vector8()
{
std::vector v;
v.push_back(1);
v.push_back(2);
v.push_back(2);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(4);
v.push_back(4);
v.push_back(5);
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
it = v.erase(it);
}
else
{
++it;
}
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
删除的时候,就不进行++,而不删除的时候再++,就可以避免这一种意义变了的迭代器失效问题。
memcpy是将一段内存空间的内容拷贝到另一段内存空间中,地址不会发生变化,是浅拷贝。
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)
{
// memcpy(tmp, _start, size() * sizeof(T));
for (size_t i = 0; i < size(); ++i)
{
tmp[i] = _start[i];
}
delete _start;
}
_start = tmp;
}
_finish = _start + sz;
_endofstorage = _start + n;
}
那么如果在reserve中使用memcpy,那么就会出现浅拷贝的统一问题,拷贝之后因为地址相同,在delete时,delete掉其中的一个之后,另一个随之失效,这时就会出现野指针的问题。
当然,出现这种问题的情况是当拷贝的是自定义类型时,例如vector
修改如下:
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)
{
for (size_t i = 0; i < size(); ++i)
{
tmp[i] = _start[i];
}
delete _start;
}
_start = tmp;
}
_finish = _start + sz;
_endofstorage = _start + n;
}
这里的vector的模拟实现有很多与string的模拟实现类似,就不再详细说明了。
_start为vector头,_finish为size大小位置,_ebdifstorage为capacity容量位置。
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
vector中的iterator就是T*。
typedef T* iterator;
typedef const T* const_iterator;
(1)无参构造函数
vector()
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{}
(2)迭代器区间构造函数
template
vector(InputIterator first, InputIterator last)
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
while (first != last)
{
push_back(*first);
++first;
}
}
(3)给想要的大小和给定的值进行的构造函数
n是构造size的大小,val是确定的值。
这里之所以有两个是因为当给的数是两个int类型的数时,会去调用上面的迭代器的构造函数,但是迭代器的构造函数又不能进行解引用操作,导致报错。
因此实现两个可以有效的避免这种问题。
vector(size_t n, const T& val = T())
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(n);
for (size_t i = 0; i < n; ++i)
{
push_back(val);
}
}
vector(int n, const T& val = T())
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(n);
for (int i = 0; i < n; ++i)
{
push_back(val);
}
}
(1)实现自己的swap函数
这里的拷贝构造和赋值运算符重载函数都是现代写法,因此需要自己实现一个swap函数来更方便的完成。
void swap(vector& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_endofstorage, v._endofstorage);
}
(2)拷贝构造函数
vector(const vector& v)
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
vector tmp(v.begin(), v.end());
swap(tmp);
}
(3)赋值运算符函数
vector& operator=(vector v)
{
swap(v);
return *this;
}
~vector()
{
if (_start)
{
delete[] _start;
_start = _finish = _endofstorage = nullptr;
}
}
迭代器要实现非const和const两种版本的。
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin() const
{
return _start;
}
const_iterator end() const
{
return _finish();
}
_finish - _start就是size。
_endofstorage - _start就是capacity。
size_t size() const
{
return _finish - _start;
}
size_t capacity() const
{
return _endofstorage - _start;
}
这里要注意用深拷贝,使用for循环,而不要用memcpy。
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)
{
// memcpy(tmp, _start, size() * sizeof(T));
for (size_t i = 0; i < size(); ++i)
{
tmp[i] = _start[i];
}
delete _start;
}
_start = tmp;
}
_finish = _start + sz;
_endofstorage = _start + n;
}
void resize(size_t n, T val = T())
{
if (n > capacity())
{
reserve(n);
}
if (n > size())
{
while (_finish < _start + n)
{
*_finish = val;
++_finish;
}
}
else
{
_finish = _start + n;
}
}
尾插、尾删函数可以自己实现,也可以调用insert和erase函数来实现。
尾插函数调用时参数为end()的原因是,end()函数返回的迭代器是最后一位元素的下一位,因此在end()前插入,就正好相当于尾插。
尾删函数同理,end() - 1才相当于最后一位元素。
void push_back(const T& x)
{
/*if (_finish == _endofstorage)
{
size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
}
*_finish = x;
++_finish;*/
insert(end(), x);
}
void pop_back()
{
/*if (_finish > _start)
{
--_finish;
}*/
erase(end() - 1);
}
要实现非const和const两种。
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T&operator[](size_t pos) const
{
assert(pos < size());
return _start[pos];
}
这里要注意野指针的情况,详细可以看迭代器失效中insert的第一种情况。
在STL库中insert要返回iterator,因此我们模拟也是返回iterator,这里返回iterator还是一种避免迭代器失效的方法。
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
// 扩容
if (_finish == _endofstorage)
{
size_t n = pos - _start;
size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
pos = _start + n;
}
// 挪动数据
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
在STL库中erase要返回iterator,因此我们模拟也是返回iterator,这里返回iterator还是一种避免迭代器失效的方法。
iterator erase(iterator pos)
{
assert(pos >= _start && pos <= _finish);
iterator it = pos + 1;
while (it != _finish)
{
*(it - 1) = *it;
++it;
}
--_finish;
return pos;
}
void clear()
{
_finish = _start;
}
#pragma once
#include
namespace hb
{
template
class vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
vector()
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{}
template
vector(InputIterator first, InputIterator last)
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
while (first != last)
{
push_back(*first);
++first;
}
}
vector(size_t n, const T& val = T())
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(n);
for (size_t i = 0; i < n; ++i)
{
push_back(val);
}
}
vector(int n, const T& val = T())
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(n);
for (int i = 0; i < n; ++i)
{
push_back(val);
}
}
void swap(vector& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_endofstorage, v._endofstorage);
}
vector(const vector& v)
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
vector tmp(v.begin(), v.end());
swap(tmp);
}
vector& operator=(vector v)
{
swap(v);
return *this;
}
~vector()
{
if (_start)
{
delete[] _start;
_start = _finish = _endofstorage = nullptr;
}
}
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin() const
{
return _start;
}
const_iterator end() const
{
return _finish();
}
size_t size() const
{
return _finish - _start;
}
size_t capacity() const
{
return _endofstorage - _start;
}
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)
{
// memcpy(tmp, _start, size() * sizeof(T));
for (size_t i = 0; i < size(); ++i)
{
tmp[i] = _start[i];
}
delete _start;
}
_start = tmp;
}
_finish = _start + sz;
_endofstorage = _start + n;
}
void resize(size_t n, T val = T())
{
if (n > capacity())
{
reserve(n);
}
if (n > size())
{
while (_finish < _start + n)
{
*_finish = val;
++_finish;
}
}
else
{
_finish = _start + n;
}
}
void push_back(const T& x)
{
/*if (_finish == _endofstorage)
{
size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
}
*_finish = x;
++_finish;*/
insert(end(), x);
}
void pop_back()
{
/*if (_finish > _start)
{
--_finish;
}*/
erase(end() - 1);
}
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T&operator[](size_t pos) const
{
assert(pos < size());
return _start[pos];
}
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
// 扩容
if (_finish == _endofstorage)
{
size_t n = pos - _start;
size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
pos = _start + n;
}
// 挪动数据
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
iterator erase(iterator pos)
{
assert(pos >= _start && pos <= _finish);
iterator it = pos + 1;
while (it != _finish)
{
*(it - 1) = *it;
++it;
}
--_finish;
return pos;
}
void clear()
{
_finish = _start;
}
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}