vector是一个封装了动态大小数组的顺序容器跟任意其它类型容器一样,它能够存放各种类型的对象。
在实现vector之前,为了和库里的区分开需要将实现的vector放在一个自定义的命名空间里。而且vector需要实现成模版的方式,所以需要我们传模版参数,模版参数也就是顺序容器所存的数据类型。而且根据库里的vector,有三个关键的成员变量,分别指向顺序容器的起始位置,数据容量位置,空间容量位置。
namespace cr
{
template
class vector
{
public:
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const iterator begin() const
{
return _start;
}
const iterator end() const
{
return _finish;
}
这里要提醒的就是,_finish指向的是最后一个有效数据的下一个位置,_endofstorage指向的是对象的最大容量位置处的下一个位置。
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
这里需要注意的是:不要忘记断言
size_t capacity() const
{
return _endofstorage - _start;
}
size_t size() const
{
return _finish - _start;
}
为了保证const对象调用该函数时也可以正常通过,所以对该函数进行const修饰。
~vector()
{
delete[] _start;
}
void reserve(size_t n)
{
if (n > capacity())
{
size_t sz = size();
T* tmp = new T[n];
if (sz != 0)
{
memcpy(tmp, _start, sizeof(T) * sz);
delete[] _start;//勿忘
}
_start = tmp;
_finish = _start + sz;
_endofstorage = _start + n;
}
}
这里进行扩容时一定要注意判断空间大小关系,尤其是要注意三个指针的指向问题,在此之前记录好原空间中有效数据的个数,因为执行new操作都是异地扩容,所以_start存的地址肯定发生改变,如果此时通过_start求得的_finish就一定会出错,所以需要提前记录好位置关系。但是该函数不一定正确
void push_back(const T& x) { if (_finish == _endofstorage) reserve(size() == 0 ? 4 : capacity() * 2); *_finish = x; _finish++; }
push_back需要注意的地方就是当空间大小为0时需要扩的大小,以及_finish++。这里来验证一下自内置类型的数据结果:
再看看string类的数据结果:引发了异常: 读取访问权限冲突。
其实这里的问题哦就是reserve的实现出了问题:
当空间不够时会发生扩容,就会调用memcpy函数,memcpy是库里的,而且我们知道memcpy内部就是通过值拷贝将_start解引用进行拷贝给tmp(_start是一个string类的指针),所以此时拷贝好的数据相当于是浅拷贝,指向如下:
然后调用析构函数,将_start空间内存释放,但是_start内部数据是string类,所以会先调用string的析构函数,释放string得空间,所以此时就是报错所在:tmp内的string同样也销毁了。
修改reverse函数
void reserve(size_t n) { if (n > capacity()) { size_t sz = size(); T* tmp = new T[n]; if (sz != 0) { //memcpy(tmp, _start, sizeof(T) * sz); for (int i = 0; i < sz; i++) { tmp[i] = _start[i];//如果T是string,调用std::string的赋值重载 } delete[] _start;//勿忘 } _start = tmp; _finish = _start + sz; _endofstorage = _start + n; } }
这种拷贝的方式就有效避免了浅拷贝的问题,如果模版参数T是string类的话,tmp[i]的类型就是string,所以此时的赋值就会调用string的赋值重载operator=()进行深拷贝,所以就不会出问题。
void resize(size_t n, const T& x = T())//匿名对象
{
if (n > size())
{
reserve(n);
while (_finish != _endofstorage)
{
*_finish = x;
_finish++;
}
}
else
{
_finish = _start + n;
}
}
这里要注意的就是T x给的缺省值T(),T()其实就是调用匿名对象的构造函数,然后在调用拷贝构造给x对象,而编译器会优化成直接的构造。匿名对象具有常性(不能&(同一块空间)不加const),出了该行就自动析构,const引用可以延长匿名对象的生命周期。但是如果是内置类型,这样写也是没问题的,其实内置类型也是可以看做有构造函数的。就如下测试:
vector(size_t n=0,const T& val=T()) :_start(nullptr) , _finish(nullptr) , _endofstorage(nullptr) { reserve(n); while (n--) { push_back(val); } }
拷贝构造
vector(const vector
& v) :_start(new T[v.capacity()]) ,_finish(_start) ,_endofstorage(_start+v.capacity()) { for (auto ch : v) { *_finish = ch;//如果T是string,调用std::string的赋值重载 _finish++; } } 通过迭代器区间初始化的构造函数
//在一个类模版里面还可以继续写模版函数 template
vector(InputIterator first, InputIterator last) :_start(nullptr) , _finish(nullptr) , _endofstorage(nullptr) { while (first != last) { push_back(*first); first++; } } 这里迭代器区间的构造函数是需要实现成模版类型的,因为库里面的STL说明不同的容器可以通过迭代器区间进行初始化,只不过有点不兼容的可以进行强制类型转换:
但是当执行到构造函数时:
cr::vector
vv(3, 1); 会报错:非法的间接寻址
原因:当我们调用构造函数时,会优先找最匹配的构造函数进行调用,所以此时以上的三种构造函数就会调用迭代器区间构造函数,而不是第一种
vector(size_t n=0,const T& val=T())//一般构造 vector(InputIterator first, InputIterator last)迭代器区间构造
调用第一种时会发生int类型到size_t类型的转换,而第三种构造函数会直接调用,因为第三种构造有模版参数,而对于两个参数(3,1)都是int类型,所以此时模版形参InputIterator就是替换成int型,所以此时第三种更匹配。
解决方法:
- 将第一个构造函数的形参改变成int类型
- 再生成一个构造函数形成重载
vector(int n, const T& val = T()) :_start(nullptr) , _finish(nullptr) , _endofstorage(nullptr) { reserve(n); while (n--) { push_back(val); } }
vector& operator=(vector v)
{
swap(_start, v._start);
swap(_finish, v._finish);
swap(_endofstorage, v._endofstorage);
return *this;
}
这里是要一个返回值的,主要是避免连等的情况:a=b=c;
void insert(iterator pos, T x) { assert(pos >= _start && pos <= _finish); if (_finish == _endofstorage); { reserve(_start==nullptr?4:capacity() * 2); } iterator end = _finish-1; while (end >= pos) { *(end + 1) = *end; end--; } *pos = x; _finish++; }
以上代码其实是有问题的,如下测试:
调试时你会发现是在insert内部出了问题 而且会在下面代码不断循环
while (end >= pos) { *(end + 1) = *end; end--; }
所以问题极可能出现在上面的代码段:
此时pos依旧是nullptr,就相当于pos指向的依旧是原空间的地址,插入数据扩容时,空间都发生了变化,所以再拿原空间的指针和新空间的指针比较就不妥。
修改代码:其实就是记录pos位置和_start之间的差距,好在扩容到新空间时,将差距补上
void insert(iterator pos, T x)//insert使用之后迭代器失效最好不要使用 { assert(pos >= _start && pos <= _finish);//不要忘记断言 if (_finish == _endofstorage); { size_t len = pos - _start; reserve(_start==nullptr?4:capacity() * 2);//异地扩容改变了_start,可能导致pos成为野指针 pos = _start + len; } iterator end = _finish-1; while (end >= pos) { *(end + 1) = *end; end--; } *pos = x; _finish++; }
虽然修改了代码,编译起来也没问题,但是如果你执行下列操作还是跑不通:
此时是断言处出问题了,其实这种情况属于迭代器失效因为你插入数据时发生了扩容了,所以同上面一样,it指针指向的是原空间的首个位置,所以就会错误
解决方法:每次插入数据是重新调用迭代器v.begin()或v.end()来获得迭代器的位置。
void erase(iterator pos) { assert(pos < _finish&& pos >= _start); iterator end = pos + 1; while (end < _finish) { *(end - 1) = *end; end++; } _finish--; }
这里和inssert是不同的,erase不会发生扩容,所以也不存在迭代器失效,但是这erase要注意的就是,每次删除一个数据时位置会发生挪动,所以一般在刷题时一定要注意这个小细节。
而VS下的erase是并不是这样实现的,VS下的erase也只能使用一次,用完了该指针也就是失效了。尽管进行it++还是--来改变it再使用也是不可以的。
所以可以借鉴insert的用法:
其实返回的就是你删除的那个数据的下一个位置,但是位置会发生挪动,所以,返回的也就是pos位置
如有解释不当,欢迎大家留言!