C++学习笔记(十四)——vector的模拟实现

vector各函数接口总览

vector当中的成员变量介绍

默认成员函数

构造函数1

构造函数2

构造函数3

拷贝构造函数

赋值运算符重载函数

析构函数

迭代器相关函数

begin和end

容量和大小相关函数

size和capacity

reserve

resize

empty

修改容器内容相关函数

push_back

pop_back

insert

erase

swap

访问容器相关函数

operator[]


vector各函数接口总览

namespace cl
{
	//模拟实现vector
	template
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		//默认成员函数
		vector();                                           //构造函数
		vector(size_t n, const T& val);                     //构造函数
		template                      
		vector(InputIterator first, InputIterator last);    //构造函数
		vector(const vector& v);                         //拷贝构造函数
		vector& operator=(const vector& v);           //赋值运算符重载函数
		~vector();                                          //析构函数

		//迭代器相关函数
		iterator begin();
		iterator end();
		const_iterator begin()const;
		const_iterator end()const;

		//容量和大小相关函数
		size_t size()const;
		size_t capacity()const;
		void reserve(size_t n);
		void resize(size_t n, const T& val = T());
		bool empty()const;

		//修改容器内容相关函数
		void push_back(const T& x);
		void pop_back();
		void insert(iterator pos, const T& x);
		iterator erase(iterator pos);
		void swap(vector& v);

		//访问容器相关函数
		T& operator[](size_t i);
		const T& operator[](size_t i)const;

	private:
		iterator _start;        //指向容器的头
		iterator _finish;       //指向有效数据的尾
		iterator _endofstorage; //指向容器的尾
	};
}

注意:为了防止与标准库当中的vector产生命名冲突,模拟实现时需放在自己的命名空间中。 

vector当中的成员变量介绍

在vector中三个成员变量_start,_finish,_endofstorage.

C++学习笔记(十四)——vector的模拟实现_第1张图片

默认成员函数

构造函数1

vector支持无参构造函数,对于这个无参的构造函数,我们直接将构造对象的三个成员变量都设置为空指针。

vector()
   :_start(nullptr)
   ,_finish(nullptr)
   ,_endofstorage(nullptr)

构造函数2

vector是支持使用迭代器区间进行对像的构造的。因为该迭代器区间可以是其他容器的迭代器区间,也就是说该函数收到的迭代器的类型是不确定的,所以我们这里需要将该构造函数设计成一个函数模板,在该函数体内将该迭代器区间的数据一个个尾插到容器中。

template
vector(InputIterator first,InputIterator last)
   :_start(nullptr)
   ,_finish(nullptr)
   ,_endofstorage(nullptr)
{
 while(first!=last)
 {
   push_back(*first);
   first++;
  }
}

构造函数3

此外,vector还支持构造这样一种容器,该容器当中含有n个值为val的数据。对于该构造函数,我们可以先使用reserve函数将容器容量先设置为n,然后使用push_back函数尾插n个值为val的数据到容器当中即可。

//构造函数
		vector(size_t n, const T& val)
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

注意: 

1)该构造函数知道其需要用于存储n个数据的空间,所以最好用reserve函数一次性开辟好空间,避免调用push_back函数时需要增容多次,导致效率降低。

2)该构造函数还需要实现两个重载函数。

vector(long n, const T& val)
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

vector(int n, const T& val)
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

可以看到,这两个重载函数与之不同的就是其参数n的类型不同,但这却是必要的,否则当我们使用以下代码时,编译器会优先构造函数2相匹配。

vector v(5, 7); //调用构造函数3 ???

并且因为构造函数2当中对参数first和last进行了解引用(而int类型不能进行解引用操作)而报错。 

拷贝构造函数

vector的构造函数涉及拷贝问题,这里提供两种深拷贝的方法:

法一:传统写法

先开辟一块与该容器大小相同的空间,然后将该容器当中的数据一个个拷贝过来即可,最后更新_finish和_endofstorage的值即可。

vector(const vector& v)
   :_start(nullptr)
   ,_finish(nullptr)
   ,_endofstorage(nullptr)
{
  _start=new T[v.capacity()];
  for(size_t i=0;i

注意:将容器当中的数据一个个拷贝过来时不能使用memcpy函数,当vector存储的数据是内置类型或无需进行深拷贝的自定义类型时,使用memcpy函数是没什么问题的,但当vector存储的数据是需要进行深拷贝的自定义类型时,使用memcpy函数的弊端就体现出来了。例如,当vector存储的数据是string类的时候。

C++学习笔记(十四)——vector的模拟实现_第2张图片

 并且vector当中存储的每个string都指向自己所存储的字符串。C++学习笔记(十四)——vector的模拟实现_第3张图片

如果此时我们使用的是memcpy函数进行拷贝构造的话,那么拷贝构造出来的vector当中存储的每个string的成员变量的值,将与被拷贝的vector当中存储的每个string的成员变量的值相同,即两个vector当中的每个对应的string成员都指向同一个字符串空间。

C++学习笔记(十四)——vector的模拟实现_第4张图片 这显然不是我们得到的结果,那么所给代码是如何解决这个问题的呢?

C++学习笔记(十四)——vector的模拟实现_第5张图片

 代码中看似是使用普通的“=”将容器当中的数据一个个拷贝过来,实际上是调用了所存元素的赋值运算符重载函数,而string类的赋值运算符重载函数就是深拷贝。

总结: 如果vector当中存储的元素类型是内置类型(int)或浅拷贝的自定义类型(Date),使用memcpy函数进行进行拷贝构造是没问题的,但如果vector当中存储的元素类型是深拷贝的自定义类型(string),则使用memcpy函数将不能达到我们想要的效果。

法二:现代写法

拷贝构造函数的现代写法也比较简单,使用范围for(或是其他遍历方式)对容器v进行遍历,在遍历过程中将容器v中存储的数据一个个尾插过来即可。

//拷贝构造,现代写法
		vector(const vector& v)
			:_start(nullptr)
			,_finish(nullptr)
			,_endofstorage(nullptr)
		{
			reserve(v.capacity());
			for (auto e : v)
			{
				push_back(e);
			}
			
		}

 注意:在使用范围for对容器v进行遍历的过程中,变量e就是每一个数据的拷贝,然后将其尾插到构造出来的容器当中。就算容器v当中存储的数据是string类,在e拷贝时也会自动调用string的拷贝构造(深拷贝),所以也能够避免出现与使用memcpy时类似的问题。

赋值运算符重载函数

法一:传统写法

首先判断是否是给自己赋值,若是给自己赋值则无需进行操作。若不是给自己赋值,则先开辟一块和容器v大小相同的空间,然后将容器v当中的数据一个个拷贝过来,最后更新_finish和_endofstorage的值即可。

vector& operator=(const vector& v)
{
   if(this!=&v)
    {
      delete[] _start;
      _start=new T[v.capacity()];
      for(size_t i=0;i

 注意: 这里和拷贝构造函数的传统写法类似,也不能使用memcpy函数进行拷贝。

写法二:现代写法
赋值运算符重载的现代写法非常精辟,首先在右值传参时并没有使用引用传参,因为这样可以间接调用vector的拷贝构造函数,然后将这个拷贝构造出来的容器v与左值进行交换,此时就相当于完成了赋值操作,而容器v会在该函数调用结束时自动析构。

//现代写法
vector& operator=(vector v) //编译器接收右值的时候自动调用其拷贝构造函数
{
	swap(v); //交换这两个对象
	return *this; //支持连续赋值
}

 注意: 赋值运算符重载的现代写法也是进行的深拷贝,只不过是调用的vector的拷贝构造函数进行的深拷贝,在赋值运算符重载函数当中仅仅是将深拷贝出来的对象与左值进行了交换而已。

析构函数

对容器进行析构时,首先判断该容器是否为空容器,若为空容器,则无需进行析构操作,若不为空,则先释放容器存储数据的空间,然后将容器的各个成员变量设置为空指针即可。

//析构函数
~vector()
{
	if (_start) //避免对空指针进行释放
	{
		delete[] _start; //释放容器存储数据的空间
		_start = nullptr; //_start置空
		_finish = nullptr; //_finish置空
		_endofstorage = nullptr; //_endofstorage置空
	}
}

迭代器相关函数

vector当中的迭代器实际上就是容器当中所存储数据类型的指针。

typedef T* iterator;
typedef const T* const_iterator;

begin和end

vector当中的begin函数返回容器的首地址,end函数返回容器当中有效数据的下一个数据的地址。

iterator begin()
{
  return _start;
}

iterator end()
{
  return _finish;
}

 还需要重载一对适用于const对象的begin和end函数,使得const对象调用begin和end函数时所得到的迭代器只能对数据进行读操作,而不能进行修改。

const_iterator begin() const
{
  return _start;
}
const_iterator end() const
{
  return _finish;
}

此时再让我们来看看vector使用迭代器的代码也就一目了然了,实际上就是使用指针遍历容器。

vector v(5, 3);
vector::iterator it = v.begin();
while (it != v.end())
{
	cout << *it << " ";
	it++;
}
cout << endl;

现在我们实现了迭代器,实际上就可以使用范围for遍历容器了, 因为编译器在编译时会自动将范围for替换成迭代器的形式。

vector v(5,3);

for(auto e:v)
{
  cout<

容量和大小相关函数

size和capacity

对照着vector当中三个成员遍历各自的指向,我们可以很容易得出当前容器中的有效数据个数和最大容量。由于两个指针相减的结果,就是这两个指针之间对应类型的数据个数,所以size可以由_finish - _start得到,而capacity可以由_endofstorage - _start得到。

size_t size()const
{
	return _finish - _start; //返回容器当中有效数据的个数
}
size_t capacity()const
{
	return _endofstorage - _start; //返回当前容器的最大容量
}

reserve

reserve规则:
 1、当n大于对象当前的capacity时,将capacity扩大到n或大于n。
 2、当n小于对象当前的capacity时,什么也不做。

reserve函数的实现思路也是很简单的,先判断所给n是否大于当前容器的最大容量(否则无需进行任何操作),操作时直接开辟一块可以容纳n个数据的空间,然后将原容器当中的有效数据拷贝到该空间,之后将原容器存储数据的空间释放,并将新开辟的空间交给该容器维护,最好更新容器当中各个成员变量的值即可。

void reserve(size_t n)
{
	if (n > capacity()) //判断是否需要进行操作
	{
		size_t sz = size(); //记录当前容器当中有效数据的个数
		T* tmp = new T[n]; //开辟一块可以容纳n个数据的空间
		if (_start) //判断是否为空容器
		{
			for (size_t i = 0; i < sz; i++) //将容器当中的数据一个个拷贝到tmp当中
			{
				tmp[i] = _start[i];
			}
			delete[] _start; //将容器本身存储数据的空间释放
		}
		_start = tmp; //将tmp所维护的数据交给_start进行维护
		_finish = _start + sz; //容器有效数据的尾
		_endofstorage = _start + n; //整个容器的尾
	}
}

在reserve函数的实现当中有两个地方需要注意:
1)在进行操作之前需要提前记录当前容器当中有效数据的个数。
因为我们最后需要更新_finish指针的指向,而_finish指针的指向就等于_start指针加容器当中有效数据的个数,当_start指针的指向改变后我们再调用size函数通过_finish - _start计算出的有效数据的个数就是一个随机值了。

C++学习笔记(十四)——vector的模拟实现_第6张图片
2)拷贝容器当中的数据时,不能使用memcpy函数进行拷贝
可能你会想,当vector当中存储的是string的时候,虽然使用memcpy函数reserve出来的容器与原容器当中每个对应的string成员都指向同一个字符串空间,但是原容器存储数据的空间不是已经被释放了,相当于现在只有一个容器维护这这些字符串空间,这还有什么影响。
但是不要忘了,当你释放原容器空间的时候,原容器当中存储的每个string在释放时会调用string的析构函数,将其指向的字符串也进行释放,所以使用memcpy函数reserve出来的容器当中的每一个string所指向的字符串实际上是一块已经被释放的空间,访问该容器时就是对内存空间进行非法访问。

C++学习笔记(十四)——vector的模拟实现_第7张图片
所以说我们还是得用for循环将容器当中的string一个个赋值过来,因为这样能够间接调用string的赋值运算符重载,实现string的深拷贝。

C++学习笔记(十四)——vector的模拟实现_第8张图片  

resize

resize规则:
 1、当n大于当前的size时,将size扩大到n,扩大的数据为val,若val未给出,则默认为容器所存储类型的默认构造函数所构造出来的值。
 2、当n小于当前的size时,将size缩小到n。

根据resize函数的规则,进入函数我们可以先判断所给n是否小于容器当前的size,若小于,则通过改变_finish的指向,直接将容器的size缩小到n即可,否则先判断该容器是否需要增容,然后再将扩大的数据赋值为val即可。

void resize(size_t n, const T& val = T())
{
	if (n < size()) //当n小于当前的size时
	{
		_finish = _start + n; //将size缩小到n
	}
	else //当n大于当前的size时
	{
		if (n > capacity()) //判断是否需要增容
		{
			reserve(n);
		}
		while (_finish < _start + n) //将size扩大到n
		{
			*_finish = val;
			_finish++;
		}
	}
}

注意: 在C++当中内置类型也可以看作是一个类,它们也有自己的默认构造函数,所以在给resize函数的参数val设置缺省值时,设置为T( )即可。

empty

empty函数可以直接通过比较容器当中的_start和_finish指针的指向来判断容器是否为空,若所指位置相同,则该容器为空。

bool empty()const
{
	return _start == _finish;
}

修改容器内容相关函数

push_back

要尾插数据首先得判断容器是否已满,若已满则需要先进行增容,然后将数据尾插到_finish指向得位置,再将_finish++即可。

void push_back(const T& x)
{
  if(_finish==_endofstorage)
  {
    size_t newcapacity=capacity()==0?4:2*capacity();
    reserve(newcapacity);
   }
   *_finish=x;
    _finish++;
}

使用memcpy拷贝问题  

假设模拟实现的vector中的reserve接口中,使用memcpy进行的拷贝,以下代码会发生什么问题?

int main()
{
qk::vector v;
v.push_back("1111");
v.push_back("2222");
v.push_back("3333");
return 0;
}

问题分析:
1. memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中
2. 如果拷贝的是自定义类型的元素,memcpy即高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。 

 

 结论:如果对象中涉及到资源管理时,千万不能使用memcpy进行对象之间的拷贝,因为memcpy是浅拷贝,否则可能会引起内存泄漏甚至程序崩溃。

pop_back

尾删数据之前也得先判断容器是否为空,若为空则做断言处理,若不为空则将_finish--即可。

void pop_back()
{
  assert(!empty());
  _finish--;
}

insert

insert函数可以在所给迭代器pos位置插入数据,在插入数据前先判断是否需要增容,然后将pos位置及其之后的数据统一向后挪动一位,以留出pos位置进行插入,最后将数据插入到pos位置即可。


void insert(iterator pos, const T& x)
{
	if (_finish == _endofstorage) 
	{
		size_t len = pos - _start; 
		size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity(); 
		reserve(newcapacity); 
		pos = _start + len; 
	}

	iterator end = _finish;
	while (end > pos + 1)
	{
		*end = *(end - 1);
		end--;
	}
	*pos = x; 
	_finish++; 
}

erase

erase函数可以删除所给迭代器pos位置得数据,在删除数据前需要判断容器释放为空,若为空则需做断言处理,删除数据时直接将pos位置之后得数据同一向前挪动一位,将pos位置的数据覆盖即可。

iterator erase(iterator pos)
{
  assert(!empty());
  
  iterator it=pos+1;
  while(it!=_finish)
  {
     *(it-1)=*it;
       it++;
   }
   _finish--;
   return pos;
}

swap

swap函数用于交换两个容器的数据,我们可以直接调用库当中的swap函数将两个容器当中的各个成员变量进行交换即可。

//交换两个容器的数据
void swap(vector& v)
{
	//交换容器当中的各个成员变量
	::swap(_start, v._start);
	::swap(_finish, v._finish);
	::swap(_endofstorage, v._endofstorage);
}

注意:在此处调用库当中的swap需要在swap之前加上“::”(作用域限定符),告诉编译器这里优先在全局范围寻找swap函数,否则编译器会认为你调用的就是你正在实现的swap函数(就近原则)。

访问容器相关函数

operator[]

vector也支持我们使用"下标+[]"的方式对容器当中的数据进行访问,实现时直接返回对应位置的数据即可。

T& operator[](size_t i)
{
   assert(i

注意: 重载运算符[ ]时需要重载一个适用于const容器的,因为const容器通过“下标+[ ]”获取到的数据只允许进行读操作,不能对数据进行修改。

你可能感兴趣的:(#,C++,c++,学习,开发语言)