work_hard423

哈希的介绍以及哈希表的模拟实现

哈希表（散列表）的概念

哈希冲突

发生了哈希冲突该怎么办

闭散列(开放定址法)

在闭散列的方式下，如何从代码层面上判断是否发生了哈希冲突呢？

通过闭散列的方式实现的哈希表的基础框架

1. 线性探测

哈希表的Insert的整体代码（通过闭散列的线性探测方法实现）

哈希表的Find和Erase的整体代码（通过闭散列的线性探测方法实现）

闭散列的线性探测版本下的哈希表的整体代码

闭散列的线性探测版本下的Insert、Find、Erase的测试

线性探测的优缺点

2. 二次探测

哈希表的Insert的整体代码（通过闭散列的二次探测方法实现）

二次探测的优缺点

开散列（链地址法、开链法）

在开散列的方式下，如何从代码层面上判断是否发生了哈希冲突呢？

通过开散列的方式实现的哈希表的基础框架

通过开散列的方式实现的哈希表的Insert

哈希表的Insert的整体代码（通过开散列的方式实现）

开散列版本下的Insert的测试

通过开散列的方式实现的哈希表的Erase和Find

哈希表的Erase和Find的整体代码（通过开散列的方式实现）

开散列版本下的Erase和Find的测试

通过开散列的方式实现的哈希表的析构函数

通过开散列的方式实现的哈希表的拷贝构造

开散列的哈希表的拷贝构造的测试

对开散列的哈希表的性能的测试

开散列的哈希表的迭代器

迭代器类的基础框架（包含operator*()等等接口）

迭代器类的前后置的operator++函数

哈希表类的begin()、end()函数

和哈希表的迭代器相关的整体代码

开散列版本的哈希表的整体代码

通过开散列方式实现的哈希表优点

哈希表（散列表）的概念

顺序结构以及平衡树中，元素关键码与其存储位置之间没有对应的关系，因此在查找一个元素时，必须要经过关键码的多次比较，比如在搜索树中，如果比当前节点大，就往右边走，小就往左边走。顺序结构的查找的时间复杂度为O(N)；而搜索树中的查找的时间复杂度为O（h），h表示树的高度，因为平衡树也是搜索树，所以平衡树中的查找的时间复杂度为O(log_2N)，查找的效率取决于查找过程中元素的比较次数。理想的搜索方法：可以不经过任何比较，一次直接从表中得到要搜索的元素。如果构造一种存储结构，通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立【一对一】的映射的关系，那么在查找时通过该函数可以很快找到该元素，其时间复杂度可以达到O（1）。

在哈希（散列）结构中插入元素就是根据待插入元素的关键码，以hashFunc函数计算出该元素的存储位置并按此位置进行存放。

在哈希（散列）结构中搜索元素就是对元素的关键码通过hashFunc函数进行计算，把求得的函数值当做元素的存储位置，在结构中按此位置取元素比较，若关键码相等，则搜索成功，反之则失败。

上面所描述的方式即为哈希(散列)方法，哈希方法中使用的hashFunc转换函数称为哈希(散列)函数，构造出来的结构称为哈希表(Hash Table)或者散列表。为了加深理解，简单上一个实例，如下图。

哈希冲突

用上面的哈希方法进行搜索的确不必进行多次关键码的比较，的确搜索的速度比较快，但在上图中，按照上面所说的哈希方式向集合中再插入元素44时就会出现问题：按照哈希函数44%10==4，但问题是下标为4的空间上已经存储了元素4，所以元素44就无法插入，这就是哈希冲突问题。

哈希冲突的标准定义是：不同关键码通过相同的哈希函数计算出相同的哈希地址，该种现象称为哈希冲突或哈希碰撞。

这里顺便说一下另一个概念：把具有不同关键码而具有相同哈希地址的数据元素称为“同义词”。

发生了哈希冲突该怎么办

有两种应对方案，第一种叫闭散列，第二种叫开散列。

闭散列(开放定址法)

闭散列：也叫开放定址法，当发生哈希冲突时，如果哈希表未被装满，说明在哈希表中必然还有空位置，那么可以把key存放到冲突位置中的“下一个” 空位置中去。

那如何寻找下一个空位置呢？有两种方式，第一种叫线性探测，第二种叫二次探测。

在闭散列的方式下，如何从代码层面上判断是否发生了哈希冲突呢？

有人看到这个问题，肯定直接就会说：【这还不简单，拿上图举例，我插入元素44时，根据哈希函数算出的哈希地址hashAddr上已经存在了元素4，这不就是哈希冲突嘛？】

这里我想说的是：问题在于该怎么判断一个哈希地址上是否存在元素，难道根据元素不是0就判断为当前位置上存在元素，根据元素是0就判断为当前位置上不存在元素吗？答案：当然不行，举个例子，现在假设根据元素是0就可以判断为当前位置上不存在元素，那如果我要插入的数据是0，在某个位置A上插入0后，之后如果有元素根据哈希函数算出的哈希地址就是位置A，此时根据这个假设，就会覆盖掉之前插入的元素0，这不是我们想要看到的。所以综上所述，我们需要思考出一种方案让一个哈希地址能表示出当前的位置是空（无效），还是非空（有效），这样一来，就有办法判断是否发生了哈希冲突了。比如拿插入元素x举例，根据哈希函数算出元素x的哈希地址HashAddr后，发现下标为HashAddr的位置上不为空，则说明发生了哈希冲突；反之如果为空，则没有发生哈希冲突。

那如何判断一个哈希地址上当前是否为空呢？

1.如果哈希表中的每个数据不是自定义类，则常见的方法有以下两种：

1.1：使用其他特殊值表示空或无效的状态：可以选择一个与哈希表中可能的有效值不同的特殊值，用来表示空或无效的状态。例如，可以选择一个负数或其他非常规的值来表示空位置。

1.2：使用额外的标记数组：可以使用一个额外的布尔数组或位图来标记哈希表中的每个位置是否已经被占用。这样，即使哈希表中的某个位置存储了0，你仍然可以通过标记数组来判断该位置是否已经被占用。

2.如果哈希表中的每个数据是自定义类，则就简单了，为每个数据类定义两个类成员，一个表示数据的值，一个表示数据的状态，数据的状态是空，则当前哈希地址上就是空；数据的状态不是空，则当前哈希地址上就不是空。

通过闭散列的方式实现的哈希表的基础框架

选择上面哪种方法取决于你的具体需求和哈希表的实现方式。在实际应用中，需要根据具体情况选择最适合的方法来处理特殊值的情况。接下来有两种解决哈希冲突的方案，分别叫【闭散列的线性探测】和【闭散列的二次探测】，并且因为存在一些需求，所以我们要为这两种方法而把数据定义成自定义类型，数据类里就有两个成员，一个表示数据的值，一个表示数据的状态。所以通过闭散列的方式实现的哈希表的基础框架如下。

#pragma once
#include
#include
using namespace std;


enum State
{
	EXIST,
	DELETE,
	EMPTY
};

template
struct HashDate
{
	HashDate()
		:_data()
		, _s(EMPTY)
	{}

	HashDate(const T& x)
		:_data(x)
		, _s(EXIST)
	{}

	T _data;
	State _s;
};

template
class HashTable
{
public:
	

private:
	vector> _v;
	size_t _size;
};

1. 线性探测

拿上面讲解哈希冲突时所使用的场景举例，如上图。现在需要插入元素44，先通过哈希函数计算哈希地址，hashAddr为4，因此44理论上应该插在该位置，但是该位置已经放了值为4的元素，即发生哈希冲突，线性探测就是从发生冲突的位置开始，依次向后探测，直到寻找到下一个空位置为止，也就是上图中hashAddr为8的地方，在这个位置上插入元素44。

所以结合闭散列的线性探测的思想，在哈希（散列）结构中插入元素就是：先通过哈希函数获取待插入元素在哈希表中的位置，然后如果该位置中没有元素则直接插入新元素，如果该位置中有元素发生哈希冲突，使用线性探测找到下一个空位置，插入新元素。

结合上面插入的理论，咱们可以编写出第一阶段的Insert的代码。（注意下面代码未编写完毕）

#pragma once
#include
#include
using namespace std;


enum State
{
	EXIST,
	DELETE,
	EMPTY
};

template
struct HashDate
{
	HashDate()
		:_data()
		, _s(EMPTY)
	{}

	HashDate(const T& x)
		:_data(x)
		, _s(EXIST)
	{}

	T _data;
	State _s;
};


template
class HashTable
{
public:
	bool Insert(const T& x)
	{
		//在文中的图示中，我们计算HashAddr的值都是让数据去模哈希表的capacity，那这里的代码计算HashAddr的值时为什么是%size而不是%capacity呢？
		//因为哈希表的底层容器是vector，而对于vector来说，就算你capacity是100，但如果size是0，那在前100个数据里，我们无法通过operator【】访问任意一个，会断言报错，
		//所以这里我想说的是：vector的size就是哈希表的capacity，所以本质上这里计算HashAddr的值依然是让数据去模哈希表的capacity，只不过vector的size就是哈希表的capacity
		//问题：如何通过代码体现出【vector的size就是哈希表的capacity】这一点呢？答案：给哈希表扩容时，也就是让哈希表的capacity变大时，要通过vector的resize函数给vector的size变大，vector的size变大后，哈希表的capacity也就变大了
		int hashaddr = x % _v.size();
		if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
		{
			_v[hashaddr]._data = x;
			_v[hashaddr]._s = EXIST;
			_size++;
			return true;
		}
		else//走到这里说明发生了哈希冲突，开始线性探测
		{
			int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经插入了数据时再去插入新数据，此时就会出现死循环。
			hashaddr++;
			while (hashaddr != temp)
			{
				//这里模%的意义是：有可能hashaddr的值在数组的靠后位置，后面的位置都满了，但数组的前几个位置是空的，所以如果超出数组范围了，我们应该重新从数组的首部开始找空位置
				if (hashaddr == _v.size())
				{
					hashaddr %= _v.size();
				}

				if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
				{
					_v[hashaddr]._data = x;
					_v[hashaddr]._s = EXIST;
					_size++;
					return true;
				}
				else
				{
					hashaddr++;
				}
			}			
		}

	}

private:
	vector> _v;
	size_t _size;
};

仔细观察代码，如果这样写，则还有一个问题没有解决，那就是可能哈希表的capacity已经满了（或者是正在进行第一次插入，哈希表没开空间），就是说：在哈希表【0，哈希表的capacity】这个区间的位置上都已经存在了数据，此时数据就插入不进去了，此时哈希表就需要扩容。说一下，因为上面代码的注释中说过【vector的size就是哈希表的capacity】，所以哈希表的capacity已经满了也等价于是vector的size满了，就是说是在vector中的【0，vector的size】这个区间的位置上，都已经存在了数据，此时数据就插入不进去了，此时vector不一定需要扩容，但一定得把size变大。那么综上所述，问题就转化成了：如何给哈希表扩容（或者说如何把vector的size变大）？答案：很简单，通过vector的resize函数即可给哈希表扩容（或者说把vector的size变大）。

问题1：那什么时候扩容呢？有人肯定会说：【上一段不是说过了吗，在哈希表插满了就扩容呗】，这里我想说的是：【实际上不会这么做，因为在哈希表只剩下1个空位置没有被插入数据时，再去插入数据则极大概率会不断地向后继续探测找空位置，则导致插入的效率非常低效】，那到底什么时候扩容呢？

给出答案前，首先需要知道几个知识点：

1.散列表（即哈希表）的载荷因子（也叫负载因子）定义为:α =填入散列表中的元素个数/散列表的长度（长度就是哈希表的capacity）。

2.α是散列表（即哈希表）装满程度的标志因子。由于表长是定值，α与“填入表中的元素个数”成正比，所以，α越大，表明填入表中的元素越多，产生冲突的可能性就越大，插入删除的效率就越低（但空间利用率会变高）；反之，α越小，说明填入表中的元素越少，产生冲突的可能性就越小，插入删除的效率就越高（但空间利用率会变低）。

3.实际上，散列表（即哈希表）的平均查找长度是载荷因子α的函数，只是不同处理冲突的方法有不同的函数。对于开放定址法，荷载因子是特别重要因素，应严格限制在0.7-0.8以下。超过0.8，查表时的CPU缓存不命中(cache missing）按照指数曲线上升。因此，一些采用开放定址法的hash库，如Java的系统库限制了荷载因子为0.75，超过此值将resize散列表。

答案1：结合上面的几个知识点可知，让哈希表的负载因子为0.7后就扩容是若干个合适的选择中的一个，所以我们就按照0.7为标准，只要在插入某个数据时，发现当前的负载因子是0.7，就需要让哈希表扩容。

（说一下：因为在插入时只要发现当前的负载因子是0.7，就需要让哈希表扩容，这就意味着哈希表永远不可能被插满，所以上面代码中的temp变量就失去了意义，可以注释掉了）

问题2：那扩容扩多大呢？或者说怎么扩容呢？

答案2：扩容的大小一般和vector一样，也是扩2倍，但注意，哈希表的扩容不能像vector一样直接扩2倍后拷贝原数据到新空间上，什么意思呢？比如说在哈希表扩容前，假如有数据13，则在经过哈希函数int hashaddr = x % _v.size()的计算后，数据应插入下标为3的位置上；但在哈希表扩容后，哈希表的capacity变大后（也就是vector的size变大后），此时数据13就不应该还放到下标为3的位置上，因为数据13此时再经过哈希函数int hashaddr = x % _v.size()的计算，数据按理应插入下标为13的位置上。但如果哈希表的扩容像vector一样直接扩2倍后拷贝原数据到新空间上，则数据13在哈希表扩容后，依然位于下标为3的位置上，这就导致了哈希函数的映射关系乱套了，所以哈希表的扩容不能像vector一样直接扩2倍后拷贝原数据到新空间上。所以综上所述，可以发现哈希表的扩容是比vector的扩容有更多的消耗的，因为哈希表在扩容后，需要根据哈希函数重新映射哈希表中所有的元素。

结合上面理论，可以得到第二阶段的Insert的代码，如下。（注意下面代码未编写完毕）

#pragma once
#include
#include
using namespace std;


enum State
{
	EXIST,
	DELETE,
	EMPTY
};

template
struct HashDate
{
	HashDate()
		:_data()
		, _s(EMPTY)
	{}

	HashDate(const T& x)
		:_data(x)
		, _s(EXIST)
	{}

	T _data;
	State _s;
};


template
class HashTable
{
public:
	bool Insert(const T& x)
	{
		//如果哈希表的capacity为0（即vector的size为0），或者是负载因子（负载因子=哈希表的size/哈希表的capacity）达到了0.7，则需要扩容
		if (_v.size() == 0 || (double)_size / (double)_v.size() == 0.7)//因为_size和_v.size()都是size_t类型，如果不强转则相除后的结果为0，所以要强转一下产生double类型的临时变量后再相除
		{
			size_t newSize = (_v.size() == 0 ? 10 : 2 * _v.size());
			HashTabletemp;
			temp._v.resize(newSize);
			//扩容完毕后将原vector中的数据全部重新映射到新的vector中
			for (int i = 0; i < _v.size(); i++)
			{
				if (_v[i]._s == EXIST)
				{
					temp.Insert(_v[i]._data);//这边递归复用了HashTable的Insert函数，这里最多只会递归一次，因为在进入递归函数前我们把_v的size变成了10或者原来的2倍，进不了最外面的if分支，所以也就走不到这里的if分支来
				}
			}
			//映射完毕后，交换新旧哈希表中的vector成员，这样一来旧哈希表就窃取了新哈希表的资源，就完成了扩容
			swap(_v, temp._v);
		}

		//在文中的图示中，我们计算HashAddr的值都是让数据去模哈希表的capacity，那这里的代码计算HashAddr的值时为什么是%size而不是%capacity呢？
		//因为哈希表的底层容器是vector，而对于vector来说，就算你capacity是100，但如果size是0，那在前100个数据里，我们无法通过operator【】访问任意一个，会断言报错，
		//所以这里我想说的是：vector的size就是哈希表的capacity，所以本质上这里计算HashAddr的值依然是让数据去模哈希表的capacity，只不过vector的size就是哈希表的capacity
		//问题：如何通过代码体现出【vector的size就是哈希表的capacity】这一点呢？答案：给哈希表扩容时，也就是让哈希表的capacity变大时，要通过vector的resize函数给vector的size变大，vector的size变大后，哈希表的capacity也就变大了
		int hashaddr = x % _v.size();//不管x是正的还是负的，都不会出错，因为_v.size()的返回值是size_t类型，这里会整形提升
		if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
		{
			_v[hashaddr]._data = x;
			_v[hashaddr]._s = EXIST;
			_size++;
			return true;
		}
		else//走到这里说明发生了哈希冲突，开始线性探测
		{
			//文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以temp就可以被注释掉了
			//int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经插入了数据时再去插入新数据，此时就会出现死循环。


			hashaddr++;
			//temp被注释掉后，自然就不能作为循环条件了,因为文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以下面不可能死循环，一定会在中途return true，所以循环条件就写while（1）即可
			//while (hashaddr != temp)
			while (1)
			{
				//这里模%的意义是：有可能hashaddr的值在数组的靠后位置，后面的位置都满了，但数组的前几个位置是空的，所以如果超出数组范围了，我们应该重新从数组的首部开始找空位置
				if (hashaddr == _v.size())
				{
					hashaddr %= _v.size();
				}

				if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
				{
					_v[hashaddr]._data = x;
					_v[hashaddr]._s = EXIST;
					_size++;
					return true;
				}
				else
				{
					hashaddr++;
				}
			}
		}
	}

	
private:
	vector> _v;
	size_t _size;
};

说一下，插入或者删除的元素如果是负数，上面的代码依然是正确的，因为咱们计算哈希地址HashAddr的哈希函数是【int hashaddr = x % _v.size()】，虽然x和hashaddr都是int类型，但v.size()的返回值类型是size_t，所以这里x%_v.size()后会整形提升，比如说，如果相模之后的结果为-1，则结果整形提升成size_t类型后，结果会变成1，所以不必担心插入或者删除负数时会出错。

上面Insert的代码已经基本上算是把所有需要的逻辑都编写完毕了，只剩下最后的一个问题，因为咱们计算哈希地址HashAddr的哈希函数是【int hashaddr = x % _v.size()】，所以如果要插入的元素x不是int类型，而是string类型，那么x%_v.size()就会出错，因为string类没有operator%这个成员函数，而且我们没法对库中的string的源代码进行修改，没法给string类增加operator%成员函数，所以就还剩下该问题需要解决。

咱们看看库中是如何解决这个问题的，如下图红框处，库中是为unordered_map提供了一个类模板参数Hash，Hash是一种可调用对象的类型（就等价于Compare，只不过用途不同），比如可以是仿函数的类型，函数指针的类型，函数的类型，下图红框处的缺省参数hash正是一种仿函数类。Hash这个模板参数的用途是：每当Key的类型是一种无法被%的类型时，就需要通过Hash类的可调用对象将Key转化成一种能被%的类型。

所以我们也要为咱们模拟实现的HashTable类模板增加一个模板参数Hash，然后为Hash这个可调用对象的类型编写可调用的类，比如仿函数类。加完仿函数后，还需要在所有通过哈希函数【int hashaddr = x % _v.size()】计算哈希地址的地方，把哈希函数修改成【int hashaddr = hf(x) % _v.size()】，hf就是仿函数类的对象。说一下仿函数类的编写思路：

情况1：如果x的类型T是指针类型，或者是char类型，int类型，double类型，float类型等等能直接强转成size_t类型的类型，则通过operator()函数直接将T类型的x强转成size_t类型并return这个强转生成的size_t类型的临时对象即可；

情况2：如果是x的类型T是string类型，则可以通过类模板的特化，重新设计operator()函数，思路为设置一个size_t val=0，让val分别与string中的每一个char都相加，并且每在相加之前都把val*=131。所有的char都被相加过后，最后return size_t类型的val即可。这样的字符串哈希方法被命名为BKDR方法，是通过两位大佬的名字命名的。

所以综上所述，不管是情况1还是情况2，通过hf(x)，或者说通过operator()函数就能让无法被%的x转化成一种能被%的size_t类型。

问题1：为什么在上面的情况2中val每在和char相加前都要把val*=131呢？

答案1：这是发明C语言的大佬们设计出的一种字符串哈希算法，名叫BKDR字符串哈希算法，可以更加有效的避免哈希冲突，为什么更有效呢？举个例子，如果val每在和char相加前都不把val*=131，而是直接和char相加，如下图1所示，则会导致通过仿函数计算不同的字符串时所得到的size_t类型的数据相同的可能性变大，进而导致不同的字符串对象通过哈希函数【int hashaddr = hf(x) % _v.size()】计算出的哈希地址相同的可能性变大，导致产生哈希冲突的可能性变大；而如果val每在和char相加前都把val*=131，则通过不同的字符串所计算出的size_t类型的数据相等的可能性就会变小，如下图2，也就不会出现后序的问题了。至于为什么是131，笔者也没有深入了解，估计是结合数学上的一些理论并且经过多次的测试所得到的结果。

问题2：为什么情况2中size_t类型的val可以和char类型的数据相加呢？

答案2：当size_t类型与char类型相加时，C++会进行隐式类型转换。根据C++的整数提升规则，较小的整数类型（如char）会被提升为较大的整数类型（如size_t），以便进行运算。因此，当size_t类型与char类型相加时，char类型会被提升为size_t类型，结果也将是size_t类型。这是因为C++倾向于保持较大的类型，以确保不会发生数据丢失或截断。需要注意的是，由于size_t是无符号整数类型，与有符号整数类型（如char）相加时，可能会导致一些意外的结果。因此，在进行这样的操作时，应该谨慎处理，并确保理解类型转换的规则和可能的影响。

哈希表的Insert的整体代码（通过闭散列的线性探测方法实现）

结合上面的思路，最终阶段的Insert的代码如下。

#pragma once
#include
#include
using namespace std;


enum State
{
	EXIST,
	DELETE,
	EMPTY
};

template
struct HashDate
{
	HashDate()
		:_data()
		, _s(EMPTY)
	{}

	HashDate(const T& x)
		:_data(x)
		, _s(EXIST)
	{}

	T _data;
	State _s;
};


template
struct hashfunc
{
	size_t operator()(const T& x)
	{
		return (size_t)x;//如果T是指针类型，或者是char类型，int类型，double类型，float类型等能直接强转成size_t类型的类型，则通过该函数直接转即可
	}
};

template<>
struct hashfunc
{
	//BKDR字符串哈希方法
	size_t operator()(const string& s)
	{
		size_t val = 0;
		for (string::const_iterator it=s.begin();it!=s.end();it++)
		{
			val *= 131;          
			val+=(*it);
		}
		return val;
	}
};


template>
class HashTable
{
public:
	bool Insert(const T& x)
	{
		//如果哈希表的capacity为0（即vector的size为0），或者是负载因子（负载因子=哈希表的size/哈希表的capacity）达到了0.7，则需要扩容
		if (_v.size() == 0 || (double)_size / (double)_v.size() == 0.7)//因为_size和_v.size()都是size_t类型，如果不强转则相除后的结果为0，所以要强转一下产生double类型的临时变量后再相除
		{
			size_t newSize = (_v.size() == 0 ? 10 : 2 * _v.size());
			HashTabletemp;
			temp._v.resize(newSize);
			//扩容完毕后将原vector中的数据全部重新映射到新的vector中
			for (int i = 0; i < _v.size(); i++)
			{
				if (_v[i]._s == EXIST)
				{
					temp.Insert(_v[i]._data);//这边递归复用了HashTable的Insert函数，这里最多只会递归一次，因为在进入递归函数前我们把_v的size变成了10或者原来的2倍，进不了最外面的if分支，所以也就走不到这里的if分支来
				}
			}
			//映射完毕后，交换新旧哈希表中的vector成员，这样一来旧哈希表就窃取了新哈希表的资源，就完成了扩容
			swap(_v, temp._v);
		}
		hashfunc hf;

		//在文中的图示中，我们计算HashAddr的值都是让数据去模哈希表的capacity，那这里的代码计算HashAddr的值时为什么是%size而不是%capacity呢？
		//因为哈希表的底层容器是vector，而对于vector来说，就算你capacity是100，但如果size是0，那在前100个数据里，我们无法通过operator【】访问任意一个，会断言报错，
		//所以这里我想说的是：vector的size就是哈希表的capacity，所以本质上这里计算HashAddr的值依然是让数据去模哈希表的capacity，只不过vector的size就是哈希表的capacity
		//问题：如何通过代码体现出【vector的size就是哈希表的capacity】这一点呢？答案：给哈希表扩容时，也就是让哈希表的capacity变大时，要通过vector的resize函数给vector的size变大，vector的size变大后，哈希表的capacity也就变大了
		int hashaddr = hf(x) % _v.size();//不管x是正的还是负的，都不会出错，因为_v.size()的返回值是size_t类型，这里会整形提升
		if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
		{
			_v[hashaddr]._data = x;
			_v[hashaddr]._s = EXIST;
			_size++;
			return true;
		}
		else//走到这里说明发生了哈希冲突，开始线性探测
		{
			//文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以temp就可以被注释掉了
			//int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经插入了数据时再去插入新数据，此时就会出现死循环。


			hashaddr++;
			//temp被注释掉后，自然就不能作为循环条件了,因为文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以下面不可能死循环，一定会在中途return true，所以循环条件就写while（1）即可
			//while (hashaddr != temp)
			while (1)
			{
				//这里模%的意义是：有可能hashaddr的值在数组的靠后位置，后面的位置都满了，但数组的前几个位置是空的，所以如果超出数组范围了，我们应该重新从数组的首部开始找空位置
				if (hashaddr == _v.size())
				{
					hashaddr %= _v.size();
				}

				if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
				{
					_v[hashaddr]._data = x;
					_v[hashaddr]._s = EXIST;
					_size++;
					return true;
				}
				else
				{
					hashaddr++;
				}
			}
		}
	}

	
private:
	vector> _v;
	size_t _size;
};

————分割线————

注意结合闭散列的线性探测的思想处理哈希冲突时，在删除元素时有一些注意事项，比如删除哈希表中已有的元素后，我们不能把该位置上的状态设置成空（即无效），而需要把该位置上的状态设置成已被删除。有人说：【你逗我玩呢？这不是一个意思吗？】

注意这里还真不是一个意思，因为结合闭散列的线性探测的思想，在插入某元素时如果发生了哈希冲突，该元素会挨个向后找空位置并完成插入，这就意味着在删除某元素A时，根据元素A的值算出哈希地址A后，如果哈希地址A的状态是空（无效），那我们就不知道要删除的元素A曾经是否在哈希表中存在过，也就不知道此时应不应该继续从哈希位置A开始挨个向后找目标元素A，如果说每次遇到这样的情况时都找吧，又显得太笨了，这样哈希表不就和顺序表的效率一样了，干嘛不直接用顺序表呢；如果说不找吧，要删除的目标元素A可能在哈希地址A的后若干个位置（因为曾经在插入目标元素A时可能发生了哈希冲突，导致目标元素A在哈希地址A的后面若干个位置），此时不找就完成不了删除任务。

总而言之，就很难办，所以就有人想出了一种方法，就是在删除某元素后，把该元素所在的位置的状态设置成已删除，这样一来，如果有哈希地址上的状态是空（无效），说明从未有节点插入到这个位置上过，那在删除某元素A时，根据元素A的值算出哈希地址A后，如果哈希地址A的状态是空（无效），则一定代表了要删除的目标元素A在哈希表中从未存在过，此时一定就不需要从哈希地址A开始挨个向后找了。只有在删除某元素A时，根据元素A的值算出哈希地址A后，哈希地址A的状态是已删除，此时才有可能因为曾经在插入目标元素A时发生了哈希冲突，导致目标元素A在哈希地址A的后面若干个位置，才有从哈希位置A开始挨个向后找目标元素A的必要。因此，删除哈希表中已有的元素后，我们不能把该位置上的状态设置成空（即无效），而需要把该位置上的状态设置成已被删除。

结合上面理论，Find的思路为：先根据哈希函数计算出哈希地址HashAddr，如果下标为HashAddr的位置上的元素的状态为EXIST，并且元素的值也和需要查找的元素相等，则直接返回该元素的地址；如果下标为HashAddr的位置上的元素的状态为DELETE或者是【元素状态为EXIST，但元素的值不等于需要查找的元素】，则此时需要继续向后探测，因为说不定曾经在插入目标元素时发生了哈希冲突，导致目标元素在哈希地址HashAddr的后面若干个位置；如果下标为HashAddr的位置上的元素的状态为EMPTY，则此时一定不用向后继续探测，哈希表中一定不存在正在查找的元素。

然后删除的思路就简单了，如果找到了目标元素x，就删除，注意删除是不需要释放空间或者修改元素的值的，只需要把元素的状态设置成DELETE（即已删除）即可；反之如果没找到，则退出Erase函数即可。

结合上面的理论，可以先后编写出Find和Erase的第一阶段的代码，如下。（注意下面代码未编写完毕）

#pragma once
#include
#include
using namespace std;


enum State
{
	EXIST,
	DELETE,
	EMPTY
};

template
struct HashDate
{
	HashDate()
		:_data()
		, _s(EMPTY)
	{}

	HashDate(const T& x)
		:_data(x)
		, _s(EXIST)
	{}

	T _data;
	State _s;
};


template
class HashTable
{
public:

	HashDate* Find(const T& x)
	{
		if (_v.size() == 0)
			return nullptr;

		int hashaddr = x % _v.size();//不管x是正的还是负的，都不会出错，因为_v.size()的返回值是size_t类型，这里会整形提升
		if (_v[hashaddr]._s == EXIST && _v[hashaddr]._data == x)
		{
			return &_v[hashaddr];
		}
		else if (_v[hashaddr]._s == DELETE || (_v[hashaddr]._s == EXIST && _v[hashaddr]._data != x))
		{
			int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经找过了，此时就不应该继续找了
			hashaddr++;
			while (hashaddr != temp)
			{
				//这里模%的意义是：因为在插入某个值时，线性探测有向后继续找空位置的特性，所以元素x有可能在下标为hashaddr的元素的前面，所以这里%运算后可以从vector的首元素开始找x
				if (hashaddr == _v.size())
				{
					hashaddr %= _v.size();
				}

				if (_v[hashaddr]._s == EXIST && _v[hashaddr]._data == x)
				{
					return &_v[hashaddr];
				}
				else
				{
					hashaddr++;
				}
			}
			//走到这里就出了while循环，说明把vector中的所有位置都找过了，但没找到，所以直接return nullptr即可
			return nullptr;
		}
		else//(_v[hashaddr]._s == EMPTY),文中说过，这种情况下没有必要继续往后探测了，所以直接return nullptr即可
		{
			return nullptr;
		}
	}

	bool Erase(const T& x)
	{
		if (_v.size() == 0)
		{
			cout << "哈希表已为空，无法删除" << endl;
			return false;
		}
		HashDate* p = Find(x);
		if (p == nullptr)
		{
			cout << "哈希表中不存在" << x << "，无法删除。" << endl;
			return false;
		}
		else
		{
			p->_s = DELETE;
			--_size;
			return true;
		}
	}
	
private:
	vector> _v;
	size_t _size;
};

上面Find和Erase的代码已经基本上算是把所有需要的逻辑都编写完毕了，只剩下最后的一个问题，在上面讲解Insert时我们说过，因为咱们计算哈希地址HashAddr的哈希函数是【int hashaddr = x % _v.size()】，所以如果要插入的元素x不是int类型，而是string类型，那么x%_v.size()就会出错，在Find函数和Erase函数中，我们也需要解决这个问题，如何解决已经在Insert的部分全部讲过了，这里不再说明，直接上代码。

哈希表的Find和Erase的整体代码（通过闭散列的线性探测方法实现）

结合上面的思路，最终阶段的Find和Erase的代码如下。

#pragma once
#include
#include
using namespace std;


enum State
{
	EXIST,
	DELETE,
	EMPTY
};

template
struct HashDate
{
	HashDate()
		:_data()
		, _s(EMPTY)
	{}

	HashDate(const T& x)
		:_data(x)
		, _s(EXIST)
	{}

	T _data;
	State _s;
};


template
struct hashfunc
{	
	size_t operator()(const T& x)
	{
		return (size_t)x;//如果T是指针类型，或者是char类型，int类型，double类型，float类型等能直接强转成size_t类型的类型，则通过该函数直接转即可
	}
};



template<>
struct hashfunc
{
    //BKDR字符串哈希方法
	size_t operator()(const string& s)
	{
		size_t val = 0;
		for (string::const_iterator it=s.begin();it!=s.end();it++)
		{
			val *= 131;
			val+=(*it);
		}
		return val;
	}
};


template>
class HashTable
{
public:

	HashDate* Find(const T& x)
	{
		if (_v.size() == 0)
			return nullptr;

		hashfunc hf;
		int hashaddr = hf(x) % _v.size();//不管x是正的还是负的，都不会出错，因为_v.size()的返回值是size_t类型，这里会整形提升
		if (_v[hashaddr]._s == EXIST && _v[hashaddr]._data == x)
		{
			return &_v[hashaddr];
		}
		else if (_v[hashaddr]._s == DELETE || (_v[hashaddr]._s == EXIST && _v[hashaddr]._data != x))
		{
			int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经找过了，此时就不应该继续找了
			hashaddr++;
			while (hashaddr != temp)
			{
				//这里模%的意义是：因为在插入某个值时，线性探测有向后继续找空位置的特性，所以元素x有可能在下标为hashaddr的元素的前面，所以这里%运算后可以从vector的首元素开始找x
				if (hashaddr == _v.size())
				{
					hashaddr %= _v.size();
				}

				if (_v[hashaddr]._s == EXIST && _v[hashaddr]._data == x)
				{
					return &_v[hashaddr];
				}
				else
				{
					hashaddr++;
				}
			}
			//走到这里就出了while循环，说明把vector中的所有位置都找过了，但没找到，所以直接return nullptr即可
			return nullptr;
		}
		else//(_v[hashaddr]._s == EMPTY),文中说过，这种情况下没有必要继续往后探测了，所以直接return nullptr即可
		{
			return nullptr;
		}
	}

	bool Erase(const T& x)
	{
		if (_v.size() == 0)
		{
			cout << "哈希表已为空，无法删除" << endl;
			return false;
		}
		HashDate* p = Find(x);
		if (p == nullptr)
		{
			cout << "哈希表中不存在" << x << "，无法删除。" << endl;
			return false;
		}
		else
		{
			p->_s = DELETE;
			--_size;
			return true;
		}
	}

private:
	vector> _v;
	size_t _size;
};

闭散列的线性探测版本下的哈希表的整体代码

文件Hash.h的代码如下。

#pragma once
#include
#include
using namespace std;


enum State
{
	EXIST,
	DELETE,
	EMPTY
};

template
struct HashDate
{
	HashDate()
		:_data()
		, _s(EMPTY)
	{}

	HashDate(const T& x)
		:_data(x)
		, _s(EXIST)
	{}

	T _data;
	State _s;
};


template
struct hashfunc
{
	size_t operator()(const T& x)
	{
		return (size_t)x;//如果T是指针类型，或者是char类型，int类型，double类型，float类型等能直接强转成size_t类型的类型，则通过该函数直接转即可
	}
};

template<>
struct hashfunc
{
	//BKDR字符串哈希方法
	size_t operator()(const string& s)
	{
		size_t val = 0;
		for (string::const_iterator it = s.begin(); it != s.end(); it++)
		{
			val *= 131;
			val += (*it);
		}
		return val;
	}
};


template>
class HashTable
{
public:
	//线性探测版本的Insert
	bool Insert(const T& x)
	{
		//如果哈希表的capacity为0（即vector的size为0），或者是负载因子（负载因子=哈希表的size/哈希表的capacity）达到了0.7，则需要扩容
		if (_v.size() == 0 || (double)_size / (double)_v.size() == 0.7)//因为_size和_v.size()都是size_t类型，如果不强转则相除后的结果为0，所以要强转一下产生double类型的临时变量后再相除
		{
			size_t newSize = (_v.size() == 0 ? 10 : 2 * _v.size());
			HashTabletemp;
			temp._v.resize(newSize);
			//扩容完毕后将原vector中的数据全部重新映射到新的vector中
			for (int i = 0; i < _v.size(); i++)
			{
				if (_v[i]._s == EXIST)
				{
					temp.Insert(_v[i]._data);//这边递归复用了HashTable的Insert函数，这里最多只会递归一次，因为在进入递归函数前我们把_v的size变成了10或者原来的2倍，进不了最外面的if分支，所以也就走不到这里的if分支来
				}
			}
			//映射完毕后，交换新旧哈希表中的vector成员，这样一来旧哈希表就窃取了新哈希表的资源，就完成了扩容
			swap(_v, temp._v);
		}
		hashfunc hf;

		//在文中的图示中，我们计算HashAddr的值都是让数据去模哈希表的capacity，那这里的代码计算HashAddr的值时为什么是%size而不是%capacity呢？
		//因为哈希表的底层容器是vector，而对于vector来说，就算你capacity是100，但如果size是0，那在前100个数据里，我们无法通过operator【】访问任意一个，会断言报错，
		//所以这里我想说的是：vector的size就是哈希表的capacity，所以本质上这里计算HashAddr的值依然是让数据去模哈希表的capacity，只不过vector的size就是哈希表的capacity
		//问题：如何通过代码体现出【vector的size就是哈希表的capacity】这一点呢？答案：给哈希表扩容时，也就是让哈希表的capacity变大时，要通过vector的resize函数给vector的size变大，vector的size变大后，哈希表的capacity也就变大了
		int hashaddr = hf(x) % _v.size();//不管x是正的还是负的，都不会出错，因为_v.size()的返回值是size_t类型，这里会整形提升
		if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
		{
			_v[hashaddr]._data = x;
			_v[hashaddr]._s = EXIST;
			_size++;
			return true;
		}
		else//走到这里说明发生了哈希冲突，开始线性探测
		{
			//文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以temp就可以被注释掉了
			//int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经插入了数据时再去插入新数据，此时就会出现死循环。


			hashaddr++;
			//temp被注释掉后，自然就不能作为循环条件了,因为文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以下面不可能死循环，一定会在中途return true，所以循环条件就写while（1）即可
			//while (hashaddr != temp)
			while (1)
			{
				//这里模%的意义是：有可能hashaddr的值在数组的靠后位置，后面的位置都满了，但数组的前几个位置是空的，所以如果超出数组范围了，我们应该重新从数组的首部开始找空位置
				if (hashaddr == _v.size())
				{
					hashaddr %= _v.size();
				}

				if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
				{
					_v[hashaddr]._data = x;
					_v[hashaddr]._s = EXIST;
					_size++;
					return true;
				}
				else
				{
					hashaddr++;
				}
			}
		}
	}

	HashDate* Find(const T& x)
	{
		if (_v.size() == 0)
			return nullptr;

		hashfunc hf;
		int hashaddr = hf(x) % _v.size();//不管x是正的还是负的，都不会出错，因为_v.size()的返回值是size_t类型，这里会整形提升
		if (_v[hashaddr]._s == EXIST && _v[hashaddr]._data == x)
		{
			return &_v[hashaddr];
		}
		else if (_v[hashaddr]._s == DELETE || (_v[hashaddr]._s == EXIST && _v[hashaddr]._data != x))
		{
			int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经找过了，此时就不应该继续找了
			hashaddr++;
			while (hashaddr != temp)
			{
				//这里模%的意义是：因为在插入某个值时，线性探测有向后继续找空位置的特性，所以元素x有可能在下标为hashaddr的元素的前面，所以这里%运算后可以从vector的首元素开始找x
				if (hashaddr == _v.size())
				{
					hashaddr %= _v.size();
				}

				if (_v[hashaddr]._s == EXIST && _v[hashaddr]._data == x)
				{
					return &_v[hashaddr];
				}
				else
				{
					hashaddr++;
				}
			}
			//走到这里就出了while循环，说明把vector中的所有位置都找过了，但没找到，所以直接return nullptr即可
			return nullptr;
		}
		else//(_v[hashaddr]._s == EMPTY),文中说过，这种情况下没有必要继续往后探测了，所以直接return nullptr即可
		{
			return nullptr;
		}
	}

	bool Erase(const T& x)
	{
		if (_v.size() == 0)
		{
			cout << "哈希表已为空，无法删除" << endl;
			return false;
		}
		HashDate* p = Find(x);
		if (p == nullptr)
		{
			cout << "哈希表中不存在" << x << "，无法删除。" << endl;
			return false;
		}
		else
		{
			p->_s = DELETE;
			--_size;
			return true;
		}
	}

	void print()
	{
		cout << "为：";
		for (HashDate& e : _v)
		{
			if (e._s == EXIST)
				cout << e._data << ' ';
		}
		cout << endl;
	}

private:
	vector> _v;
	size_t _size;
};

闭散列的线性探测版本下的Insert、Find、Erase的测试

测试图如下，可以看到结果是符合预期的。注意Erase内部是调用了Find函数的，Erase没有出错说明Find也没有出错，所以Find也是被检查过的。如果光看结果让您感觉有点不真实，请拷贝上面闭散列的线性探测版本下的哈希表的整体代码，然后拷贝下面的测试代码，然后去调试一下。

上图代码如下。

#include
using namespace std;
#include
#include
#include
#include
#include
#include"Hash.h"


void test3()
{
	string s[] = { "西瓜","苹果","西瓜","香蕉","西瓜" };
	HashTableht;
	for (auto& e : s)
	{
		ht.Insert(e);
	}
	ht.print();
	for (auto e : s)
	{
		ht.Erase(e);
		ht.print();
	}
}


void main()
{
	test3();
}

线性探测的优缺点

线性探测优点：实现非常简单。

线性探测缺点：（结合下图思考）一旦发生哈希冲突，并且所有的冲突还连在一起的话，就容易产生数据堆积（即数据都紧挨在一起），而一旦数据都紧挨在一起，则就更加可能导致哈希冲突，就像滚雪球一样，发生的哈希冲突越多，就越容易发生哈希冲突。而发生的哈希冲突越多，哈希表的增删查改的效率就越低。

说一下闭散列的通病就是空间利用率低，因为要求负载因子<=0.7。

如何缓解呢？这就是接下来咱们要说的二次探测所要解决的问题了。

2. 二次探测

什么是二次探测呢？

先拿线性探测举例，然后通过对比线性探测就能知道什么是二次探测了。

拿线性探测的方式举例：如下图1，插入21时根据哈希函数计算出的哈希地址为1，下标为1的地方已经插入了元素1，此时就会发生哈希冲突，按照线性探测的方式，则会向后探测一次，发现下标为2的位置是空，则21就插入到下标为2的位置；插入31时，根据哈希函数计算出的哈希地址也为1，而下标为1的地方已经插入了元素1，此时也会发生哈希冲突，则会向后探测一次，但发现下标为2的位置也被占用了，则会继续向后探测一次，终于发现下标为3的位置是空，则31插入到该位置上。综上所述，可以看出对于线性探测而言，如果在插入一个元素时以根据哈希函数计算出的哈希地址为基准地址，则发生了几次哈希冲突，下一次探测的位置就要在基准地址上加几，比如插入21时会发生1次哈希冲突，则21的位置就要在基准地址上加1；插入31时会发生2次哈希冲突，则31的位置就要在基准地址上加2。

二次探测和线性探测的唯一区别就是，如果在插入一个元素时以根据哈希函数计算出的哈希地址为基准地址，则发生了几次哈希冲突，下一次探测的位置就要在基准地址上加几的平方（结合下图思考），比如通过二次探测的方式插入21时，根据哈希函数算出的哈希地址为1，但下标为1的位置已经插入了元素1，所以发生了第1次哈希冲突，则下一次探测的位置要在基准地址1上加1的平方，算出来也就是2，然后发现下标为2的位置上是空，所以直接插入21；插入31时，根据哈希函数算出的哈希地址为1，但下标为1的位置已经插入了元素1，所以发生了第1次哈希冲突，下一次探测的位置则要在基准地址1上加1的平方，算出来也就是2，然后发现下标为2的位置上已经插入了元素21，所以发生了第2次哈希冲突，则下一次探测的位置要在基准地址1上加2的平方，算出来也就是5，然后发现下标为5的位置上是空，所以直接插入31。

图1如下。

图2如下。

哈希表的Insert的整体代码（通过闭散列的二次探测方法实现）

结合上文，可以看到二次探测相对于线性探测的区别是非常小的，所以编写通过闭散列的二次探测的方式实现的Insert、Find、Erase的代码时，也只需要在线性探测版本的Insert、Find、Erase的代码的基础上进行稍微的修改，结合上面二次探测的理论知识，代码如下。

这里笔者偷个懒，就只编写二次探测版本的Insert了，剩下的靠各位脑补。

#pragma once
#include
#include
using namespace std;


enum State
{
	EXIST,
	DELETE,
	EMPTY
};

template
struct HashDate
{
	HashDate()
		:_data()
		, _s(EMPTY)
	{}

	HashDate(const T& x)
		:_data(x)
		, _s(EXIST)
	{}

	T _data;
	State _s;
};


template
struct hashfunc
{
	size_t operator()(const T& x)
	{
		return (size_t)x;//如果T是指针类型，或者是char类型，int类型，double类型，float类型等能直接强转成size_t类型的类型，则通过该函数直接转即可
	}
};

template<>
struct hashfunc
{
	//BKDR字符串哈希方法
	size_t operator()(const string& s)
	{
		size_t val = 0;
		for (string::const_iterator it = s.begin(); it != s.end(); it++)
		{
			val *= 131;
			val += (*it);
		}
		return val;
	}
};


template>
class HashTable
{
public:

    线性探测版本的Insert
	//bool Insert(const T& x)
	//{
	//	//如果哈希表的capacity为0（即vector的size为0），或者是负载因子（负载因子=哈希表的size/哈希表的capacity）达到了0.7，则需要扩容
	//	if (_v.size() == 0 || (double)_size / (double)_v.size() == 0.7)//因为_size和_v.size()都是size_t类型，如果不强转则相除后的结果为0，所以要强转一下产生double类型的临时变量后再相除
	//	{
	//		size_t newSize = (_v.size() == 0 ? 10 : 2 * _v.size());
	//		HashTabletemp;
	//		temp._v.resize(newSize);
	//		//扩容完毕后将原vector中的数据全部重新映射到新的vector中
	//		for (int i = 0; i < _v.size(); i++)
	//		{
	//			if (_v[i]._s == EXIST)
	//			{
	//				temp.Insert(_v[i]._data);//这边递归复用了HashTable的Insert函数，这里最多只会递归一次，因为在进入递归函数前我们把_v的size变成了10或者原来的2倍，进不了最外面的if分支，所以也就走不到这里的if分支来
	//			}
	//		}
	//		//映射完毕后，交换新旧哈希表中的vector成员，这样一来旧哈希表就窃取了新哈希表的资源，就完成了扩容
	//		swap(_v, temp._v);
	//	}
	//	hashfunc hf;

	//	//在文中的图示中，我们计算HashAddr的值都是让数据去模哈希表的capacity，那这里的代码计算HashAddr的值时为什么是%size而不是%capacity呢？
	//	//因为哈希表的底层容器是vector，而对于vector来说，就算你capacity是100，但如果size是0，那在前100个数据里，我们无法通过operator【】访问任意一个，会断言报错，
	//	//所以这里我想说的是：vector的size就是哈希表的capacity，所以本质上这里计算HashAddr的值依然是让数据去模哈希表的capacity，只不过vector的size就是哈希表的capacity
	//	//问题：如何通过代码体现出【vector的size就是哈希表的capacity】这一点呢？答案：给哈希表扩容时，也就是让哈希表的capacity变大时，要通过vector的resize函数给vector的size变大，vector的size变大后，哈希表的capacity也就变大了
	//	int hashaddr = hf(x) % _v.size();//不管x是正的还是负的，都不会出错，因为_v.size()的返回值是size_t类型，这里会整形提升
	//	if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
	//	{
	//		_v[hashaddr]._data = x;
	//		_v[hashaddr]._s = EXIST;
	//		_size++;
	//		return true;
	//	}
	//	else//走到这里说明发生了哈希冲突，开始线性探测
	//	{
	//		//文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以temp就可以被注释掉了
	//		//int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经插入了数据时再去插入新数据，此时就会出现死循环。


	//		hashaddr++;
	//		//temp被注释掉后，自然就不能作为循环条件了,因为文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以下面不可能死循环，一定会在中途return true，所以循环条件就写while（1）即可
	//		//while (hashaddr != temp)
	//		while (1)
	//		{
	//			//这里模%的意义是：有可能hashaddr的值在数组的靠后位置，后面的位置都满了，但数组的前几个位置是空的，所以如果超出数组范围了，我们应该重新从数组的首部开始找空位置
	//			if (hashaddr == _v.size())
	//			{
	//				hashaddr %= _v.size();
	//			}

	//			if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
	//			{
	//				_v[hashaddr]._data = x;
	//				_v[hashaddr]._s = EXIST;
	//				_size++;
	//				return true;
	//			}
	//			else
	//			{
	//				hashaddr++;
	//			}
	//		}
	//	}
	//}


    //二次探测版本的Insert
	bool Insert(const T& x)
	{
		//如果哈希表的capacity为0（即vector的size为0），或者是负载因子（负载因子=哈希表的size/哈希表的capacity）达到了0.7，则需要扩容
		if (_v.size() == 0 || (double)_size / (double)_v.size() == 0.7)//因为_size和_v.size()都是size_t类型，如果不强转则相除后的结果为0，所以要强转一下产生double类型的临时变量后再相除
		{
			size_t newSize = (_v.size() == 0 ? 10 : 2 * _v.size());
			HashTabletemp;
			temp._v.resize(newSize);
			//扩容完毕后将原vector中的数据全部重新映射到新的vector中
			for (int i = 0; i < _v.size(); i++)
			{
				if (_v[i]._s == EXIST)
				{
					temp.Insert(_v[i]._data);//这边递归复用了HashTable的Insert函数，这里最多只会递归一次，因为在进入递归函数前我们把_v的size变成了10或者原来的2倍，进不了最外面的if分支，所以也就走不到这里的if分支来
				}
			}
			//映射完毕后，交换新旧哈希表中的vector成员，这样一来旧哈希表就窃取了新哈希表的资源，就完成了扩容
			swap(_v, temp._v);
		}
		hashfunc hf;

		//在文中的图示中，我们计算HashAddr的值都是让数据去模哈希表的capacity，那这里的代码计算HashAddr的值时为什么是%size而不是%capacity呢？
		//因为哈希表的底层容器是vector，而对于vector来说，就算你capacity是100，但如果size是0，那在前100个数据里，我们无法通过operator【】访问任意一个，会断言报错，
		//所以这里我想说的是：vector的size就是哈希表的capacity，所以本质上这里计算HashAddr的值依然是让数据去模哈希表的capacity，只不过vector的size就是哈希表的capacity
		//问题：如何通过代码体现出【vector的size就是哈希表的capacity】这一点呢？答案：给哈希表扩容时，也就是让哈希表的capacity变大时，要通过vector的resize函数给vector的size变大，vector的size变大后，哈希表的capacity也就变大了
		int hashaddr = hf(x) % _v.size();//不管x是正的还是负的，都不会出错，因为_v.size()的返回值是size_t类型，这里会整形提升

		int i = 0;//用于记录发生了几次哈希冲突，进而可以根据i和文中所说的基准地址算出下一次向后探测的位置
		int hashi = 0;//表示下一次向后探测的位置

		if (_v[hashaddr]._s == EMPTY || _v[hashaddr]._s == DELETE)
		{
			_v[hashaddr]._data = x;
			_v[hashaddr]._s = EXIST;
			_size++;
			return true;
		}
		else//走到这里说明发生了哈希冲突，开始二次探测
		{
			//文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以temp就可以被注释掉了
			//int temp = hashaddr;//temp用于防止在下面死循环，比如在哈希表中每一个位置都已经插入了数据时再去插入新数据，此时就会出现死循环。

			i++;
			hashi = hashaddr + (i * i);
			//temp被注释掉后，自然就不能作为循环条件了,因为文中说过，加入了负载因子这个概念后，哈希表中不可能被插满，所以下面不可能死循环，一定会在中途return true，所以循环条件就写while（1）即可
			//while (hashaddr != temp)
			while (1)
			{
				//这里模%的意义是：有可能hashi的值在经过 +=（i * i）后变得非常大，此时为了提高效率和防止hashi越界，直接取%后的值
				//为什么上面说能提高效率呢？举个例子，假如哈希表的capacity，也就是vector的size为10时，则从哈希表上的任意一个位置开始向后走10或者向前走10，都会回到原来的位置，
				//所以这里如果hashi的值在经过 +=（i * i）后变得非常大，我们可以直接通过%10来快速的计算出下一次需要探测的位置
				if (hashi >= _v.size())
				{
					hashi %= _v.size();
				}			

				if (_v[hashi]._s == EMPTY || _v[hashi]._s == DELETE)
				{
					_v[hashi]._data = x;
					_v[hashi]._s = EXIST;
					_size++;
					return true;
				}
				else
				{
					i++;
					hashi = hashaddr + (i * i);
				}
			}
		}
	}

private:
	vector> _v;
	size_t _size;
};

二次探测的优缺点

以上就是二次探测的全部内容，虽然二次探测在一定程度上缓解了线性探测的滚雪球问题（即上文中所说的线性探测的缺点），也就是在一定程度上降低了发生哈希冲突的可能性，但二次探测依然没有解决【发生哈希冲突后需要向后探测找空位置占据其他位置】的缺陷，为什么说它是缺陷呢？因为只要你非法占据其他人的位置，那别人就只能也非法占据其他人的位置，就有可能增加发生哈希冲突的可能性，也就是说二次探测即使比线性探测好一点，但也有很大的可能性会发生哈希冲突。

说一下闭散列的通病就是空间利用率低，因为要求负载因子<=0.7。

那有没有更加优秀的方法解决哈希冲突呢？答案是有的，这就是咱们接下来要说的开散列（也叫链地址法、开链法）。

开散列（链地址法、开链法）

开散列法又叫链地址法(开链法)，首先对各个数据用哈希函数计算哈希地址，具有相同地址的数据归于同一子集合，也就是插入到同一个链表里，每一个子集合（即链表）被称为一个桶，各个桶中的元素通过一个单链表链接起来，各链表的头结点的地址存储在哈希表中，如下图演示。至于为什么是单链表，原因1：因为双向链表的意义不大（在当前情景下设置成双向链表的意义就是能够从后向前找数据，但因为哈希桶中的数据是无序无规律的，所以从后向前找数据没有意义）。原因2：并且双向链表的节点类还多了一个指针成员，占用了更多的内存。

在开散列的方式下，如何从代码层面上判断是否发生了哈希冲突呢？

拿哈希表的插入举例：上文中说过各链表的头结点的地址存储在哈希表中，那么根据哈希函数算出的哈希地址hashAddr上如果是nullptr，则说明没有发生哈希冲突；如果不为nullptr，则发生了哈希冲突。

通过开散列的方式实现的哈希表的基础框架

因为通过开散列的方式实现的哈希表中的数据类是一个个节点，所以这里对比闭散列的方式，数据类的名字从HashDate变成了HashNode，并且数据类的成员也发生了变化，从成员State _s变成了HashNode* _next，为什么不需要表示状态的State成员了呢？因为对于EXIST和EMPTY这两种状态而言，非nullptr和nullptr就可以表示；而对于DELETE这种状态，在开散列中是不需要这种状态的，因为没有用途，为什么呢？在开散列的哈希表中，我们将哈希地址相同的元素都放到了同一个哈希桶中，并不需要经过探测寻找所谓的“下一个位置”，就是说根据哈希函数算出元素所在的哈希地址hashAddr后，如果一个元素不在下标为hashAddr的链表上，则说明该元素一定不存在。所以综上所述，在实现开散列的哈希表时，我们不用为哈希表中的每个节点设置一个State成员。

代码如下。

namespace OpenHash//表示开散列的意思
{
	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template
	class HashTable
	{
		typedef HashNode Node;
	public:


	private:
		vector_v;
		size_t _size;
	};

}

通过开散列的方式实现的哈希表的Insert

结合上面的理论部分与上图，我们能写出开散列的Insert的一个大概的框架，第一阶段的代码如下。

namespace OpenHash//表示开散列的意思
{
	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template
	class HashTable
	{
		typedef HashNode Node;
	public:
        HashTable()
			:_size(0)
			, _v()
		{}

		bool Insert(const T& x)
		{
			//不管是否发生哈希冲突，插入元素x都需要执行以下逻辑
			int hashaddr = x % _v.size();		
			Node* cur = _v[hashaddr];//cur是哈希表中下标为hashaddr位置上的链表
			Node* temp = new Node(x);//temp是需要新插入的节点
			temp->_next = cur;
			_v[hashaddr] = temp;
			_size++;									
		}

	private:
		vector_v;
		size_t _size;
	};

}

仔细观察上面代码，如果这样写，可以发现还有一个问题没有解决，那就是哈希表的扩容问题，如果哈希表的capacity为0，也就是vector的size为0，则肯定需要扩容；还有什么情况需要扩容呢？

因为桶的个数是一定的，所以随着元素（即链表节点）的不断插入是一定会发生哈希冲突的，而发生的哈希冲突越多，则某些桶中元素（即链表节点）的个数就越多，而某些桶中的元素越多，查找该桶里的元素时效率就越低，甚至在极端情况下可能所有的元素（即链表节点）都挂在了一个桶中，这就会大大降低的哈希表的性能。所以综上所述，哈希表的性能降低的根本原因是因为发生的哈希冲突太多了，而前面说过在不断向哈希表中插入元素是一定会发生哈希冲突的，因此如果想让哈希表的性能变高就得尽可能的减少发生哈希冲突的次数，而想要尽可能的减少发生哈希冲突的次数，唯一的方式就是扩容，尽可能为哈希表预留更多的空闲空间，也就是说要在负载因子比较小的时候就扩容，这样一来负载因子就会一直处于较小的状态，负载因子越小，就越不容易发生哈希冲突，闭散列就是这样做的。但注意，开散列作为闭散列的升级版，是需要弥补闭散列的短板的，上文中说过闭散列的缺点就是空间利用率太低，所以这里开散列不能尽可能地为哈希表预留更多的空闲空间，也就是说不能在负载因子比较小的时候就扩容，要尽可能的在负载因子比较大的时候再扩容，但为了提高哈希表的效率，又不能让负载因子太大，最后经过取舍，经过大量的实验，发现这样做比较好：在开散列的哈希表最理想的情况下是每个哈希桶中刚好挂一个节点，也就是说到目前为止一次哈希冲突都没有发生，但下一次插入数据时则一定会发生哈希冲突，此时已经避无可避，所以这时就扩容，即当负载因子达到1时就需要扩容（STL源码就是这么设计的）。别忘了哈希表的负载因子定义为:α =填入哈希表中的元素个数/哈希表的长度（长度就是哈希表的capacity）。

如何扩容呢？

1.若哈希表的大小为0，则将哈希表的初始大小设置为10。

2.若哈希表的负载因子已经等于1了，则先创建一个新的哈希表，该哈希表的大小为原哈希表的两倍，之后遍历原哈希表，将原哈希表中的数据拷贝到新哈希表，注意和闭散列一样，开散列这里将原数据拷贝到新哈希表的过程中也是需要重新计算哈希地址HashAddr的，最后将原哈希表与新哈希表所管理的数据交换即可。

注意在上一段中将原哈希表的数据拷贝到新哈希表的过程中，不能和闭散列的方式一样，即不能通过复用上面哈希表的插入函数将原哈希表中的数据插入到新哈希表，因为观察上面代码可以发现在这个过程中我们会new创建相同数据的结点插入到新哈希表，这样一来，在插入完毕后就需要将原哈希表中的结点进行delete释放（否则就空间泄漏），这就有点多此一举了，这是无谓的消耗。拷贝数据的正确方式为：遍历原哈希表的vector中的每个哈希桶（即每个链表），将每个哈希桶（即每个链表）中的所有节点都通过哈希函数定位出该节点需要挂到新哈希表的vector中的哪个桶的位置，然后将该节点从旧vector的桶中拆下来，并挂到（头插到）新vector上的之前算出的桶的位置即可，不用进行结点的创建与释放。注意这里头插或者尾插是无所谓的，只不过头插比较方便，因为尾插要找尾。

其实上一段中开散列之所以和闭散列的扩容方式不同、不需要像闭散列一样复用哈希表的插入函数的本质原因，或者说是不用创建节点的原因是：因为闭散列的哈希表中的数据HashDate是靠vector所new出的一片连续的空间，无法将单个HashDate的空间拆给别人；而开散列中的数据HashNode并不是vector所new出的一片连续的空间，vector所new出的一片连续的空间都是给HashNode*类型的指针对象用的，HashNode是靠HashTable所new出的非连续的一个个独立的空间（每个独立空间都是一个HashNode），既然是非连续，也就可以将这一个个HashNode的空间交给任意一个指针打理，所以HashNode就可以从原哈希表的vector的桶中拆下来，然后交给另一个vector的桶管理，不必再拷贝一份。如果还是不明白，请根据下面代码自行分析您的疑点。

结合上面的理论，我们能写出开散列的Insert的第二阶段的代码，如下。

#pragma once
#include
#include
using namespace std;

namespace OpenHash//表示开散列的意思
{
	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template
	class HashTable
	{
		typedef HashNode Node;
	public:
		HashTable()
			:_size(0)
			, _v()
		{}

		bool Insert(const T& x)
		{
			//一石二鸟，哈希表为空时走这里扩容；哈希表的负载因子达到1时也走这里扩容
			if (_size == _v.size())
			{
				int newSize = _v.size() == 0 ? 10 : 2 * (_v.size());
				vectorv1;
				v1.resize(newSize);
				//将旧空间_v的数据都移到新空间v1上
				for (int i = 0; i < _v.size(); i++)
				{
					if (_v[i] != nullptr)
					{														
						Node* cur1 = _v[i];
						while (cur1 != nullptr)
						{
							int hashaddr = cur1->_data % v1.size();//hashaddr表示新vector上的下标,注意因为发生了扩容，所以哈希函数这里是模v1的size，而不是模_v的size
							Node* cur2 = v1[hashaddr];//cur2表示新vector上第hashaddr个链表的头节点的地址
							Node* cur3 = cur1->_next;
							cur1->_next = cur2;
							v1[hashaddr] = cur1;
							cur1 = cur3;
						}
						_v[i] = nullptr;
					}
				}
				//走到这里就出了for循环，表明已经把数据都挪动完毕了，将新vector交给哈希表管理即可，出了最外层的if分支后，旧vector中的节点的内存不会被释放，释放的是旧vector中的指针所占的8字节空间
				_v.swap(v1);				
			}

			//不管是否发生哈希冲突，插入元素x都需要执行以下逻辑
			int hashaddr = x % _v.size();		
			Node* cur = _v[hashaddr];//cur是哈希表中下标为hashaddr位置上的链表
			Node* temp = new Node(x);//temp是需要新插入的节点
			temp->_next = cur;
			_v[hashaddr] = temp;
			_size++;			
			return true;
		}	

	private:
		vector_v;
		size_t _size;
	};

}

哈希表的Insert的整体代码（通过开散列的方式实现）

结合上面的理论，我们能写出开散列的Insert的最终阶段的代码，如下。注意下面包含了用于打印vector中每个哈希桶的print函数，该函数用于在下文中测试Insert的逻辑是否正确。

#pragma once
#include
#include
using namespace std;

namespace OpenHash//表示开散列的意思
{

    template
	struct hashfunc
	{
		size_t operator()(const T& x)
		{
			return (size_t)x;//如果T是指针类型，或者是char类型，int类型，double类型，float类型等能直接强转成size_t类型的类型，则通过该函数直接转即可
		}
	};

	template<>
	struct hashfunc
	{
		//BKDR字符串哈希方法
		size_t operator()(const string& s)
		{
			size_t val = 0;
			for (string::const_iterator it = s.begin(); it != s.end(); it++)
			{
				val *= 131;
				val += (*it);
			}
			return val;
		}
	};


	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template
	class HashTable
	{
		typedef HashNode Node;
	public:
		HashTable()
			:_size(0)
			, _v()
		{}

		bool Insert(const T& x)
		{
            hashfunc hf;
                
			//一石二鸟，哈希表为空时走这里扩容；哈希表的负载因子达到1时也走这里扩容
			if (_size == _v.size())
			{
				int newSize = _v.size() == 0 ? 10 : 2 * (_v.size());
				vectorv1;
				v1.resize(newSize);			
				//将旧空间_v的数据都移到新空间v1上
				for (int i = 0; i < _v.size(); i++)
				{
					if (_v[i] != nullptr)
					{														
						Node* cur1 = _v[i];
						while (cur1 != nullptr)
						{
							int hashaddr = hf(cur1->_data) % v1.size();//hashaddr表示新vector上的下标,注意因为发生了扩容，所以哈希函数这里是模v1的size，而不是模_v的size
							Node* cur2 = v1[hashaddr];//cur2表示新vector上第hashaddr个链表的头节点的地址 
							Node* cur3 = cur1->_next;
							cur1->_next = cur2;
							v1[hashaddr] = cur1;
							cur1 = cur3;
						}
						_v[i] = nullptr;
					}
				}
				//走到这里就出了for循环，表明已经把数据都挪动完毕了，将新vector交给哈希表管理即可，出了最外层的if分支后，旧vector中的节点的内存不会被释放，释放的是旧vector中的指针所占的8字节空间
				_v.swap(v1);				
			}

			//不管是否发生哈希冲突，插入元素x都需要执行以下逻辑
			int hashaddr = hf(x) % _v.size();		
			Node* cur = _v[hashaddr];//cur是哈希表中下标为hashaddr位置上的链表
			Node* temp = new Node(x);//temp是需要新插入的节点
			temp->_next = cur;
			_v[hashaddr] = temp;
			_size++;			
			return true;
		}

		void print()
		{
			for (int i=0; i < _v.size(); i++)
			{
				if (_v[i] != nullptr)
				{
					Node* cur = _v[i];
					cout << "哈希桶" << i << "为：";
					while (cur != nullptr)
					{
						cout << cur->_data << ' ';
						cur = cur->_next;
					}
					cout << endl;
				}
			}
			cout << endl;
		}

	private:
		vector_v;
		size_t _size;
	};

}

开散列版本下的Insert的测试

（下图所用的print函数在上面开散列的Insert的整体代码中，该函数用于打印vector中每个哈希桶）

如下图，代码的逻辑是每插入一个数据，都把vector中所有存在数据的桶都打印出来，共有11个待插入的数据，咱们直接看插入第10和第11个数据后所打印出的结果（也就是下图红框处的打印结果）。插入第11个数据时，此时的负载因子已经达到了1，根据上面的理论，此时就应该扩容，扩2倍，然后从原vector的1号桶开始，到原vector的10号桶结束，将挂在原vector桶中的节点全部拆下来，然后根据哈希函数算出的哈希地址再挂到新vector对应的桶中，可以看到插入第11个数据时，既完成了扩容，又完成了节点的迁移，符合预期。

上图的代码如下。

#include
using namespace std;
#include
#include
#include
#include
#include
#include"Hash.h"

void test4()
{
	OpenHash::HashTableht;
	int a[] = { 1,21,31,4,5,6,7,8,18,10,11 };
	for (auto& e : a)
	{		
		ht.Insert(e);
		ht.print();
		cout << endl << endl;
	}
}

void main()
{
	test4();
}

通过开散列的方式实现的哈希表的Erase和Find

Find的思路为：说白了就是对单链表的查找，比如根据哈希函数int hashaddr = x % _v.size()算出哈希地址后，就在vector的第hashaddr号哈希桶（即链表）上依次向后找目标元素即可，找到就返回目标元素的地址，没找到就返回nullptr。

Erase的思路为：说白了就是对单链表的Erase，比如根据哈希函数int hashaddr = x % _v.size()算出哈希地址后，就在vector的第hashaddr号哈希桶（即链表）上依次向后找目标元素和目标元素的前驱元素，如果找到了目标元素，则让前驱元素的next指针指向目标元素的后继元素，以此断开和目标元素的连接，最后delete掉目标元素。有一种特殊情况就是目标元素没有前驱元素，目标元素是vector的哈希桶（即链表）中的头节点，这种情况直接更换哈希桶的头节点，最后delete掉目标元素即可；如果没有找到目标元素，直接return false。

根据上面的思路，Erase和Find的第一阶段的代码如下。

namespace OpenHash//表示开散列的意思
{
	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template
	class HashTable
	{
		typedef HashNode Node;
	public:
		HashTable()
			:_size(0)
			, _v()
		{}	

		Node* Find(const T& x)
		{
			//防止计算哈希地址时，int hashaddr = x % _v.size()的时候去模0
			if (_v.size() == 0)
				return nullptr;

			int hashaddr = x % _v.size();
			Node* cur = _v[hashaddr];
			while (cur != nullptr)
			{
				if (cur->_data == x)
				{
					return cur;
				}
				cur = cur->_next;
			}
			return nullptr;
		}

		bool Erase(const T& x)
		{
			//防止计算哈希地址时，int hashaddr = x % _v.size()的时候去模0
			if (_v.size() == 0)
				return false;

			int hashaddr = x % _v.size();
			Node* cur1 = nullptr;
			Node* cur2 = _v[hashaddr];
			while (cur2 != nullptr)
			{
				if (cur2->_data == x)
				{
					if (cur1 != nullptr)
					{
						cur1->_next = cur2->_next;
						delete cur2;
						_size--;
						return true;
					}
					else
					{
						_v[hashaddr] = cur2->_next;
						delete cur2;
						_size--;
						return true;
					}
				}
				else
				{
					cur1 = cur2;
					cur2 = cur2->_next;
				}				
			}
			//走到这里就出了循环，说明vector中的hashaddr号哈希桶上不存在目标元素,那哈希表中也就不存在目标元素，直接return false
			return false;
		}		

	private:
		vector_v;
		size_t _size;
	};

}

上面Find和Erase的代码已经基本上算是把所有需要的逻辑都编写完毕了，只剩下最后的一个问题，在上面讲解Insert时我们说过，因为咱们计算哈希地址HashAddr的哈希函数是【int hashaddr = x % _v.size()】，所以如果要插入的元素x不是int类型，而是string类型，那么x%_v.size()就会出错，在Find函数和Erase函数中，我们也需要解决这个问题，如何解决已经在闭散列的部分全部讲过了，这里不再说明，直接上代码。

哈希表的Erase和Find的整体代码（通过开散列的方式实现）

结合上面的理论，我们能写出开散列的Erase和Find的最终阶段的代码，如下。注意下面包含了用于打印vector中每个哈希桶的print函数，该函数用于在下文中测试Erase和Find的逻辑是否正确。

namespace OpenHash//表示开散列的意思
{

    template
	struct hashfunc
	{
		size_t operator()(const T& x)
		{
			return (size_t)x;//如果T是指针类型，或者是char类型，int类型，double类型，float类型等能直接强转成size_t类型的类型，则通过该函数直接转即可
		}
	};

	template<>
	struct hashfunc
	{
		//BKDR字符串哈希方法
		size_t operator()(const string& s)
		{
			size_t val = 0;
			for (string::const_iterator it = s.begin(); it != s.end(); it++)
			{
				val *= 131;
				val += (*it);
			}
			return val;
		}
	};

	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template
	class HashTable
	{
		typedef HashNode Node;
	public:
		HashTable()
			:_size(0)
			, _v()
		{}	

		Node* Find(const T& x)
		{
			hashfunc hf;

			//防止计算哈希地址时，int hashaddr = hf(x) % _v.size()的时候去模0
			if (_v.size() == 0)
				return nullptr;

			int hashaddr = hf(x) % _v.size();
			Node* cur = _v[hashaddr];
			while (cur != nullptr)
			{
				if (cur->_data == x)
				{
					return cur;
				}
				cur = cur->_next;
			}
			return nullptr;
		}

		bool Erase(const T& x)
		{
			hashfunc hf;

			//防止计算哈希地址时，int hashaddr = hf(x) % _v.size()的时候去模0
			if (_v.size() == 0)
				return false;

			int hashaddr = hf(x) % _v.size();
			Node* cur1 = nullptr;
			Node* cur2 = _v[hashaddr];
			while (cur2 != nullptr)
			{
				if (cur2->_data == x)
				{
					if (cur1 != nullptr)
					{
						cur1->_next = cur2->_next;
						delete cur2;
						_size--;
						return true;
					}
					else
					{
						_v[hashaddr] = cur2->_next;
						delete cur2;
						_size--;
						return true;
					}
				}
				else
				{
					cur1 = cur2;
					cur2 = cur2->_next;
				}				
			}
			//走到这里就出了循环，说明vector中的hashaddr号哈希桶上不存在目标元素,那哈希表中也就不存在目标元素，直接return false
			return false;
		}

		void print()
		{
			for (int i=0; i < _v.size(); i++)
			{
				if (_v[i] != nullptr)
				{
					Node* cur = _v[i];
					cout << "哈希桶" << i << "为：";
					while (cur != nullptr)
					{
						cout << cur->_data << ' ';
						cur = cur->_next;
					}
					cout << endl;
				}
			}
			cout << endl;
		}

	private:
		vector_v;
		size_t _size;
	};

}

开散列版本下的Erase和Find的测试

（下图所用的print函数在上面开散列的Erase和Find的整体代码中，该函数用于打印vector中每个哈希桶）

可以发现下图是符合我们的预期的。

上图的代码如下。

#include
using namespace std;
#include
#include
#include
#include
#include
#include"Hash.h"

void test5()
{
	OpenHash::HashTableht;
	int a[] = { 1,21,31,4,5,6,7,8,18,10,11,41 };
	for (auto& e : a)
	{
		ht.Insert(e);
	}
	ht.print();
	cout << endl << endl;

	ht.Erase(1);
	ht.Erase(21);
	ht.Erase(41);
	ht.print();

	OpenHash::HashNode* p1 = ht.Find(1);
	OpenHash::HashNode* p2 = ht.Find(41);
	OpenHash::HashNode* p3 = ht.Find(18);
	cout << p1 << endl << p2 << endl << p3 << endl;

}

void main()
{
	test5();
}

通过开散列的方式实现的哈希表的析构函数

HashNode是HashTable所new出来的，所以理应由HashTable去释放，所以需要编写HashTable的析构函数。析构函数是在类的任意一个成员被销毁前自动被调用的特殊成员函数。

namespace OpenHash//表示开散列的意思
{
	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template
	class HashTable
	{
		typedef HashNode Node;
	public:
		HashTable()
			:_size(0)
			, _v()
		{}

		//HashNode是HashTable所new出来的，所以理应由HashTable去释放, 析构函数是在类的成员被销毁前调用的特殊成员函数
		~HashTable()
		{
			for (int i = 0; i < _v.size(); i++)
			{
				Node* cur = _v[i];
				while (cur != nullptr)
				{
					Node* next = cur->_next;
					delete cur;
					cur = next;
				}
			}
		}
		
	private:
		vector_v;
		size_t _size;
	};

}

通过开散列的方式实现的哈希表的拷贝构造

哈希表的拷贝构造也是深拷贝，思路很简单：HashTable有两个成员，vector>* _v和size_t _size，对于自定义类型vector，哈希表的拷贝构造会自动在初始化列表中调用vector的拷贝构造完成深拷贝，所以在哈希表的拷贝构造的函数体中我们只需要负责实现对HashNode的深拷贝即可。在有HashTable ht2（ht1）时，我们遍历ht1的vector中的每个哈希桶中的每个元素(即HashNode)，在遍历的过程中就顺便new出这些HashNode节点，然后把这些节点挂到ht2中的vector上对应的哈希桶中即可，代码如下。

注意下面包含了用于打印vector中每个哈希桶的print函数，该函数用于在下文中测试拷贝构造的逻辑是否正确。

namespace OpenHash//表示开散列的意思
{
	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template
	class HashTable
	{
		typedef HashNode Node;
	public:
		HashTable()
			:_size(0)
			, _v()
		{}

        //拷贝构造
		HashTable(const HashTable& ht)
			:_v(ht._v)
			,_size(ht._size)
		{
			for (int i = 0; i < ht._v.size(); i++)
			{
				if (ht._v[i] != nullptr)
				{
					_v[i] = new Node((ht._v[i])->_data);
					Node* cur1 = _v[i];//cur1指针用于操作正在构造的哈希桶中的HashNode
					Node* cur2 = ht._v[i];//cur2指针用于操作被拷贝的哈希桶中的HashNode
					
					cur2 = cur2->_next;
					while (cur2 != nullptr)
					{
						cur1->_next = new Node(cur2->_data);
						cur1 = cur1->_next;
						cur2 = cur2->_next;
					}
				}			
			}
		}

        void print()
		{
			for (int i=0; i < _v.size(); i++)
			{
				if (_v[i] != nullptr)
				{
					Node* cur = _v[i];
					cout << "哈希桶" << i << "为：";
					while (cur != nullptr)
					{
						cout << cur->_data << ' ';
						cur = cur->_next;
					}
					cout << endl;
				}
			}
			cout << endl;
		}

	private:
		vector_v;
		size_t _size;
	};

}

开散列的哈希表的拷贝构造的测试

（下图所用的print函数在上面开散列的拷贝构造的整体代码中，该函数用于打印vector中每个哈希桶）

可以看到通过ht1拷贝构造ht2后，我们删除哈希表ht2中的数据（即HashNode节点）是不会影响哈希表ht1中的数据的，这说明咱们编写的拷贝构造的确是深拷贝，逻辑是正确的。

上图的代码如下。

#include
using namespace std;
#include
#include
#include
#include
#include
#include"Hash.h"

void test6()
{
	OpenHash::HashTableht1;
	int a[] = { 1,21,31,4,5,6,7,8,18,10,11,41 };
	for (auto& e : a)
	{
		ht1.Insert(e);
	}
	cout << "ht1为：" << endl;
	ht1.print();
	cout << endl << endl;


	OpenHash::HashTableht2(ht1);

	ht2.Erase(1);
	ht2.Erase(21);
	ht2.Erase(41);
	cout << "ht2为：" << endl;
	ht2.print();
	cout << endl << endl;

	cout << "ht1为：" << endl;
	ht1.print();	
}

void main()
{
	test6();
}

对开散列的哈希表的性能的测试

为了测试通过开散列方式实现的哈希表，我们需要给OpenHash命名空间下的HashTable增加函数size、CapacityOfHashTable、HashBucketNum、MaxBucketLenth，如下代码所示，这些函数的用途已经在注释中说明了，不再赘述。

namespace OpenHash//表示开散列的意思
{
	
	template
	struct HashNode
	{
		HashNode()
			:_data()
			,_next()
		{}
		
		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};

	template>
	class HashTable
	{
		typedef HashNode Node;
	public:
		HashTable()
			:_size(0)
			, _v()
		{}
	
		//计算哈希表中有多少个节点（即有效数据），或者说计算vector的所有哈希桶中的节点个数之和
		//用于测试性能
		size_t size()const
		{
			return _size;
		}

		//计算哈希表的长度（即capacity），也就是计算vector的size
		//用于测试性能
		size_t CapacityOfHashTable()const
		{
			return _v.size();
		}

		//计算有多少个哈希桶上挂着节点
		//用于测试性能
		size_t HashBucketNum()const
		{
			size_t val = 0;
			for (int i = 0; i < _v.size(); i++)
			{
				if (_v[i] != nullptr)
				{
					val++;
				}
			}
			return val;
		}

		//计算vector中最长的哈希桶的长度
		//用于测试性能
		size_t MaxBucketLenth()const
		{
			size_t maxLenth = 0;
			for (int i = 0; i < _v.size(); i++)
			{
				Node* cur = _v[i];
				size_t lenth = 0;
				while (cur != nullptr)
				{
					lenth++;
					cur = cur->_next;
				}
				
				if (lenth > maxLenth)
				{
					maxLenth = lenth;
				}
			}
			return maxLenth;
		}
		
	private:
		vector_v;
		size_t _size;
	};

}

测试情况如下图1所示。

可以看到无论数据量怎么变化，即无论vector的所有哈希桶中的节点个数之和怎么变化，vector中挂有节点的哈希桶的平均长度数都是不超过2的（注意是挂有节点的哈希桶，没有把空桶算进去），即vector中挂有节点的链表的平均长度数都是不超过2的。这也就是说，无论有多少个数据，只要哈希桶中存在需要查找的目标元素，算出其哈希地址后，找目标元素平均只需要2次或者说是常数次；而如果哈希桶中不存在需要查找的目标元素，在查找时算出其哈希地址后就能立马知道它不存在于哈希表中，一次都不用找。综上所述，这就证明了哈希表的平均查找的时间复杂度是O（1），那哈希表的在最坏的情况下查找的时间复杂度是多少呢？

如下图1所示，可以看到随着数据量变大，vector中长度最长的哈希桶的长度也在不断变大，这时可能会有人说【既然vector中长度最长的哈希桶的长度在不断变大，那哈希表的在最坏的情况下查找的时间复杂度总不能是O（1）了吧？】这里我想说的是：的确不是严格意义上的O（1），但效率上也不会比O（1）要差多少，比如你看在10w个数字里最长的哈希桶也只不过是8个元素，查找的消耗只不过是九牛一毛而已。并且咱们模拟实现的哈希表在插入时是没有去重逻辑的，又因为通过rand()函数生成的数据会有重复值，所以在这种情况下vector中长度最长的哈希桶基本都是带有重复的元素的，如下图2的打印结果（说一下图2中的MaxBucketLenth函数相比于图1的MaxBucketLenth函数是被稍微修改过的，比如返回值类型从size_t变成了pair，而且图2中对比图1还增加了一个oneprint函数，用于打印单个桶的所有节点，这里我想说：只看测试的打印结果就好，不用在意实现的细节），所以如果在Insert函数中把去重的逻辑加上，那么vector中长度最长的哈希桶的长度是一定会减少的，那么在最坏情况下的查找的效率也就会进一步提高。因为本章讲解的是纯粹的哈希表，所以就不实现去重逻辑了，但说一下，以后通过哈希表去模拟实现的unordered系列的容器中，有些是需要去重逻辑的，比如unordered系列的map和set，所以这些容器的查找效率也就会进一步提高。去重的逻辑也非常简单，咱们在上文中已经实现过FInd函数了，那么调用Find函数查找要插入的目标元素，如果返回值不是nullptr，说明此时哈希表中已经存在了该元素，就不继续Inset插入它了，反之则继续插入。

所以总结：综上所述，哈希表的查找的时间复杂度虽然不是严格的O（1），但咱们可以认为它约等于是O（1），因此哈希表的查找的效率是远比红黑树要高的。

图1如下。

图2如下。

上面图1的代码如下。

void test8()
{
	srand(time(0));
	OpenHash::HashTableht;
	for (int i=0;i<100000;i++)
	{
		ht.Insert(rand()+i);
	}
	
	//ht.print();
	cout << endl << endl;
	cout << "vector的所有哈希桶中的节点个数之和为：" << ht.size() << endl;
	cout << "vector的所有哈希桶的个数（包含空桶）为" << ht.CapacityOfHashTable() << endl;
	cout << "vector中挂有节点的哈希桶的个数为：" << ht.HashBucketNum() << endl;
	cout << "vector中挂有节点的哈希桶的平均长度数为：" << (double)ht.size() / (double)ht.HashBucketNum() << endl;
	cout << "vector中长度最长的哈希桶的长度为：" << ht.MaxBucketLenth() << endl;

	cout << "哈希表的负载因子为：" << (double)ht.size()/ (double)ht.CapacityOfHashTable() << endl;
	
}

void main()
{
	test8();
}

开散列的哈希表的迭代器

迭代器类的基础框架（包含operator*()等等接口）

如下代码所示。一些简单的接口比如operator*等的实现就不再说明，因为很简单，所以把它们都归为了基础框架中。然后要说的是：迭代器类有一个HashTable* _ht成员是因为在实现前后置的operator++函数时，需要在函数体内计算当前节点所在的桶是哈希表的哪一个桶，计算完毕后还需要遍历哈希表中的桶，因此需要哈希表的指针成员_ht。剩下要说的话都在注释中。

#pragma once
#include
#include
#include
using namespace std;

namespace OpenHash//表示开散列的意思
{
    //HashTable类模板的定义在HashIterator的定义的下方，而HashIterator类内有HashTable的成员对象，因此这里需要前置声明，如果对前置声明不太熟悉，请看<<模板的进阶（包括模板的分离编译问题、前置声明问题）>>一文
	template
	class HashTable;

	//因为存在const_iterator这种东西，于是设置T2专门用于控制operator*和operator->的返回值;而T1就用于控制哈希表中节点Node的类型了
	//因为在operator++中有需要用到计算哈希地址的哈希函数，所以需要Hash这个仿函数类去将任意类型转化成size_t类型，辅助哈希函数计算哈希地址
	template>
	class HashIterator
	{
		typedef HashNode Node;
		typedef HashIterator iterator;
		typedef HashTable HT;
	public:
		HashIterator()
			:_n(nullptr)
			, _ht(nullptr)
		{}

		HashIterator(Node* p, const HT* ht)//注意这里的ht，和HashIterator类的指针成员_ht，都必须加上const，否则哈希表的成员函数const_iterator begin()const就编不过，原因是const_iterator构造不出来
			:_n(p)
			, _ht(ht)
		{}

		T2& operator*()
		{
			assert(_n != nullptr);
			return _n->_data;
		}

		T2* operator->()
		{
			assert(_n != nullptr);
			return &(_n->_data);
		}

		bool operator==(iterator it)const
		{
			return _n == it._n;
		}

		bool operator!=(iterator it)const
		{
			return _n != it._n;
		}
	private:
		Node* _n;
		const HashTable* _ht;
	};

    template>
	class HashTable
	{
		typedef HashNode Node;
	public:	
		HashTable()
			:_size(0)
			, _v()
		{}
    private:
		vector_v;
		size_t _size;
	};

}

迭代器类的前后置的operator++函数

思路也很简单，先判断调用前后置operator++函数的迭代器指向的节点是否为nullptr，如果是，则不能++了，因为当前迭代器指向最后一个元素的后一个位置。最后如果是前置operator++，此时return *this即可；如果是后置operator++，则要返回一个和【调用operator++函数的迭代器】指向相同的临时迭代器，即return iterator(nullptr, _ht)即可。

如果不是，则如果当前桶中还有下一个节点，就让迭代器类中的指针成员_n指向下一个节点；如果没有下一个节点，就需要通过哈希函数计算出【调用前后置operator++函数的迭代器指向的节点】在vector的第几号哈希桶中，假如为n，则然后需要在vector中从下标n开始不断向后遍历，找出vector中第一个不是空桶的桶，然后让迭代器类中的指针成员_n指向这个桶顶的节点。最后如果是前置operator++，则return *this即可；如果是后置operator++，则要返回一个和【调用operator++函数的迭代器】在调用operator++函数之前指向相同的临时迭代器，即return iterator(temp, _ht)即可，temp是一个指针，记录了_n指针在发生变化之前的值。

注意因为需要在迭代器类中通过类的指针成员HashTable*_ht访问哈希表类的私有成员vector _v，因此需要让迭代器类成为哈希表类的友元类。

#pragma once
#include
#include
#include
using namespace std;

namespace OpenHash//表示开散列的意思
{
    //HashTable类模板的定义在HashIterator的定义的下方，而HashIterator类内有HashTable的成员对象，因此这里需要前置声明，如果对前置声明不太熟悉，请看<<模板的进阶（包括模板的分离编译问题、前置声明问题）>>一文
	template
	class HashTable;

	//因为存在const_iterator这种东西，于是设置T2专门用于控制operator*和operator->的返回值;而T1就用于控制哈希表中节点Node的类型了
	//因为在operator++中有需要用到计算哈希地址的哈希函数，所以需要Hash这个仿函数类去将任意类型转化成size_t类型，辅助哈希函数计算哈希地址
	template>
	class HashIterator
	{
		typedef HashNode Node;
		typedef HashIterator iterator;
		typedef HashTable HT;
	public:
		HashIterator()
			:_n(nullptr)
			, _ht(nullptr)
		{}

		HashIterator(Node* p, const HT* ht)//注意这里的ht，和HashIterator类的指针成员_ht，都必须加上const，否则哈希表的成员函数const_iterator begin()const就编不过，原因是const_iterator构造不出来
			:_n(p)
			, _ht(ht)
		{}

		//后置++
		iterator operator++(int)
		{
			if (_n != nullptr)
			{
				Node* temp = _n;

				if (_n->_next != nullptr)
				{
					_n = _n->_next;
					return iterator(temp, _ht);
				}
				else
				{
					Hash hf;
					int hashaddr = hf(_n->_data) % _ht->_v.size();//已经把迭代器类设置成哈希表的友元类了，因此可以访问哈希表的private成员_v	
					hashaddr++;
					while (hashaddr < _ht->_v.size())
					{
						if (_ht->_v[hashaddr] == nullptr)
							hashaddr++;
						else
						{
							_n = _ht->_v[hashaddr];
							return iterator(temp, _ht);
						}
					}
					//走到这里，说明出了循环，说明所有桶都已经找完了，目前迭代器就指向最后一个元素，后面没有元素了
					_n = nullptr;
					return iterator(temp, _ht);
				}
			}
			else
			{
				return iterator(nullptr, _ht);
			}
			
		}

		//前置++
		iterator& operator++()
		{
			if (_n != nullptr)
			{
				Node* temp = _n;

				if (_n->_next != nullptr)
				{
					_n = _n->_next;
					return *this;
				}
				else
				{
					Hash hf;
					int hashaddr = hf(_n->_data) % _ht->_v.size();//已经把迭代器类设置成哈希表的友元类了，因此可以访问哈希表的private成员_v	
					hashaddr++;
					while (hashaddr < _ht->_v.size())
					{
						if(_ht->_v[hashaddr] == nullptr)
							hashaddr++;
						else
						{
							_n = _ht->_v[hashaddr];
							return *this;
						}
					}
					//走到这里，说明出了循环，说明目前迭代器就指向最后一个元素，后面没有元素了,让_n等于空后返回*this即可。
					_n = nullptr;
					return *this;
				}
			}
			else
			{
				return *this;
			}
		}

		/*
			开散列的哈希表的迭代器是单项迭代器，不支持前后置的operator--，其原因是通过开散列方式实现的哈希表的哈希桶是单链表，不支持向桶（即链表）的上方寻找。
		*/

	private:
		Node* _n;
		const HashTable* _ht;
	};

    template>
	class HashTable
	{
		typedef HashNode Node;
	public:	
		HashTable()
			:_size(0)
			, _v()
		{}
    private:
		vector_v;
		size_t _size;
	};

}

哈希表类的begin()、end()函数

上文中把迭代器类的接口都编写完毕后，接下来咱们就开始编写哈希表类的begin()、end()函数。begin()思路很简单，从vector的第一个哈希桶开始访问、然后依次访问后面的哈希桶，哪个桶不是空桶，则begin()就返回指向该桶桶顶节点的迭代器。

end()的思路更简单，我们把指向nullptr的迭代器当作指向哈希表中最后一个元素的后一个位置的迭代器，也就是end()函数返回的迭代器。

#pragma once
#include
#include
#include
using namespace std;

namespace OpenHash//表示开散列的意思
{
   //HashTable类模板的定义在HashIterator的定义的下方，而HashIterator类内有HashTable的成员对象，因此这里需要前置声明，如果对前置声明不太熟悉，请看<<模板的进阶（包括模板的分离编译问题、前置声明问题）>>一文
	template
	class HashTable;

	//因为存在const_iterator这种东西，于是设置T2专门用于控制operator*和operator->的返回值;而T1就用于控制哈希表中节点Node的类型了
	//因为在operator++中有需要用到计算哈希地址的哈希函数，所以需要Hash这个仿函数类去将任意类型转化成size_t类型，辅助哈希函数计算哈希地址
	template>
	class HashIterator
	{
		typedef HashNode Node;
		typedef HashIterator iterator;
		typedef HashTable HT;
	public:
		HashIterator()
			:_n(nullptr)
			, _ht(nullptr)
		{}

		HashIterator(Node* p, const HT* ht)//注意这里的ht，和HashIterator类的指针成员_ht，都必须加上const，否则哈希表的成员函数const_iterator begin()const就编不过，原因是const_iterator构造不出来
			:_n(p)
			, _ht(ht)
		{}

	private:
		Node* _n;
		const HashTable* _ht;
	};

    template>
	class HashTable
	{
		friend class HashIterator;
		friend class HashIterator;
		typedef HashNode Node;
	public:
		typedef HashIterator iterator;
		typedef HashIterator const_iterator;

		HashTable()
			:_size(0)
			, _v()
		{}

		iterator begin()
		{
			int i = 0;
			while (i < _v.size())
			{
				if(_v[i] == nullptr)
					i++;
				else
					return iterator(_v[i], this);
			}
			//如果走出了循环，说明哈希表中一个元素也没有
			return iterator(nullptr, this);
				
		}

		const_iterator begin()const
		{
			int i = 0;
			while (i < _v.size())
			{
				if (_v[i] == nullptr)
					i++;
				else
					return const_iterator(_v[i], this);
			}
			//如果走出了循环，说明哈希表中一个元素也没有
			return const_iterator(nullptr, this);

		}

		iterator end()
		{
			return iterator(nullptr, this);
		}

		const_iterator end()const
		{
			return const_iterator(nullptr, this);
		}

private:
		vector_v;
		size_t _size;
	};

}

和哈希表的迭代器相关的整体代码

#pragma once
#include
#include
#include
using namespace std;

namespace OpenHash//表示开散列的意思
{
   //HashTable类模板的定义在HashIterator的定义的下方，而HashIterator类内有HashTable的成员对象，因此这里需要前置声明，如果对前置声明不太熟悉，请看<<模板的进阶（包括模板的分离编译问题、前置声明问题）>>一文
	template
	class HashTable;

	//因为存在const_iterator这种东西，于是设置T2专门用于控制operator*和operator->的返回值;而T1就用于控制哈希表中节点Node的类型了
	//因为在operator++中有需要用到计算哈希地址的哈希函数，所以需要Hash这个仿函数类去将任意类型转化成size_t类型，辅助哈希函数计算哈希地址
	template>
	class HashIterator
	{
		typedef HashNode Node;
		typedef HashIterator iterator;
		typedef HashTable HT;
	public:
		HashIterator()
			:_n(nullptr)
			, _ht(nullptr)
		{}

		HashIterator(Node* p, const HT* ht)//注意这里的ht，和HashIterator类的指针成员_ht，都必须加上const，否则哈希表的成员函数const_iterator begin()const就编不过，原因是const_iterator构造不出来
			:_n(p)
			, _ht(ht)
		{}

		T2& operator*()
		{
			assert(_n != nullptr);
			return _n->_data;
		}

		T2* operator->()
		{
			assert(_n != nullptr);
			return &(_n->_data);
		}

		//后置++
		iterator operator++(int)
		{
			if (_n != nullptr)
			{
				Node* temp = _n;

				if (_n->_next != nullptr)
				{
					_n = _n->_next;
					return iterator(temp, _ht);
				}
				else
				{
					Hash hf;
					int hashaddr = hf(_n->_data) % _ht->_v.size();//已经把迭代器类设置成哈希表的友元类了，因此可以访问哈希表的private成员_v	
					hashaddr++;
					while (hashaddr < _ht->_v.size())
					{
						if (_ht->_v[hashaddr] == nullptr)
							hashaddr++;
						else
						{
							_n = _ht->_v[hashaddr];
							return iterator(temp, _ht);
						}
					}
					//走到这里，说明出了循环，说明所有桶都已经找完了，目前迭代器就指向最后一个元素，后面没有元素了
					_n = nullptr;
					return iterator(temp, _ht);
				}
			}
			else
			{
				return iterator(nullptr, _ht);
			}
			
		}

		//前置++
		iterator& operator++()
		{
			if (_n != nullptr)
			{
				Node* temp = _n;

				if (_n->_next != nullptr)
				{
					_n = _n->_next;
					return *this;
				}
				else
				{
					Hash hf;
					int hashaddr = hf(_n->_data) % _ht->_v.size();//已经把迭代器类设置成哈希表的友元类了，因此可以访问哈希表的private成员_v	
					hashaddr++;
					while (hashaddr < _ht->_v.size())
					{
						if(_ht->_v[hashaddr] == nullptr)
							hashaddr++;
						else
						{
							_n = _ht->_v[hashaddr];
							return *this;
						}
					}
					//走到这里，说明出了循环，说明目前迭代器就指向最后一个元素，后面没有元素了,让_n等于空后返回*this即可。
					_n = nullptr;
					return *this;
				}
			}
			else
			{
				return *this;
			}
		}

		/*
			开散列的哈希表的迭代器是单项迭代器，不支持前后置的operator--，其原因是通过开散列方式实现的哈希表的哈希桶是单链表，不支持向桶（即链表）的上方寻找。
		*/

		bool operator==(iterator it)const
		{
			return _n == it._n;
		}

		bool operator!=(iterator it)const
		{
			return _n != it._n;
		}
	private:
		Node* _n;
		const HashTable* _ht;
	};

    template>
	class HashTable
	{
		friend class HashIterator;
		friend class HashIterator;
		typedef HashNode Node;
	public:
		typedef HashIterator iterator;
		typedef HashIterator const_iterator;
		HashTable()
			:_size(0)
			, _v()
		{}

		iterator begin()
		{
			int i = 0;
			while (i < _v.size())
			{
				if(_v[i] == nullptr)
					i++;
				else
					return iterator(_v[i], this);
			}
			//如果走出了循环，说明哈希表中一个元素也没有
			return iterator(nullptr, this);
				
		}

		const_iterator begin()const
		{
			int i = 0;
			while (i < _v.size())
			{
				if (_v[i] == nullptr)
					i++;
				else
					return const_iterator(_v[i], this);
			}
			//如果走出了循环，说明哈希表中一个元素也没有
			return const_iterator(nullptr, this);

		}

		iterator end()
		{
			return iterator(nullptr, this);
		}

		const_iterator end()const
		{
			return const_iterator(nullptr, this);
		}

private:
		vector_v;
		size_t _size;
	};

}

开散列版本的哈希表的整体代码

代码如下。

#pragma once
#include
#include
#include
using namespace std;

namespace OpenHash//表示开散列的意思
{
	template
	struct hashfunc
	{
		size_t operator()(const T& x)
		{
			return (size_t)x;//如果T是指针类型，或者是char类型，int类型，double类型，float类型等能直接强转成size_t类型的类型，则通过该函数直接转即可
		}
	};

	template<>
	struct hashfunc
	{
		//BKDR字符串哈希方法
		size_t operator()(const string& s)
		{
			size_t val = 0;
			for (string::const_iterator it = s.begin(); it != s.end(); it++)
			{
				val *= 131;
				val += (*it);
			}
			return val;
		}
	};

	template
	struct HashNode
	{
		HashNode()
			:_data()
			, _next()
		{}

		HashNode(const T& x, HashNode* p = nullptr)
			:_data(x)
			, _next(p)
		{}

		T _data;
		HashNode* _next;
	};


	//HashTable类模板的定义在HashIterator的定义的下方，而HashIterator类内有HashTable的成员对象，因此这里需要前置声明，如果对前置声明不太熟悉，请看<<模板的进阶（包括模板的分离编译问题、前置声明问题）>>一文
	template
	class HashTable;

	//因为存在const_iterator这种东西，于是设置T2专门用于控制operator*和operator->的返回值;而T1就用于控制哈希表中节点Node的类型了
	//因为在operator++中有需要用到计算哈希地址的哈希函数，所以需要Hash这个仿函数类去将任意类型转化成size_t类型，辅助哈希函数计算哈希地址
	template>
	class HashIterator
	{
		typedef HashNode Node;
		typedef HashIterator iterator;
		typedef HashTable HT;
	public:
		HashIterator()
			:_n(nullptr)
			, _ht(nullptr)
		{}

		HashIterator(Node* p, const HT* ht)//注意这里的ht，和HashIterator类的指针成员_ht，都必须加上const，否则哈希表的成员函数const_iterator begin()const就编不过，原因是const_iterator构造不出来
			:_n(p)
			, _ht(ht)
		{}

		T2& operator*()
		{
			assert(_n != nullptr);
			return _n->_data;
		}

		T2* operator->()
		{
			assert(_n != nullptr);
			return &(_n->_data);
		}

		//后置++
		iterator operator++(int)
		{
			if (_n != nullptr)
			{
				Node* temp = _n;

				if (_n->_next != nullptr)
				{
					_n = _n->_next;
					return iterator(temp, _ht);
				}
				else
				{
					Hash hf;
					int hashaddr = hf(_n->_data) % _ht->_v.size();//已经把迭代器类设置成哈希表的友元类了，因此可以访问哈希表的private成员_v	
					hashaddr++;
					while (hashaddr < _ht->_v.size())
					{
						if (_ht->_v[hashaddr] == nullptr)
							hashaddr++;
						else
						{
							_n = _ht->_v[hashaddr];
							return iterator(temp, _ht);
						}
					}
					//走到这里，说明出了循环，说明所有桶都已经找完了，目前迭代器就指向最后一个元素，后面没有元素了
					_n = nullptr;
					return iterator(temp, _ht);
				}
			}
			else
			{
				return iterator(nullptr, _ht);
			}
			
		}

		//前置++
		iterator& operator++()
		{
			if (_n != nullptr)
			{
				Node* temp = _n;

				if (_n->_next != nullptr)
				{
					_n = _n->_next;
					return *this;
				}
				else
				{
					Hash hf;
					int hashaddr = hf(_n->_data) % _ht->_v.size();//已经把迭代器类设置成哈希表的友元类了，因此可以访问哈希表的private成员_v	
					hashaddr++;
					while (hashaddr < _ht->_v.size())
					{
						if(_ht->_v[hashaddr] == nullptr)
							hashaddr++;
						else
						{
							_n = _ht->_v[hashaddr];
							return *this;
						}
					}
					//走到这里，说明出了循环，说明目前迭代器就指向最后一个元素，后面没有元素了,让_n等于空后返回*this即可。
					_n = nullptr;
					return *this;
				}
			}
			else
			{
				return *this;
			}
		}

		/*
			开散列的哈希表的迭代器是单项迭代器，不支持前后置的operator--，其原因是通过开散列方式实现的哈希表的哈希桶是单链表，不支持向桶（即链表）的上方寻找。
		*/

		bool operator==(iterator it)const
		{
			return _n == it._n;
		}

		bool operator!=(iterator it)const
		{
			return _n != it._n;
		}
	private:
		Node* _n;
		const HashTable* _ht;
	};



	template>
	class HashTable
	{
		friend class HashIterator; 
		friend class HashIterator;
		typedef HashNode Node;
	public:
		typedef HashIterator iterator;
		typedef HashIterator const_iterator;
		HashTable()
			:_size(0)
			, _v()
		{}

		//HashNode是HashTable所new出来的，所以理应由HashTable去释放, 析构函数是在类的成员被销毁前调用的特殊成员函数
		~HashTable()
		{
			for (int i = 0; i < _v.size(); i++)
			{
				Node* cur = _v[i];
				while (cur != nullptr)
				{
					Node* next = cur->_next;
					delete cur;
					cur = next;
				}
			}
		}

		//拷贝构造
		HashTable(const HashTable& ht)
			:_v(ht._v)
			, _size(ht._size)
		{
			for (int i = 0; i < ht._v.size(); i++)
			{
				if (ht._v[i] != nullptr)
				{
					_v[i] = new Node((ht._v[i])->_data);
					Node* cur1 = _v[i];//cur1指针用于操作正在构造的哈希桶中的HashNode
					Node* cur2 = ht._v[i];//cur2指针用于操作被拷贝的哈希桶中的HashNode

					cur2 = cur2->_next;
					while (cur2 != nullptr)
					{
						cur1->_next = new Node(cur2->_data);
						cur1 = cur1->_next;
						cur2 = cur2->_next;
					}
				}
			}
		}

		iterator begin()
		{
			int i = 0;
			while (i < _v.size())
			{
				if(_v[i] == nullptr)
					i++;
				else
					return iterator(_v[i], this);
			}
			//如果走出了循环，说明哈希表中一个元素也没有
			return iterator(nullptr, this);
				
		}

		const_iterator begin()const
		{
			int i = 0;
			while (i < _v.size())
			{
				if (_v[i] == nullptr)
					i++;
				else
					return const_iterator(_v[i], this);
			}
			//如果走出了循环，说明哈希表中一个元素也没有
			return const_iterator(nullptr, this);

		}

		iterator end()
		{
			return iterator(nullptr, this);
		}

		const_iterator end()const
		{
			return const_iterator(nullptr, this);
		}

		bool Insert(const T& x)
		{
			hashfunc hf;

			//一石二鸟，哈希表为空时走这里扩容；哈希表的负载因子达到1时也走这里扩容
			if (_size == _v.size())
			{
				int newSize = _v.size() == 0 ? 10 : 2 * (_v.size());
				vectorv1;
				v1.resize(newSize);
				//将旧空间_v的数据都移到新空间v1上
				for (int i = 0; i < _v.size(); i++)
				{
					if (_v[i] != nullptr)
					{
						Node* cur1 = _v[i];
						while (cur1 != nullptr)
						{
							int hashaddr = hf(cur1->_data) % v1.size();//hashaddr表示新vector上的下标,注意因为发生了扩容，所以哈希函数这里是模v1的size，而不是模_v的size
							Node* cur2 = v1[hashaddr];//cur2表示新vector上第hashaddr个链表的头节点的地址 
							Node* cur3 = cur1->_next;
							cur1->_next = cur2;
							v1[hashaddr] = cur1;
							cur1 = cur3;
						}
						_v[i] = nullptr;
					}
				}
				//走到这里就出了for循环，表明已经把数据都挪动完毕了，将新vector交给哈希表管理即可，出了最外层的if分支后，旧vector中的节点的内存不会被释放，释放的是旧vector中的指针所占的8字节空间
				_v.swap(v1);
			}

			//不管是否发生哈希冲突，插入元素x都需要执行以下逻辑
			int hashaddr = hf(x) % _v.size();
			Node* cur = _v[hashaddr];//cur是哈希表中下标为hashaddr位置上的链表
			Node* temp = new Node(x);//temp是需要新插入的节点
			temp->_next = cur;
			_v[hashaddr] = temp;
			_size++;
			return true;
		}

		Node* Find(const T& x)
		{
			hashfunc hf;

			//防止计算哈希地址时，int hashaddr = hf(x) % _v.size()的时候去模0
			if (_v.size() == 0)
				return nullptr;

			int hashaddr = hf(x) % _v.size();
			Node* cur = _v[hashaddr];
			while (cur != nullptr)
			{
				if (cur->_data == x)
				{
					return cur;
				}
				cur = cur->_next;
			}
			return nullptr;
		}

		bool Erase(const T& x)
		{
			hashfunc hf;

			//防止计算哈希地址时，int hashaddr = hf(x) % _v.size()的时候去模0
			if (_v.size() == 0)
				return false;

			int hashaddr = hf(x) % _v.size();
			Node* cur1 = nullptr;
			Node* cur2 = _v[hashaddr];
			while (cur2 != nullptr)
			{
				if (cur2->_data == x)
				{
					if (cur1 != nullptr)
					{
						cur1->_next = cur2->_next;
						delete cur2;
						_size--;
						return true;
					}
					else
					{
						_v[hashaddr] = cur2->_next;
						delete cur2;
						_size--;
						return true;
					}
				}
				else
				{
					cur1 = cur2;
					cur2 = cur2->_next;
				}
			}
			//走到这里就出了循环，说明vector中的hashaddr号哈希桶上不存在目标元素,那哈希表中也就不存在目标元素，直接return false
			return false;
		}

		void print()
		{
			for (int i = 0; i < _v.size(); i++)
			{
				if (_v[i] != nullptr)
				{
					Node* cur = _v[i];
					cout << "哈希桶" << i << "为：";
					while (cur != nullptr)
					{
						cout << cur->_data << ' ';
						cur = cur->_next;
					}
					cout << endl;
				}
			}
			cout << endl;
		}

		//计算哈希表中有多少个节点（即有效数据），或者说计算vector的所有哈希桶中的节点个数之和
		//用于测试性能
		size_t size()const
		{
			return _size;
		}

		//计算哈希表的长度（即capacity），也就是计算vector的size
		//用于测试性能
		size_t CapacityOfHashTable()const
		{
			return _v.size();
		}

		//计算有多少个哈希桶上挂着节点
		//用于测试性能
		size_t HashBucketNum()const
		{
			size_t val = 0;
			for (int i = 0; i < _v.size(); i++)
			{
				if (_v[i] != nullptr)
				{
					val++;
				}
			}
			return val;
		}

		//计算vector中最长的哈希桶的长度
		//用于测试性能
		size_t MaxBucketLenth()const
		{
			size_t maxLenth = 0;
			for (int i = 0; i < _v.size(); i++)
			{
				Node* cur = _v[i];
				size_t lenth = 0;
				while (cur != nullptr)
				{
					lenth++;
					cur = cur->_next;
				}

				if (lenth > maxLenth)
				{
					maxLenth = lenth;
				}
			}
			return maxLenth;
		}


	private:
		vector_v;
		size_t _size;
	};

}

通过开散列方式实现的哈希表优点

开散列的哈希桶结构比闭散列更实用，主要原因有两点：

1，哈希桶的负载因子可以更大，空间利用率高。使用开散列的方式处理哈希冲突时，需要增设链接指针，似乎增加了存储开销，但事实上由于闭散列的方式必须保持大量的空闲空间以确保搜索效率，如二次探测法要求负载因子α <= 0.7且最好是α <= 0.5，而sizeof（HashDate）大小的空闲空间又比指针所占的空间大的多，所以使用开散列的方式反而比闭散列的方式节省存储空间。

2，哈希桶在极端情况下还有可用的解决方案。

如下图，哈希桶的极端情况是所有元素全部产生冲突，最终都放到了同一个哈希桶中，此时该哈希表增删查改的效率就退化成了O ( N ) 。

这时我们可以考虑将这个桶中的元素，由单链表结构改为红黑树结构，并将红黑树的根结点存储在哈希表中，如下图所示。在这种情况下，就算有十亿个元素全部冲突到一个哈希桶中，我们也只需要在这个哈希桶中查找30次左右，这就是所谓的“桶里种树”。

为了避免出现这种极端情况，当桶当中的元素个数超过一定长度，有些地方就会选择将该桶中的单链表结构换成红黑树结构，比如在JAVA中比较新一点的版本中，当桶当中的数据个数超过8时，就会将该桶当中的单链表结构换成红黑树结构，而当该桶当中的数据个数减少到8或8以下时，又会将该桶当中的红黑树结构换回单链表结构。

但有些地方也会选择不做此处理，因为随着哈希表中数据的增多，该哈希表的负载因子也会逐渐增大，最终会触发哈希表的增容条件，此时该哈希表当中的数据会全部重新插入到另一个空间更大的哈希表，此时同一个桶当中冲突的数据个数也会减少，因此不做处理问题也不大。

你可能感兴趣的:(数据结构,数据结构,c++)

c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
20个新手学习c++必会的程序输出*三角形、杨辉三角等（附代码） X_StarX c++学习算法大学生开发语言数据结构
示例1:HelloWorld#includeusingnamespacestd;intmain(){coutusingnamespacestd;intmain(){inta=5;intb=10;intsum=a+b;coutusingnamespacestd;intfactorial(intn){if(nusingnamespacestd;voidprintFibonacci(intn){intt
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
【2022 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级 C++语言试题及解析】汉子萌萌哒 CCF noi 算法数据结构 c++
一、单项选择题(共15题，每题2分，共计30分；每题有且仅有一个正确选项)1.以下哪种功能没有涉及C++语言的面向对象特性支持：()。A.C++中调用printf函数B.C++中调用用户定义的类成员函数C.C++中构造一个class或structD.C++中构造来源于同一基类的多个派生类题目解析【解析】正确答案:AC++基础知识，面向对象和类有关，类又涉及父类、子类、继承、派生等关系，printf
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
【树一线性代数】005入门 Owlet_woodBird 算法
Index本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376分析实现总结本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376已知非空二叉树T的结点值均为正整数，采用顺序存储方式保存，数据结构定义如下:t
python获取子进程返回值_Python对进程Multiprocessing子进程返回值 weixin_39752157 python获取子进程返回值
在实际使用多进程的时候，可能需要获取到子进程运行的返回值。如果只是用来存储，则可以将返回值保存到一个数据结构中；如果需要判断此返回值，从而决定是否继续执行所有子进程，则会相对比较复杂。另外在Multiprocessing中，可以利用Process与Pool创建子进程，这两种用法在获取子进程返回值上的写法上也不相同。这篇中，我们直接上代码，分析多进程中获取子进程返回值的不同用法，以及优缺点。初级用法
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
【数据结构-一维差分】力扣2848. 与车相交的点 hlc@ 数据结构数据结构 leetcode 算法
给你一个下标从0开始的二维整数数组nums表示汽车停放在数轴上的坐标。对于任意下标i，nums[i]=[starti,endi]，其中starti是第i辆车的起点，endi是第i辆车的终点。返回数轴上被车任意部分覆盖的整数点的数目。示例1：输入：nums=[[3,6],[1,5],[4,7]]输出：7解释：从1到7的所有点都至少与一辆车相交，因此答案为7。示例2：输入：nums=[[1,3],[5
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
《 C++ 修炼全景指南：四》揭秘 C++ List 容器背后的实现原理，带你构建自己的双向链表 Lenyiin 技术指南 C++修炼全景指南 c++list 链表 stl
本篇博客，我们将详细讲解如何从头实现一个功能齐全且强大的C++List容器，并深入到各个细节。这篇博客将包括每一步的代码实现、解释以及扩展功能的探讨，目标是让初学者也能轻松理解。一、简介1.1、背景介绍在C++中，std::list是一个基于双向链表的容器，允许高效的插入和删除操作，适用于频繁插入和删除操作的场景。与动态数组不同，list允许常数时间内的插入和删除操作，支持双向遍历。这篇文章将详细
c++ 内存处理函数 heeheeai c++开发语言
在C语言的头文件中，memcpy和memmove函数都用于复制内存块，但它们在处理内存重叠方面存在关键区别：内存重叠:memcpy函数不保证在源内存和目标内存区域重叠时能够正确复制数据。如果内存区域重叠，memcpy的行为是未定义的，可能会导致数据损坏或程序崩溃。memmove函数能够安全地处理源内存和目标内存区域重叠的情况。它会确保在复制过程中不会覆盖尚未复制的数据，从而保证数据的完整性。效率:
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_