哈希表和哈希桶模拟实现、封装unordered_map、unordered_set

哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第1张图片

目录

  • 哈希概念
    • 该结构中:
      • 插入元素
      • 搜索元素
      • 哈希映射
      • 问题的出现
      • 哈希冲突
      • 分析哈希冲突的原因
      • 常见哈希函数
    • 解决哈希冲突两种常见的方法是:闭散列和开散列
    • 总结:
  • 哈希表模拟实现
    • 哈希表结构
    • 哈希表插入
    • 查找
    • 删除
  • 哈希桶模拟实现
    • 介绍开散列
    • 哈希桶结构
    • 插入
    • 查找
    • 删除
    • 获取素数
  • unordered系列map、set模拟实现
    • unordered系列关联式容器
    • unordered_map的文档介绍
    • 哈希表结点结构
    • 哈希表改造
    • 哈希表迭代器
    • unordered_map模拟
    • unordered_set模拟

哈希概念

前提:
顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素时,必须要经过关键码的多次比较。顺序查找时间复杂度为O(N),平衡树中为树的高度,即O( log N),搜索的效率取决于搜索过程中元素的比较次数。

哈希的引入:
理想的搜索方法:可以不经过任何比较,一次直接从表中得到要搜索的元素。 如果构造一种存储结构,通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立一一映射的关系,那么在查找时通过该函数可以很快找到该元素。

该结构中:

插入元素

根据待插入元素的关键码,以此函数计算出该元素的存储位置并按此位置进行存放

搜索元素

对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置取元素比较,若关键码相等,则搜索成功,该方式即为哈希(散列)方法,哈希方法中使用的转换函数称为哈希(散列)函数,构造出来的结构称为哈希表(Hash Table)(或者称散列表)

哈希映射

例如:数据集合{1,7,6,4,5,9};
哈希函数设置为:hash(key) = key % capacity; capacity为存储元素底层空间总的大小。

哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第2张图片

问题的出现

用该方法进行搜索不必进行多次关键码的比较,因此搜索的速度比较快 问题:按照上述哈希方式,向集合中插入元素44,会出现哈希冲突的问题

哈希冲突

对于两个数据元素的关键字ki 和 kj (i != j),有 ki != kj,但有:Hash( ki) == Hash( kj),即:不同关键字通过相同哈希函数数计算出相同的哈希地址,该种现象称为哈希冲突或哈希碰撞。把具有不同关键码而具有相同哈希地址的数据元素称为“同义词”。发生哈希冲突该如何处理呢?

分析哈希冲突的原因

1、引起哈希冲突的一个原因可能是:哈希函数设计不够合理
2、哈希函数设计原则:

  • 哈希函数的定义域必须包括需要存储的全部关键码,而如果散列表允许有m个地址时,其值域必须在0 到m-1之间

  • 哈希函数计算出来的地址能均匀分布在整个空间中

  • 哈希函数应该比较简单

常见哈希函数

  1. 直接定制法–(常用,一个值对应一个地址)
    取关键字的某个线性函数为散列地址:Hash(Key)= A*Key + B 优点:简单、均匀 缺点:需要事先知道关键字的分布情况 使用场景:适合查找比较小且连续的情况 ,给你一组数据范围很大,直接定址法会浪费很多的空间,不能处理浮点数,字符串等等数据

  2. 除留余数法–(常用,对比于直接定址法会更节省空间,但是会导致一个位置被映射多次)
    设散列表中允许的地址数为m,取一个不大于m,但最接近或者等于m的质数p作为除数,按照哈希函数:Hash(key) = key% p(p<=m),将关键码转换成哈希地址
    例如:数据集合{1,7,6,4,5,9,11,17,19};
    可以发现同一个位置会被映射两次值,这种现象叫做哈希冲突
    哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第3张图片

  3. 平方取中法–(了解)
    假设关键字为1234,对它平方就是1522756,抽取中间的3位227作为哈希地址; 再比如关键字为4321,对它平方就是18671041,抽取中间的3位671(或710)作为哈希地址 平方取中法比较适合:不知道关键字的分布,而位数又不是很大的情况

  4. 折叠法–(了解)
    折叠法是将关键字从左到右分割成位数相等的几部分(最后一部分位数可以短些),然后将这几部分叠加求和,并按散列表表长,取后几位作为散列地址。折叠法适合事先不需要知道关键字的分布,适合关键字位数比较多的情况

  5. 随机数法–(了解)
    选择一个随机函数,取关键字的随机函数值为它的哈希地址,即H(key) = random(key),其中random为随机数函数。通常应用于关键字长度不等时采用此法

  6. 数学分析法–(了解)
    设有n个d位数,每一位可能有r种不同的符号,这r种不同的符号在各位上出现的频率不一定相同,可能在某些位上分布比较均匀,每种符号出现的机会均等,在某些位上分布不均匀只有某几种符号经常出现。可根据散列表的大小,选择其中各种符号分布均匀的若干位作为散列地址。
    例如:
    哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第4张图片

假设要存储某家公司员工登记表,如果用手机号作为关键字,那么极有可能前7位都是 相同的,那么我们可以选择后面的四位作为散列地址,如果这样的抽取工作还容易出现 冲突,还可以对抽取出来的数字进行反转(如1234改成4321)、右环位移(如1234改成4123)、左环移位、前两数与后两数叠加(如1234改 成12+34=46)等方法。
数字分析法通常适合处理关键字位数比较大的情况,如果事先知道关键字的分布且关键字的若干位分布较均匀的情况

解决哈希冲突两种常见的方法是:闭散列和开散列

闭散列 闭散列:也叫开放定址法,当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有空位置,那 么可以把key存放到冲突位置中的“下一个” 空位置中去。那如何寻找下一个空位置呢?

  1. 线性探测 比如2.1中的场景,现在需要插入元素44,先通过哈希函数计算哈希地址,hashAddr为44,因此44理论 上应该插在该位置,但是该位置已经放了值为44的元素,即发生哈希冲突。
  2. 线性探测:从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止。 插入 通过哈希函数获取待插入元素在哈希表中的位置 比特如果该位置中没有元素则直接插入新元素,如果该位置中有元素发生哈希冲突,使用线性探测找到下一个空位置,插入新元素

哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第5张图片
线性探测优点:实现非常简单,
线性探测缺点:一旦发生哈希冲突,所有的冲突连在一起,容易产生数据“堆积”,即:不同关键码占据了可利用的空位置,使得寻找某关键码的位置需要许多次比较,导致搜索效率降低。如何缓解呢?
哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第6张图片

二次探测
线性探测的缺陷是产生冲突的数据堆积在一块,这与其找下一个空位置有关系,因为找空位置的方式就是挨着往后逐个去找,因此二次探测为了避免该问题,找下一个空位置的方法为:Hi = (H0 + i2) % m,或者:Hi = (H0 - i2)% m。其中:i = 1,2,3…, H0是通过散列函数Hash(x)对元素的关键码 key 进行计算得到的位置,m是表的大小。 对于2.1中如果要插入44,产生冲突,使用解决后的情况为:
哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第7张图片
研究表明:当表的长度为质数且表装载因子a不超过0.5时,新的表项一定能够插入,而且任何一个位置都不会被探查两次。因此只要表中有一半的空位置,就不会存在表满的问题。在搜索时可以不考虑表装满的情况,但在插入时必须确保表的装载因子a不超过0.5,如果超出必须考虑增容。

因此:比散列最大的缺陷就是空间利用率比较低,这也是哈希的缺陷。
删除
采用闭散列处理哈希冲突时,不能随便物理删除哈希表中已有的元素,若直接删除元素会影响其他元素的搜索。比如删除元素4,如果直接删除掉,44查找起来可能会受影响。因此线性探测采用标记的伪删除法来删除一个元素

哈希表的扩容
哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第8张图片

总结:

1、负载因子/载荷因子 = 存储的有效数据个数 / 空间的大小
2、负载因子越大,冲突的概率越高,增删查改效率越低
3、负载因子越小,冲突的概率越低,增删查改的效率越高,但是空间利用率不高,空间会存在浪费

哈希表模拟实现

哈希表结构

namespace Hash_Tb
{
	enum  State
	{
		EMPTY,
		DELETE,
		EXIST
	};
	template<class k, class v>
	struct HashData
	{
	public:
		pair<k, v> _kv;
		State _state = EMPTY;
	};
	
	//仿函数类模板
	template<class k>
	struct Hash 
	{
		size_t& operator()(const k& key)
		{
			return key;
		}
	};

	//类模板的特化,处理key是string类型的情况
	template<>
	struct Hash<string>
	{
		size_t operator()(const string& str)
		{
			size_t val = 0;
			for (auto& ref : str) 
			{
				val += ref ;
				val *= 131;
			}
			return val;
		}
	};
	template<class k, class v, class HashFunc = Hash<k>>
	class HashTable
	{
	public:
		
	private:
		vector<HashData<k,v>> _table;
		size_t _n = 0;
	};

哈希表插入

1、情况一:表中没有数据,处理:resize(10)

2、情况二:负载因子超过了0.7就需要对哈希表扩容,而哈希表扩容后,原先:数据集合{ … }中的值并没有发生变化,只是扩容后映射的位置相对来说发生了变化,所以需要重新计算映射位置,再将集合中的值填到映射出来对应的位置上

3、情况三:空间够,负载因子也不会超,正常插入值,通过key计算(除留余数法)出映射位置,但是需要防止发生哈希冲突所以需要走线性探测,找到合适的下一个位置,将值填入并修改状态

4、情况四:值冗余,直接return

bool insert(const pair<k,v>& kv)
{
	HashFunc hf;
	if (Find(kv.first)) return false;  //防止冗余
	if (_table.size() == 0) _table.resize(10);  //处理表为空
	//负载因子超过0.7,需要调整,此时的表中位置已经基本快填满了 
	else if ((double)_n / (double)_table.size() > 0.7)
	{
		size_t index = 0;
		HashTable<k,v> newTable;  //创建一个哈希表
		newTable._table.resize(_table.size() * 2);
		//重新计算映射位置,复制值进newtable
		for(size_t i = 0; i < _table.size(); i++)
		{
			if (_table[i]._state == EXIST) 
			{
				newTable.insert(_table[i]._kv);
			}		
		}
		swap(newTable._table, _table);
	}
	else 
	{
		//不需要扩容处理
		size_t start = hf(kv.first) % _table.size();
		size_t index = start;
		size_t i = 1;
		while (_table[index]._state == EXIST) //如果存在
		{
			index = start + i * i;//走二次探测后面的位置 
			index %= _table.size();    //调头
			i++;
		}

		_table[index]._kv = kv;
		_table[index]._state = EXIST;
		_n++;
	}
	return true;
	
}

查找

查找思想:通过计算key值映射的位置,在该位置出进行二次探测查找,如果最后键值相同那么就改回该位置的地址,边界上的控制需要想清楚,当index指针走到EMPEY位置的地方则从这个位置开始往后都不会再出现想要查找的key值了,所以可以直接终止循环,也是作为循环的条件

HashData<k,v>* Find(const k& key) 
{
	HashFunc hf;
	if (_table.size() == 0) return nullptr;
	size_t start = hf(key) % _table.size(); //计算出映射位置
	size_t index = start;
	size_t i = 1;
	while (_table[index]._state != EMPTY) //如果遇到EMPTY位置,意味着后面再无可能出现key值了
	{
		if (_table[index]._state == EXIST && _table[index]._kv.first == key) return &_table[index]; //找到了
		index = start + i * i;  //走二次探测
		index %= _table.size();
		i++;
	}

	return nullptr;  //没找到
}

删除

采用闭散列处理哈希冲突时,不能随便物理删除哈希表中已有的元素,若直接删除元素会影响其他元素的搜索。比如删除元素44,如果直接删除掉,44查找起来可能会受影响。因此线性探测采用标记的伪删除法来删除一个元素

bool Erase(const k& key)
{
		HashData<k, v>* ret = Find(key);
		if (ret) //找到了
		{
			//伪删除思想
			ret->_state = DELETE ,--_n;  //表示删除
			return true;
		}
		else 
		{
			return false;
		}
}

哈希桶模拟实现

介绍开散列

开散列概念
开散列法又叫链地址法(开链法),首先对关键码集合用散列函数计算散列地址,具有相同地址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中。
哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第9张图片
从上图可以看出,开散列中每个桶中放的都是发生哈希冲突的元素

哈希桶结构

namespace mzt
{
	template <class k, class v>
	struct HashNode 
	{
		HashNode(const pair<k, v>& kv)
			: _kv(kv)
			, _next(nullptr)
		{}

		pair<k, v> _kv;
		HashNode<k, v>* _next;
	};

	template<class k>
	struct Hash 
	{
		size_t operator()(const k& key)
		{
			return key;
		}
	};
	template<>
	struct Hash<string>
	{
		size_t operator()(const string& str)
		{
			size_t val = 0;
			for (auto &ref : str) 
			{
				val += ref;
				val *= 131;
			}
			return val;
		}

	};

	template <class k, class v, class HashFunc = Hash<k>>
	class HashTable 
	{
		typedef HashNode<k, v> Node;
	public:
	
	private:
		vector<Node*> _table;
		size_t _n = 0;
	};
}

插入

1、情况:键值冗余,直接返回

2、负载因子到达1,对哈希桶进行扩容后,将桶中的原结点取下来插入到新的桶中,所以需要对旧表中的每一个桶位遍历判断是否有挂结点,定义newtable,将旧表中的结点头插到新表中

3、正常情况:通过key值计算出映射的位置,再将该结点头插入此处,计数加加

bool insert(const pair<k, v>& kv) 
{
	HashFunc hf;
	if (Find(kv.first)) return false;  //防止冗余
	else if (_n == _table.size()) 
	{
		//开散列的负载因子到达1.0时需要调整(扩容 + 挂结点)
		//扩容 + 取原链接的结点挂到新的链表中

		size_t size = _table.size() == 0 ? 10 : _table.size() * 2;
		vector<Node*> newtable(size, nullptr);
		//遍历旧的链表 + 将旧链表的结点取下来重新计算位置存入到新的链表中
		for (size_t i = 0; i < _table.size(); i++) 
		{
			Node* cur = _table[i];
			while (cur) 
			{
				Node* next = cur->_next;
				Node* copy = new Node(cur->_kv);
				copy->_next = newtable[i];
				newtable[i] = copy;
				

				cur = next;
			}
			_table[i] = nullptr;  
			//旧表中的结点值取完之后将此处的桶位置空
		}
		swap(newtable, _table);  //交换旧表和新表
	}

	else 
	{
		size_t index = hf(kv.first) % _table.size();  //计算映射位置
		Node* newNoed = new Node(kv);

		//头插做头
		newNoed->_next = _table[index];
		_table[index] = newNoed;
		_n++;
	}
	return true;
}

查找

计算映射出的这个位置,从此处开始遍历往后查找,直到找到返回该结点的地址,否则返回nullptr

HashNode<k,v>* Find(const k& key)
{
		HashFunc hf;
		if (_table.size() == 0) return nullptr;
		size_t index = hf(key) % _table.size();
		Node* cur = _table[index];
		while (cur) 
		{
			if (cur->_kv.first == key) return _table[index];
			cur = cur->_next;
		}
		return nullptr;
}

删除

通过key值计算出映射的位置,,按照单链表的删除结点逻辑处理就行

bool Erase(const k& key)
{
	HashFunc hf;

	size_t index = hf(key) % _table.size();
	Node* cur = _table[index];
	Node* prev = nullptr;
	while (cur)
	{
		if (cur->_kv.first == key) 
		{
			if (cur == _table[index]) _table[index] = cur->_next;
			else prev->_next = cur->_next;
			delete cur, --_n;
			return true;
		}

		prev = cur;
		cur = cur->_next;
	}
	return false;
}

获取素数

有些资料上讲的哈希表的大小开素数个会减少哈希冲突,这里我们就实现一个获取素数的函数,会根据实际传递的哈希表的size大小,返回对应的素数

//获取素数
size_t GetNextPrime(size_t prime)
{
	const int PRIMECOUNT = 28;
	//素数序列
	const size_t primeList[PRIMECOUNT] =
	{
		53ul, 97ul, 193ul, 389ul, 769ul,
		1543ul, 3079ul, 6151ul, 12289ul, 24593ul,
		49157ul, 98317ul, 196613ul, 393241ul, 786433ul,
		1572869ul, 3145739ul, 6291469ul, 12582917ul, 25165843ul,
		50331653ul, 100663319ul, 201326611ul, 402653189ul, 805306457ul,
		1610612741ul, 3221225473ul, 4294967291ul
	};
	size_t i = 0;
	for (i = 0; i < PRIMECOUNT; i++)
	{
		if (primeList[i] > prime)  //找出比prime大的素数
			return primeList[i];
	}
	return primeList[i];
}

unordered系列map、set模拟实现

unordered系列关联式容器

在C++98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时效率可达到 ( log N ),即最差情况下需要比较红黑树的高度次,当树中的节点非常多时,查询效率也不理想。最好的查询是,进行很少的比较次数就能够将元素找到,因此在C++11中,STL又提供了4个unordered系列的关联式容器,这四个容器与红黑树结构的关联式容器使用方式基本类似,只是其底层结构不同,本文中只对unordered_map和unordered_set进行介绍,unordered_multimap和unordered_multiset可查看文档介绍

unordered_map的文档介绍

  1. unordered_map是存储键值对的关联式容器,其允许通过keys快速的索引到与其对应的
    value。
  2. 在unordered_map中,键值通常用于惟一地标识元素,而映射值是一个对象,其内容与此键关联。键
    和映射值的类型可能不同。
  3. 在内部,unordered_map没有对按照任何特定的顺序排序, 为了能在常数范围内找到key所
    对应的value,unordered_map将相同哈希值的键值对放在相同的桶中。
  4. unordered_map容器通过key访问单个元素要比map快,但它通常在遍历元素子集的范围迭代方面效率
    较低。
  5. unordered_maps实现了直接访问操作符(operator[]),它允许使用key作为参数直接访问value。
  6. 它的迭代器至少是前向迭代器

哈希表结点结构

//key模型
template <class T>  
struct HashNode 
{
	HashNode(const T& data)
		: _data(data)
		, _next(nullptr)
	{}

	T _data;
	HashNode<T>* _next;
};

哈希表改造

template <class k, class T, class KeyOft,class HashFunc = Hash<k>>
class HashTable 
{
	friend struct __Iterator<k, T, KeyOft>;
	typedef  __Iterator<k, T, KeyOft> Iterator;  
	typedef HashNode<T> Node;
public:

	//拷贝构造
	HashTable(const HashTable<k, T, KeyOft>& hs)
	{
		HashTable<k, T, KeyOft> newtable(hs._table.size(), nullptr);
		for (size_t i = 0; i < _table.size(); i++) 
		{
			Node* cur = _table[i];
			while (cur) 
			{
				//以头插的方式赋值结点给newtable
				Node* next = cur->_next;
				Node* copy = new Node(cur->_data);
				copy->_next = _table[i];
				_table[i] = copy;
				++_n;  

				cur = next;
			}
			_table[i] = nullptr;
		}
		swap(newtable._table, _table);
	}
	//拷贝赋值
	void operator=(const HashTable<k, T, KeyOft>& hs)
	{
		swap(hs._table, _table);
		swap(hs._n, _n);
	}
	//析构
	~HashTable()
	{
		for (size_t i = 0; i < _table.size(); i++)
		{
			Node* cur = _table[i];
			while (cur)
			{
				Node* next = cur->_next;
				delete cur;
				cur = next;
			}
			_table[i] = nullptr;
		}
	}
	
	Iterator begin() 
	{
		for (size_t i = 0; i < _table.size(); i++) 
		{
			if (_table[i]) return Iterator(_table[i], this);
		}

		return end();
	}

	Iterator end()
	{
		return Iterator(nullptr, this);
	}

	//获取素数
	size_t GetNextPrime(size_t prime)
	{
		const int PRIMECOUNT = 28;
		//素数序列
		const size_t primeList[PRIMECOUNT] =
		{
			53ul, 97ul, 193ul, 389ul, 769ul,
			1543ul, 3079ul, 6151ul, 12289ul, 24593ul,
			49157ul, 98317ul, 196613ul, 393241ul, 786433ul,
			1572869ul, 3145739ul, 6291469ul, 12582917ul, 25165843ul,
			50331653ul, 100663319ul, 201326611ul, 402653189ul, 805306457ul,
			1610612741ul, 3221225473ul, 4294967291ul
		};
		size_t i = 0;
		for (i = 0; i < PRIMECOUNT; i++)
		{
			if (primeList[i] > prime)
				return primeList[i];
		}
		return primeList[i];
	}
	
	pair<Iterator, bool> insert(const T& x) 
	{

		KeyOft kf;  
		HashFunc hf; 

		if (Find(kf(x))._node)
		{
			return make_pair(Find(kf(x)), false);  //防止冗余
		}

		else if (_n == _table.size()) 
		{
			//开散列的负载因子到达1.0时需要调整(扩容 + 挂结点)
			//扩容 + 取原链接的结点挂到新的链表中

			size_t size = GetNextPrime(_table.size());
			vector<Node*> newtable(size, nullptr);
			//遍历旧的链表 + 将旧链表的结点取下来重新计算位置存入到新的链表中
			for (size_t i = 0; i < _table.size(); i++) 
			{
				Node* cur = _table[i];
				while (cur) 
				{
					Node* next = cur->_next;
					Node* copy = new Node(cur->_data);
					copy->_next = newtable[i];
					newtable[i] = copy;
					

					cur = next;
				}
				_table[i] = nullptr;
			}
			swap(newtable, _table);
		}

		size_t index = hf(kf(x)) % _table.size();  //计算映射位置
		Node* newNoed = new Node(x);

		//头插做头
		newNoed->_next = _table[index];
		_table[index] = newNoed;
		_n++;
		
		return make_pair(Iterator(_table[index], this),true);  //返回插入结点和true的pair结构
	}

	Iterator Find(const k& key)
	{
		KeyOft kf;
		HashFunc hf;
	                            
		if (_table.size() == 0) return Iterator(nullptr, this);
		size_t index = hf(key) % _table.size();
		Node* cur = _table[index];
		while (cur) 
		{
			if (kf(cur->_data) == key) return Iterator(cur,this);
			cur = cur->_next;
		}
		return Iterator(nullptr, this);
	}

	bool Erase(const k& key)
	{
		HashFunc hf;
		KeyOft kf;

		size_t index = hf(key) % _table.size();
		Node* cur = _table[index];
		Node* prev = nullptr;
		while (cur)
		{
			if (kf(cur->_data) == key) 
			{
				if (cur == _table[index]) _table[index] = cur->_next;
				else prev->_next = cur->_next;
				delete cur, --_n;
				return true;
			}

			prev = cur;
			cur = cur->_next;
		}
		return false;
	}

private:
	vector<Node*> _table;
	size_t _n = 0;
};

哈希表迭代器

//前置声明
template <class k, class T, class KeyOft, class HashFunc> class HashTable;
//哈希表的迭代器
template <class k, class T, class KeyOft, class HashFunc = Hash<k>>
struct __Iterator
{
	typedef HashTable<k, T, KeyOft, HashFunc> Ht;
	typedef __Iterator<k, T, KeyOft> Self;
	typedef HashNode<T> Node;
	Node* _node;  //记录结点的位置
	Ht* _pht;  //存放哈希表的地址
	
	__Iterator(Node* node, Ht *pht) //构造函数
		:_node(node)
		,_pht(pht)
	{ }	

	Self& operator++()
	{
		
		if (_node->_next) //当前桶还剩 > 1个结点
		{
			_node = _node->_next;
		}
		else //  //当前桶只剩 1个结点,需要找到下一个桶,将桶位置的_node赋值给this.node
		{
			//使用匿名对象
			size_t index = HashFunc() (KeyOft() (_node->_data)) % _pht->_table.size();//计算当前位置
			index++;  //从当前位置的下一个位置开始查找
			while (index < _pht->_table.size())
			{
				if (_pht->_table[index]) //找到后一个桶的位置就将值赋值给_node
				{
					_node = _pht->_table[index];  //将该位置桶的头节点赋值给_node
					return *this;
				}
				index++;  
			}
			_node = nullptr;
		}

		//走到此位置,表示已经遍历完了
		return *this;
	}
	//一下均是简易接口,重点还是前置++运算符
	T& operator*()  {return _node->_data;}
	T* operator->() {return &_node->_data;}
	bool operator!=(const Self& node)const { return _node != node._node; }
	bool operator==(Self& node)const { return _node == node._node; }
};

unordered_map模拟

namespace mzt 
{
	template<class k, class v>
	class unoddered_map 
	{
		struct MapKeyOft  
		{
			k operator()(const pair<k, v>& key)
			{
				return key.first;
			}
		};
		


	public:
		typedef typename mzt::__Iterator<k, pair<k,v>, MapKeyOft> Iterator;
		Iterator begin()  { return _hstable.begin(); }
		Iterator end()	{ return _hstable.end(); }
		
		pair<Iterator, bool> insert(const pair<k, v>& kv)
		{
			return _hstable.insert(kv);
		}

		
	private:
		mzt::HashTable<k, pair<k, v>, MapKeyOft> _hstable;
	};

	void map_test() 
	{
		int a[] = {1,4,5,78,56,6,3,4,11,21,30};
		unoddered_map<int, int> mp;
		for (auto& ref : a) mp.insert(make_pair(ref,ref));
		unoddered_map<int,int>::Iterator it = mp.begin();
		while (it != mp.end()) 
		{
			cout << it->first << " ";
			++it;
		}

	}
}

unordered_set模拟

namespace mzt
{
	template<class k>
	class unordered_set
	{
	
		struct SetKeyOft
		{
			k operator()(const k& key)
			{
				return key;
			}
		};
		
	public:
		typedef typename mzt::__Iterator<k, k, SetKeyOft> Iterator;
		Iterator begin() { return _hstable.begin(); }
		Iterator end() { return _hstable.end(); }

		pair<Iterator, bool> insert(const k& kv)
		{
			return _hstable.insert(kv);
		}


	private:
		mzt::HashTable<k, k, SetKeyOft> _hstable;
	};
	void set_test()
	{
		int a[] = { 1,4,5,78,56,6,3,4,11,21,30 };
		unordered_set<int> s;
		for (auto& ref : a) s.insert(ref);
		unordered_set<int>::Iterator it = s.begin();
		while (it != s.end())
		{
			cout << *it<< " ";
			++it;
		}
	}
}

哈希表和哈希桶模拟实现、封装unordered_map、unordered_set_第10张图片

你可能感兴趣的:(C++,散列表,哈希算法,数据结构)