【C++】哈希(unordered系列关联式容器)

【C++】哈希(unordered系列关联式容器)_第1张图片


目录

一、unordered系列的关联式容器

二、unordered系列容器

1、unordered_set

2、unordered_map

三、树形结构和哈希结构插入删除查找性能比较

四、哈希的底层结构

1、哈希结构

2、常见哈希函数

五、闭散列(开放定址法)

1、线性探测

1.1线性探测的插入、查找、删除

1.2线性探测的负载因子(70%-80%)及扩容方式

1.3如何将key值转整型

2、二次探测

六、开散列(拉链法、哈希桶)

1、开散列的概念

2、开散列的负载因子(100%)及扩容方式

七、闭散列和开散列整体代码

八、使用开散列对unordered_set和unordered_map就行封装

1、HashTable.h

2、Unordered_Set.h

3、Unorderer_Map.h


一、unordered系列的关联式容器

在C++98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时效率可达到logN,最差情况下也仅需要比较红黑树的高度次,当树中的节点非常多时,查询效率也不理想。因此在C++11中,STL又提供了4个unordered系列的关联式容器,这四个容器与红黑树结构的关联式容器使用方式基本类似,只是其底层结构不同,unordered系列容器并不是有序的。

树状关联式容器对key的要求是比较大小,哈希对key的要求是转成整型,用于取模。它们都是通过仿函数来实现的。

二、unordered系列容器

1、unordered_set

【C++】哈希(unordered系列关联式容器)_第2张图片

unordered_set并不像set那样支持反向迭代器,它的迭代器底层是一个单向迭代器。 其他功能与set类似。

unordered_set的插入是无序的,不一定按照插入的顺序进行打印。自带去重功能。

2、unordered_map

【C++】哈希(unordered系列关联式容器)_第3张图片

单向迭代器+无序。其他功能与map类似。

三、树形结构和哈希结构插入删除查找性能比较

红黑树的插入删除查找性能都是O(logN)而哈希表的插入删除查找性能理论上都是O(1),他是相对于稳定的,最差情况下都是高效的。哈希表的插入删除操作的理论上时间复杂度是常数时间的,这有个前提就是哈希表不发生数据碰撞。在发生碰撞的最坏的情况下,哈希表的插入和删除时间复杂度为O(n)。

四、哈希的底层结构

1、哈希结构

顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素时,必须要经过关键码的多次比较。顺序查找时间复杂度为O(N),平衡树中为树的高度,即O(logN),搜索的效率取决于搜索过程中元素的比较次数。

理想的搜索方法:那么可以不经过任何比较,一次直接从表中得到想要搜索的元素?

如果构造一种存储结构,通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立一一映射的关系,那么在查找时通过该函数可以很快找到该元素。在哈希表中插入或查找的方法就叫做哈希函数

2、常见哈希函数

1. 直接定址法--(常用)

取关键字的某个线性函数为散列地址:Hash(Key)= A*Key + B

优点:简单、均匀

缺点:需要事先知道关键字的分布情况

使用场景:适合查找比较小且连续的情况(范围集中

2. 除留余数法--(常用)

设散列表中允许的地址数为m,取一个不大于m,但最接近或者等于m的质数p作为除数,

按照哈希函数:Hash(key) = key% p(p<=m),将关键码转换成哈希地址

缺点:可能会存在哈希冲突(哈希碰撞)

哈希函数:1、闭散列(开放定址法)2、开散列(拉链法/哈希桶)

五、闭散列(开放定址法)

1、线性探测

1.1线性探测的插入、查找、删除

【C++】哈希(unordered系列关联式容器)_第4张图片

18模10应将18放在数组下标为8的位置。8模10也应当将8放在数组下标为8的位置,但是这个坑位已经被18占了,此时发生哈希冲突,需要将8放在18的后面,8一直往后找,哪个位置没人就放在哪个位置。

【C++】哈希(unordered系列关联式容器)_第5张图片

但是每一个坑位其实有三种状态:坑位为空、坑位不为空、坑位是一个被删除的数据。

现在需要删除27,只需要找到27并将其状态标志位修改为删除状态即可,并不用真正的清除数据,但要注意的是,27的值还在,我们再次对27进行查找,需要先判断27的标志位,不然27明明删掉了,你还说找到了,那就离谱了。

1.2线性探测的负载因子(70%-80%)及扩容方式

对于线性探测,是不会让这个数组处于充满的状态,需要控制负载因子保证数组长期处于相对恒定的充满率。

负载因子=表中有效数据的个数/表的大小。负载因子越大,虽然空间利用率越高,但下一次插入时发生哈希冲突的概率越高!

如何扩容:因为扩容后,表的大小变大,根据映射公式hashi=key%tablesize,整个数组的映射关系全部被改变,所以扩容时,需要将原有数据一个一个的重新映射进新数组。

1.3如何将key值转整型

size_t hashi = hf(kv.first) % _tables.size();

哈希的核心就是取模,所以key需要能够被取模。一般来说,哈希的key都是整型或字符串,所以这里写了两个仿函数来将外部类型转换为size_t和string类型。

如果使用其他自定义类型充当key,需要自己仿函数,传入哈希。

【C++】哈希(unordered系列关联式容器)_第6张图片

template 
struct HashData//存储哈希的数据
{
	std::pair _kv;//存储节点的数据
	State _state = EMPTY;//节点的状态
};
template 
struct HashFunc//仿函数,控制hashi取模操作,把相近类型转为整型
{
	size_t operator()(const K& key)
	{
		return (size_t)key;
	}
};
template <>//模板的特化 
struct HashFunc
{
	size_t operator()(const std::string& key)
	{
		size_t hash = 0;//通过格式计算string的值
		//for (auto& ch : key)//直接相加哈希冲突概率大
		//{
		//	hash += ch;
		//}
		for (auto& ch : key)
		{
			hash = hash * 31 + ch;//也可以乘31,131,1313,13131,131313
		}
		return hash;
	}
};

对于string类型转整形,不能单纯的使用字符相加的方式进行转换,因为“abc”和“acb”依照字符串相加后的整型值是一样的,这就造成了哈希冲突。下面是一个大佬设计BKDR哈希算法,极大地降低了哈希冲突。

【C++】哈希(unordered系列关联式容器)_第7张图片

原文链接:各种字符串哈希函数

2、二次探测

线性探测是start+i(加0,加1,加2,加3)

而二次探测就是start+i^2(加0,加1,加4,加9)

当然二次探测同样没有从本质上解决问题,还是存在占别人坑位的情况。于是就提出了开散列(哈希桶)。

六、开散列(拉链法、哈希桶)

unorder系统列的底层用的就是开散列。

1、开散列的概念

开散列法又叫链地址法(开链法),首先对关键码集合用散列函数计算散列地址,具有相同地址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中。

【C++】哈希(unordered系列关联式容器)_第8张图片

2、开散列的负载因子(100%)及扩容方式

【C++】哈希(unordered系列关联式容器)_第9张图片

官方文档中规定开散列的负载因子是1,负载因子是1的意思是当哈希表的size等于节点数量时,就需要扩容了。

if(_tables.size()==_n)
{
    //HashTable newHT;
    //newHT._tables.resize(_tables.size() * 2);
    //for (auto& cur : _tables)//遍历表,不为空说明有桶
    //{
    //	while (cur)
    //	{
    //		依次取出旧表的数据插入新表
    //		newHT.Insert(cur->_kv);
    //		cur = cur->_next;
    //	}
    //}
    //_tables.swap(newHT._tables);
    std::vector newtables;
    newtables.resize(2 * _tables.size(), nullptr);//
    for (size_t i = 0; i < _tables.size(); ++i)
    {
        Node* cur = _tables[i];
        while (cur)
        {
            Node* next = cur->_next;
            size_t hashi = Hash()(cur->_kv.first) % newtables.size();
            cur->_next = newtables[hashi];
            newtables[hashi] = cur;
            cur = next;
        }
        _tables[i] = nullptr;//旧表置空。防止析构
    }
    _tables.swap(newtables);
}
~HashTable()//析构函数,释放桶
{
    for (size_t i = 0; i < _tables.size(); ++i)
    {
        Node* cur = _tables[i];
        while (cur)
        {
            Node* next = cur->_next;
            delete cur;
            cur = next;
        }
        _tables[i] = nullptr;
    }
}

这里是两种扩容写法,注释掉的那一种是把原表的节点拷贝一份插入到新的哈希表,全部元素映射完毕后再交换哈希表。未注释的那种写法是通过修改哈希桶中单链表的指针指向,直接摘取原表元素,同样映射完毕后交换哈希表,没有拷贝构造的过程。不过用的时候记得将原表中的指向置空,否则藕断丝连,原表被交换后会发生析构,因为指向关系没有断,造成刚插入的数据全部被清空。

为啥闭散列不能必须老老实实的拷贝?因为闭散列中的哈希表存的是值,开散列中存的是节点,节点可以摘下来,值不能摘啊。

扩容时不一定是两倍,为了一定程度上缓解哈希冲突,stl底层给了扩容的数组大小,均为素数且近似两倍。不过别人拿到你的扩容源码,可以专门设置一组连续冲突的数据来恶心你(比如力扣刷题你用unordered系列。。。)。

【C++】哈希(unordered系列关联式容器)_第10张图片

当哈希桶的节点挂载过多时,查找效率逐渐变低,像Java会在哈希桶节点数大于8时,将哈希桶的底层由单链表切换为红黑树。

七、闭散列和开散列整体代码

#pragma once
#include 
#include 
template 
struct HashFunc//仿函数,控制hashi取模操作,把相近类型转为整型
{
	size_t operator()(const K& key)
	{
		return (size_t)key;
	}
};
template <>//模板的特化 
struct HashFunc < std::string >
{
	size_t operator()(const std::string& key)
	{
		size_t hash = 0;//通过格式计算string的值
		//for (auto& ch : key)//直接相加哈希冲突概率大
		//{
		//	hash += ch;
		//}
		for (auto& ch : key)
		{
			hash = hash * 31 + ch;//也可以乘31,131,1313,13131,131313
		}
		return hash;
	}
};
namespace closeHash
{
	enum State
	{
		EMPTY,
		EXIST,
		DELTE
	};
	template 
	struct HashData//存储哈希的数据
	{
		std::pair _kv;//存储节点的数据
		State _state = EMPTY;//节点的状态
	};
	template >//Hash:把key转换为可以取模的整型
	class HashTable
	{
		typedef HashData Data;
	public:
		HashTable()
			:_n(10)
		{
			_tables.resize(10);
		}
		bool Insert(const std::pair& kv)
		{
			if (Find(kv.first) != nullptr)
				return false;
			//大于标定的负载因子,就扩容
			if (_n * 10 >= 7 * _tables.size())
			{
				HashTable newHT;
				newHT._tables.resize(_tables.size() * 2);
				for (auto& e : _tables)
				{
					if (e._state == EXIST)
					{
						newHT.Insert(e._kv);
					}
				}
				_tables.swap(newHT._tables);
			}
			Hash hf;
			size_t hashi = hf(kv.first) % _tables.size();//找到首先要插入的位置。如果kv.first是string呢?如何取模?
			while (_tables[hashi]._state == EXIST)   //先将string转化为整数,再进行取模操作?应该用仿函数
			{
				++hashi;//线性探测
				hashi %= _tables.size();

			}
			//走到这里就是删除或空
			_tables[hashi]._kv = kv;
			_tables[hashi]._state = EXIST;
			++_n;
			return true;
		}
		Data* Find(const K& key)
		{
			Hash hf;
			size_t hashi = hf(key) % _tables.size();
			while (_tables[hashi]._state != EMPTY)/
			{
				if (_tables[hashi]._state == EXIST && _tables[hashi]._kv.first == key)//存在且为key
					return &_tables[hashi];
				else
					++hashi;
				hashi %= _tables.size();
			}
			return nullptr;
		}
		bool Erase(const K& key)
		{
			Data* ret = Find(key);
			if (ret != nullptr)
			{
				ret->_state = DELTE;
				--_n;
				return true;
			}
			return false;
		}
	private:
		std::vector _tables;
		size_t _n = 0;//表中存储的有效数据的个数
	};
	void HashTest()
	{
		HashTable ht;
		int a[] = { 18,8,7,27,57,3,38,18 };
		for (auto& e : a)
		{
			ht.Insert(std::make_pair(e, e));
		}
		ht.Insert(std::make_pair(17, 17));
		ht.Insert(std::make_pair(5, 5));

		std::cout << ht.Find(7) << std::endl;
		std::cout << ht.Find(8) << std::endl;
		ht.Erase(7);
		std::cout << ht.Find(7) << std::endl;
		std::cout << ht.Find(8) << std::endl;
	}
}
namespace buckets
{
	template
	struct HashNode
	{
		std::pair _kv;
		HashNode* _next;

		HashNode(const std::pair& kv)
			:_kv(kv)
			, _next(nullptr)
		{}
		
	};
	template >
	class HashTable
	{
		typedef HashNode Node;
	public:
		HashTable()
			:_n(0)
		{
			_tables.resize(__stl_next_prime(0));
		}
		~HashTable()//释放桶
		{
			for (size_t i = 0; i < _tables.size(); ++i)
			{
				Node* cur = _tables[i];
				while (cur)
				{
					Node* next = cur->_next;
					delete cur;
					cur = next;
				}
				_tables[i] = nullptr;
			}
		}
		bool Insert(const std::pair& kv)
		{
			if (Find(kv.first))
				return false;
			//负载因子控制在1,超过就扩容
			if(_tables.size()==_n)
			{
				//HashTable newHT;
				//newHT._tables.resize(_tables.size() * 2);
				//for (auto& cur : _tables)//遍历表,不为空说明有桶
				//{
				//	while (cur)
				//	{
				//		依次取出旧表的数据插入新表
				//		newHT.Insert(cur->_kv);
				//		cur = cur->_next;
				//	}
				//}
				//_tables.swap(newHT._tables);
				std::vector newtables;
				//newtables.resize(2 * _tables.size(), nullptr);//不是2倍扩容
				newtables.resize(__stl_next_prime(_tables.size()), nullptr);
				for (size_t i = 0; i < _tables.size(); ++i)
				{
					Node* cur = _tables[i];
					while (cur)
					{
						Node* next = cur->_next;
						size_t hashi = Hash()(cur->_kv.first) % newtables.size();
						cur->_next = newtables[hashi];
						newtables[hashi] = cur;
						cur = next;
					}
					_tables[i] = nullptr;//旧表置空。防止析构
				}
				_tables.swap(newtables);
			}
			size_t hashi = Hash()(kv.first) % _tables.size();
			//找到插入位置就头插至桶中
			Node* newNode = new Node(kv);
			newNode->_next = _tables[hashi];//_tables[hashi]存的是第一个元素的地址
			_tables[hashi] = newNode;
			++_n;
			return true;
		}
		Node* Find(const K& key)
		{
			size_t hashi = Hash()(key) % _tables.size();
			Node* cur = _tables[hashi];
			while (cur)
			{
				if (cur->_kv.first != key)
				{
					cur = cur->_next;
				}
				else
					return cur;
			}
			return nullptr;
		}
		bool Erase(const K& key)
		{
			size_t hashi = Hash()(key) % _tables.size();
			Node* cur = _tables[hashi];
			Node* prev = nullptr;
			while (cur)
			{
				
				Node* next = cur->_next;
				if (cur->_kv.first == key)
				{
					delete cur;
					if (prev == nullptr)
					{
						_tables[hashi] = next;
					}
					else
					{
						prev->_next = next;
					}
					--_n;
					return true;
				}
				prev = cur;
				cur = next;
			}
			return false;
		}
		inline unsigned long __stl_next_prime(unsigned long n)
		{
			static const int __stl_num_primes = 28;
			static const unsigned long __stl_prime_list[__stl_num_primes] =
			{
				53, 97, 193, 389, 769,
				1543, 3079, 6151, 12289, 24593,
				49157, 98317, 196613, 393241, 786433,
				1572869, 3145739, 6291469, 12582917, 25165843,
				50331653, 100663319, 201326611, 402653189, 805306457,
				1610612741, 3221225473, 4294967291
			};

			for (int i = 0; i < __stl_num_primes; ++i)
			{
				if (__stl_prime_list[i] > n)
				{
					return __stl_prime_list[i];
				}
			}

			return __stl_prime_list[__stl_num_primes - 1];//否则返回设定的最大值,够用了
		}
	private:
		std::vector _tables;//需要写析构,释放单链表的节点
		size_t _n = 0;
	};
	void HashTest()
	{
		HashTable ht;
		int a[] = { 18,8,7,27,57,3,38,18 ,17,88,38,28,48 };
		for (auto& e : a)
		{
			ht.Insert(std::make_pair(e, e));
		}
		ht.Insert(std::make_pair(5, 5));
		ht.Erase(5);
	}
} 

八、使用开散列对unordered_set和unordered_map就行封装

1、HashTable.h

#pragma once
#include 
#include 
template 
struct HashFunc//仿函数,控制hashi取模操作,把相近类型转为整型
{
	size_t operator()(const K& key)
	{
		return (size_t)key;
	}
};
template <>//模板的特化 
struct HashFunc < std::string >
{
	size_t operator()(const std::string& key)
	{
		size_t hash = 0;//通过格式计算string的值
		//for (auto& ch : key)//直接相加哈希冲突概率大
		//{
		//	hash += ch;
		//}
		for (auto& ch : key)
		{
			hash = hash * 31 + ch;//也可以乘31,131,1313,13131,131313
		}
		return hash;
	}
};
namespace closeHash
{
	enum State
	{
		EMPTY,
		EXIST,
		DELTE
	};
	template 
	struct HashData//存储哈希的数据
	{
		std::pair _kv;//存储节点的数据
		State _state = EMPTY;//节点的状态
	};
	template >//Hash:把key转换为可以取模的整型
	class HashTable
	{
		typedef HashData Data;
	public:
		HashTable()
			:_n(10)
		{
			_tables.resize(10);
		}
		bool Insert(const std::pair& kv)
		{
			if (Find(kv.first) != nullptr)
				return false;
			//大于标定的负载因子,就扩容
			if (_n * 10 >= 7 * _tables.size())
			{
				HashTable newHT;
				newHT._tables.resize(_tables.size() * 2);
				for (auto& e : _tables)
				{
					if (e._state == EXIST)
					{
						newHT.Insert(e._kv);
					}
				}
				_tables.swap(newHT._tables);
			}
			Hash hf;
			size_t hashi = hf(kv.first) % _tables.size();//找到首先要插入的位置。如果kv.first是string呢?如何取模?
			while (_tables[hashi]._state == EXIST)   //先将string转化为整数,再进行取模操作?应该用仿函数
			{
				++hashi;//线性探测
				hashi %= _tables.size();

			}
			//走到这里就是删除或空
			_tables[hashi]._kv = kv;
			_tables[hashi]._state = EXIST;
			++_n;
			return true;
		}
		Data* Find(const K& key)
		{
			Hash hf;
			//size_t hashi = hf(key) % _tables.size();
            size_t starti=hashi;
			while (_tables[hashi]._state != EMPTY)/
			{
				if (_tables[hashi]._state == EXIST && _tables[hashi]._kv.first == key)//存在且为key
					return &_tables[hashi];
				else
					++hashi;
				hashi %= _tables.size();
                //极端场景下,没有空,全是存在或删除状态
                if(hashi==starti)
                {
                    break;
                }
			}
			return nullptr;
		}
		bool Erase(const K& key)
		{
			Data* ret = Find(key);
			if (ret != nullptr)
			{
				ret->_state = DELTE;
				--_n;
				return true;
			}
			return false;
		}
	private:
		std::vector _tables;
		size_t _n = 0;//表中存储的有效数据的个数
	};
	void HashTest()
	{
		HashTable ht;
		int a[] = { 18,8,7,27,57,3,38,18 };
		for (auto& e : a)
		{
			ht.Insert(std::make_pair(e, e));
		}
		ht.Insert(std::make_pair(17, 17));
		ht.Insert(std::make_pair(5, 5));

		std::cout << ht.Find(7) << std::endl;
		std::cout << ht.Find(8) << std::endl;
		ht.Erase(7);
		std::cout << ht.Find(7) << std::endl;
		std::cout << ht.Find(8) << std::endl;
	}
}
namespace buckets
{
	template
	struct HashNode
	{
		//std::pair _kv;
		T _data;
		HashNode* _next;

		HashNode(const T& data)
			:_data(data)
			, _next(nullptr)
		{}
		
	};  
	//哈希表引用迭代器,迭代器引用哈希表的类型,相互引用,需要先前置声明
	template 
	class HashTable;
	template 
	struct __HTIterator
	{
		typedef HashNode Node;
		typedef __HTIterator Self;
		typedef HashTable HT;
		Node* _node;
		HT* _ht;
		__HTIterator(Node* node,HT* ht)
			:_node(node)
			,_ht(ht)
		{}
		Self& operator++()
		{
			if (_node->_next)
			{
				_node = _node->_next;
			}
			else//当前桶走完了,需要找下一个桶
			{
				KeyOfT kot;
				Hash hash;
				size_t hashi = hash(kot(_node->_data))%(_ht->_tables.size());//等价于Hash()(KeyOfT()(_node->_data))
				++hashi;//因为迭代器++是找下一个元素,这个桶走完了,跳过当前hashi
				while (hashi<_ht->_tables.size())//如果hashi没越界
				{
					if (_ht->_tables[hashi]) //哈希表不为空
					{
						_node = _ht->_tables[hashi];
						break;
					}
					++hashi;
				}
				//说明没有桶了,找完了找不到
				if (hashi == _ht->_tables.size())
					_node = nullptr;
			}
			return *this;
		}
		T& operator*()
		{
			return _node->_data;
		}
		T* operator->()
		{
			return &(_node->_data);
		}
		bool operator!=(const Self& it)const
		{
			return _node != it._node;
		}
		
	};
	template 
	class HashTable
	{
		template 
		friend struct __HTIterator;
		typedef HashNode Node;
	public:
		typedef __HTIterator iterator;
		iterator begin()
		{
			for (size_t i = 0; i < _tables.size(); ++i)
			{
				if (_tables[i] != nullptr)
					return iterator(_tables[i], this);
			}
			return iterator(nullptr, this);
		}
		iterator end()
		{
			return iterator(nullptr, this);
		}
		HashTable()
			:_n(0)
		{
			_tables.resize(__stl_next_prime(0));
		}
		~HashTable()//释放桶
		{
			for (size_t i = 0; i < _tables.size(); ++i)
			{
				Node* cur = _tables[i];
				while (cur)
				{
					Node* next = cur->_next;
					delete cur;
					cur = next;
				}
				_tables[i] = nullptr;
			}
		}
		std::pair Insert(const T& data)
		{
			KeyOfT kot;
			iterator it = Find(kot(data));
			if (it!=end())//说明找到了相同元素。返回false
				return std::make_pair(it,false);
			//负载因子控制在1,超过就扩容
			if(_tables.size()==_n)
			{
				//HashTable newHT;
				//newHT._tables.resize(_tables.size() * 2);
				//for (auto& cur : _tables)//遍历表,不为空说明有桶
				//{
				//	while (cur)
				//	{
				//		依次取出旧表的数据插入新表
				//		newHT.Insert(cur->_kv);
				//		cur = cur->_next;
				//	}
				//}
				//_tables.swap(newHT._tables);
				std::vector newtables;
				//newtables.resize(2 * _tables.size(), nullptr);//不是2倍扩容
				newtables.resize(__stl_next_prime(_tables.size()), nullptr);
				for (size_t i = 0; i < _tables.size(); ++i)
				{
					Node* cur = _tables[i];
					while (cur)
					{
						Node* next = cur->_next;
						size_t hashi = Hash()(kot(cur->_data)) % newtables.size();
						cur->_next = newtables[hashi];
						newtables[hashi] = cur;
						cur = next;
					}
					_tables[i] = nullptr;//旧表置空。防止析构
				}
				_tables.swap(newtables);
			}
			size_t hashi = Hash()(kot(data)) % _tables.size();
			//找到插入位置就头插至桶中
			Node* newNode = new Node(data);
			newNode->_next = _tables[hashi];//_tables[hashi]存的是第一个元素的地址
			_tables[hashi] = newNode;
			++_n;
			return std::make_pair(iterator(newNode,this),true);
		}
		iterator Find(const K& key)
		{
			KeyOfT kot;
			size_t hashi = Hash()(key) % _tables.size();
			Node* cur = _tables[hashi];
			while (cur)
			{
				if (kot(cur->_data) != key)
				{
					cur = cur->_next;
				}
				else
					return iterator(cur,this);
			}
			return iterator(nullptr,this);
		}
		bool Erase(const K& key)
		{
			size_t hashi = Hash()(key) % _tables.size();
			Node* cur = _tables[hashi];
			Node* prev = nullptr;
			while (cur)
			{
				
				Node* next = cur->_next;
				if (cur->_kv.first == key)
				{
					delete cur;
					if (prev == nullptr)
					{
						_tables[hashi] = next;
					}
					else
					{
						prev->_next = next;
					}
					--_n;
					return true;
				}
				prev = cur;
				cur = next;
			}
			return false;
		}
		inline unsigned long __stl_next_prime(unsigned long n)
		{
			static const int __stl_num_primes = 28;
			static const unsigned long __stl_prime_list[__stl_num_primes] =
			{
				53, 97, 193, 389, 769,
				1543, 3079, 6151, 12289, 24593,
				49157, 98317, 196613, 393241, 786433,
				1572869, 3145739, 6291469, 12582917, 25165843,
				50331653, 100663319, 201326611, 402653189, 805306457,
				1610612741, 3221225473, 4294967291
			};

			for (int i = 0; i < __stl_num_primes; ++i)
			{
				if (__stl_prime_list[i] > n)
				{
					return __stl_prime_list[i];
				}
			}

			return __stl_prime_list[__stl_num_primes - 1];//否则返回设定的最大值,够用了
		}
	private:
		std::vector _tables;//需要写析构,释放单链表的节点
		size_t _n = 0;
	};
	/*void HashTest()
	{
		HashTable ht;
		int a[] = { 18,8,7,27,57,3,38,18 ,17,88,38,28,48 };
		for (auto& e : a)
		{
			ht.Insert(std::make_pair(e, e));
		}
		ht.Insert(std::make_pair(5, 5));
		ht.Erase(5);
	}*/
} 

2、Unordered_Set.h

#pragma once
#include "HashTable.h"
namespace jly
{
	template >//K:key;Hash:将key转为整型的仿函数
	class unordered_set
	{
		struct SetKeyOfT
		{
			const K& operator()(const K& key)
			{
				return key;
			}
		};
	public:
		typedef typename buckets::HashTable::iterator iterator;
		iterator begin()
		{
			return _ht.begin();
		}
		iterator end()
		{
			return _ht.end();
		}
		iterator Find(const K& key)
		{
			return _ht.Find(key);
		}
		bool erase(const K& key)
		{
			return _ht.Erase(key);
		}
		std::pair Insert(const K& data)
		{
			return _ht.Insert(data);
		}

	private:
		buckets::HashTable _ht;
	};
	void test_unordered_set()
	{
		unordered_set us;
		us.Insert(3);
		us.Insert(13);
		us.Insert(23);
		us.Insert(5);
		us.Insert(5);
		us.Insert(6);
		us.Insert(106);
		us.Insert(53);

		unordered_set::iterator it = us.begin();
		while (it != us.end())
		{
			std::cout << *it << " ";
			++it;
		}
		std::cout << std::endl;
		for (auto& e : us)
		{
			std::cout << e << " ";
		}
	}
}

3、Unorderer_Map.h

#pragma once
#include "HashTable.h"
namespace jly
{

	template >//Hash:将key转为整型的仿函数
	class unordered_map
	{
		struct MapKeyOfT
		{
			const K& operator()(const std::pair& kv)
			{
				return kv.first;
			} 
		};
	public:
		typedef typename buckets::HashTable, Hash, MapKeyOfT>::iterator iterator;
		std::pair Insert(const std::pair& data)
		{
			return _ht.Insert(data);
		}
		V& operator[](const K& key)
		{
			std::pair ret = _ht.Insert(std::make_pair(key, V()));
			return  ret.first->second;

		}
		iterator Find(const K& key)
		{
			return _ht.Find(key);
		}
		bool erase(const K& key)
		{
			return _ht.Erase(key);
		}
		iterator begin()
		{
			return _ht.begin();
		}
		iterator end()
		{
			return _ht.end();
		}
	private:
		buckets::HashTable,Hash, MapKeyOfT> _ht;
	};
	void test_unordered_map()
	{
		std::string arr[] = { "牛奶", "水罐", "冰", "牛奶", "冰", "水罐", 
			"冰", "冰", "冰", "木头", "冰", "木头" };

		unordered_map countMap;
		for (auto& e : arr)
		{
			countMap[e]++;
		}

		for (const auto& kv : countMap)
		{
			std::cout << kv.first << ":" << kv.second << std::endl;
		}
	}
}

你可能感兴趣的:(C++,哈希算法,c++,算法,java,前端)