gtyyky

【哈希】--unordered系列关联式容器

一、unordered系列关联式容器

在C++98中，STL提供了底层为红黑树结构的一系列关联式容器，在查询时效率可达到 $log_2N$ ，即最差情况下需要比较红黑树的高度次，当树中的节点非常多时，查询效率也不理想。最好的查询是，进行很少的比较次数就能够将元素找到，因此在C++11中，STL又提供了4个unordered系列的关联式容器，这四个容器与红黑树结构的关联式容器使用方式基本类似，只是其底层结构不同，本文对unordered_map和unordered_set进行介绍。

1.1 unordered_map

1.1.1 unordered_map的文档介绍

unordered_map在线文档说明

unordered_map是存储键值对的关联式容器，其允许通过keys快速的索引到与其对应的value。
在unordered_map中，键值通常用于唯一地标识元素，而映射值是一个对象，其内容与此键关联。键和映射值的类型可能不同。
在内部,unordered_map没有对按照任何特定的顺序排序, 为了能在常数范围内找到key所对应的value，unordered_map将相同哈希值的键值对放在相同的桶中。
unordered_map容器通过key访问单个元素要比map快，但它通常在遍历元素子集的范围迭代方面效率较低。
unordered_map实现了直接访问操作符(operator[])，它允许使用key作为参数直接访问value。
它的迭代器至少是前向迭代器。

1.1.2 unordered_map的接口说明

unordered_map的构造

函数声明	功能介绍
unordered_map	构造不同格式的unordered_map对象

unordered_map的容量

函数声明	功能介绍
bool empty() const	检测unordered_map是否为空
size_t size() const	获取unordered_map的有效元素个数

unordered_map的迭代器

函数声明	功能介绍
begin	返回unordered_map第一个元素的迭代器
end	返回unordered_map最后一个元素下一个位置的迭代器
cbegin	返回unordered_map第一个元素的const迭代器
cend	返回unordered_map最后一个元素下一个位置的const迭代器

unordered_map的元素访问

函数声明	功能介绍
operator[]	返回与key对应的value，没有一个默认值

注意：该函数中实际调用哈希桶的插入操作，用参数key与V()构造一个默认值往底层哈希桶中插入，如果key不在哈希桶中，插入成功，返回V()，插入失败，说明key已经在哈希桶中，将key对应的value返回。

unordered_map的查询

函数声明	功能介绍
iterator find(const K& key)	返回key在哈希桶中的位置
size_t count(const K& key)	返回哈希桶中关键码为key的键值对的个数

注意：unordered_map中key是不能重复的，因此count函数的返回值最大为1

unordered_map的修改操作

函数声明	功能介绍
insert	向容器中插入键值对
erase	删除容器中的键值对
void clear()	清空容器中有效元素个数
void swap(unordered_map&)	交换两个容器中的元素

unordered_map的桶操作

函数声明	功能介绍
size_t bucket_count() const	返回哈希桶中桶的总个数
size_t bucket_size(size_t n) const	返回n号桶中有效元素的总个数
size_t bucket(const K& key)	返回元素key所在的桶号

1.2 unordered_set

参见 unordered_set在线文档说明

二、底层结构

unordered系列的关联式容器之所以效率比较高，是因为其底层使用了哈希结构。

2.1 哈希概念

顺序结构以及平衡树中，元素关键码与其存储位置之间没有对应的关系，因此在查找一个元素时，必须要经过关键码的多次比较。顺序查找时间复杂度为O(N)，平衡树中为树的高度，即O( $log_2 N$ )，搜索的效率取决于搜索过程中元素的比较次数。
理想的搜索方法：可以不经过任何比较，一次直接从表中得到要搜索的元素。如果构造一种存储结构，通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立一一映射的关系，那么在查找时通过该函数可以很快找到该元素。
当向该结构中：

- 插入元素

根据待插入元素的关键码，以此函数计算出该元素的存储位置并按此位置进行存放

- 搜索元素

对元素的关键码进行同样的计算，把求得的函数值当做元素的存储位置，在结构中按此位置取元素比较，若关键码相等，则搜索成功。

该方式即为哈希(散列)方法，哈希方法中使用的转换函数称为哈希(散列)函数，构造出来的结构称为哈希表(Hash Table)(或者称散列表)

例如：数据集合{1，7，6，4，5，9}；
哈希函数设置为：hash(key) = key % capacity; capacity为存储元素底层空间总的大小。

用该方法进行搜索不必进行多次关键码的比较，因此搜索的速度比较快
问题：按照上述哈希方式，向集合中插入元素44，会出现什么问题？
答：44会和4出现哈希冲突。

2.2 哈希冲突

对于两个数据元素的关键字 $k_i$ 和 $k_j$ (i != j)，有 $k_i$ != $k_j$ ，但有：Hash( $k_i$ ) ==Hash( $k_j$ )，即：不同关键字通过相同哈希哈数计算出相同的哈希地址，该种现象称为哈希冲突或哈希碰撞。
把具有不同关键码而具有相同哈希地址的数据元素称为“同义词”。
发生哈希冲突该如何处理呢？

2.3 哈希函数

引起哈希冲突的一个原因可能是：哈希函数设计不够合理。
哈希函数设计原则：

哈希函数的定义域必须包括需要存储的全部关键码，而如果散列表允许有m个地址时，其值域必须在0到m-1之间
哈希函数计算出来的地址能均匀分布在整个空间中
哈希函数应该比较简单

常见哈希函数

直接定址法–(常用)
取关键字的某个线性函数为散列地址：Hash（Key）= A*Key + B
优点：简单、均匀
缺点：需要事先知道关键字的分布情况
使用场景：适合查找比较小且连续的情况
面试题：字符串中第一个只出现一次字符
除留余数法--(常用)
设散列表中允许的地址数为m，取一个不大于m，但最接近或者等于m的质数p作为除数，按照哈希函数：Hash(key) = key% p(p<=m),将关键码转换成哈希地址

注意：哈希函数设计的越精妙，产生哈希冲突的可能性就越低，但是无法避免哈希冲突

2.4 哈希冲突解决

解决哈希冲突两种常见的方法是：闭散列和开散列

2.4.1 闭散列

闭散列：也叫开放定址法，当发生哈希冲突时，如果哈希表未被装满，说明在哈希表中必然还有空位置，那么可以把key存放到冲突位置中的“下一个” 空位置中去。那如何寻找下一个空位置呢？
1. 线性探测
比如2.1中的场景，现在需要插入元素44，先通过哈希函数计算哈希地址，hashAddr为4，
因此44理论上应该插在该位置，但是该位置已经放了值为4的元素，即发生哈希冲突。
线性探测：从发生冲突的位置开始，依次向后探测，直到寻找到下一个空位置为止。

插入

通过哈希函数获取待插入元素在哈希表中的位置
如果该位置中没有元素则直接插入新元素，如果该位置中有元素发生哈希冲突，
使用线性探测找到下一个空位置，插入新元素
删除

采用闭散列处理哈希冲突时，不能随便物理删除哈希表中已有的元素，若直接删除元素会影响其他元素的搜索。比如删除元素4，如果直接删除掉，44查找起来可能会受影响。因此线性探测采用标记的伪删除法来删除一个元素。

// 哈希表每个空间给个标记
// EMPTY此位置空， EXIST此位置已经有元素， DELETE元素已经删除
enum State{EMPTY, EXIST, DELETE};

线性探测的实现

#pragma once
#include

//返回数据的key作为插入的下标
template<class K>
struct DefaultHashFunc
{
	size_t operator() (const K& key)
	{
		return (size_t)key;
	}
};

//string类型需要特化
template<>
struct DefaultHashFunc<string>
{
	size_t operator() (const string& str)
	{
		//BKDR
		size_t hash = 0;
		for (auto ch : str)
		{
			hash *= 131;//为了尽量避免出现abcd，acbd等情况出现哈希冲突
			hash += ch;
		}

		return hash;
	}
};

namespace open_address
{
	enum STATE
	{
		EXIST,
		EMPTY,
		DELETE
	};

	//每个哈希节点存数据和
	template<class K, class V>
	struct HashData
	{
		pair<K, V> _kv;
		STATE _state = EMPTY;
	};

	template<class K, class V, class HashFunc = DefaultHashFunc<K>>
	class HashTable
	{
	public:
		HashTable()
		{
			_table.resize(10);
		}

		bool Insert(const pair<K, V>& kv)
		{
			//利用Find函数判断要插入的key是否存在，存在的话直接返回false
			if (Find(kv.first))
			{
				return false;
			}

			//判断是否需要扩容
			if (_n * 10 / _table.size() >= 7)//负载因子大于0.7就进行扩容
			{
				size_t newsize = _table.size() * 2;//二倍扩容
				//创建新表
				HashTable<K, V, HashFunc> newHT;
				newHT._table.resize(newsize);
				//遍历旧表，重新映射到新表
				for (size_t i = 0; i < _table.size(); i++)
				{
					if (_table[i]._state == EXIST)
					{
						newHT.Insert(_table[i]._kv);//这一步插入会进行重新进行更合理的放置元素到哈希表
					}
				}

				//newHT是临时创建的，直接将这两个表交换
				_table.swap(newHT._table);
			}

			//线性探测
			HashFunc hf;
			size_t hashi = hf(kv.first) % _table.size();
			while (_table[hashi]._state == EXIST)
			{
				++hashi;
				hashi %= _table.size();//防止越界访问
			}
			_table[hashi]._kv = kv;
			_table[hashi]._state = EXIST;
			++_n;

			return true;
		}

		HashData<const K, V>* Find(const K& key)
		{
			//线性探测
			HashFunc hf;
			size_t hashi = hf(key) % _table.size();
			while (_table[hashi]._state != EMPTY)
			{
				if(_table[hashi]._state == EXIST    //这里要判断是否为EXIST，因为还有可能是DELETE状态
					&& _table[hashi]._kv.first == key)
				{
					return (HashData<const K, V>*) &_table[hashi];//将key强转为const类型
				}
						
				//hashi位置没有找到，继续往后查找
				++hashi;
				hashi %= _table.size();
			}

			//遍历完_table没有找到。返回空
			return nullptr;
		}

		//按需编译
		bool Erase(const K& key)
		{
			//利用Find函数找到要删除的位置
			HashData<const K, V>* ret = Find(key);
			//如果要删除的数存在，将他的状态变为DELETE，注意这里不能变为EMPTY，因为这会影响在删除之前插入的数的查找
			if (ret)
			{
				ret->_state = DELETE;
				--_n;
				return true;
			}
			//要删除的数据不在哈希表中
			return false;
		}

	private:
		vector<HashData<K, V>> _table;
		size_t _n = 0;// 存储有效数据的个数
	};
}

思考：哈希表什么情况下进行扩容？如何扩容？

			//判断是否需要扩容
			if (_n * 10 / _table.size() >= 7)//负载因子大于0.7就进行扩容
			{
				size_t newsize = _table.size() * 2;//二倍扩容
				//创建新表
				HashTable<K, V, HashFunc> newHT;
				newHT._table.resize(newsize);
				//遍历旧表，重新映射到新表
				for (size_t i = 0; i < _table.size(); i++)
				{
					if (_table[i]._state == EXIST)
					{
						newHT.Insert(_table[i]._kv);//这一步插入会进行重新进行更合理的放置元素到哈希表
					}
				}

				//newHT是临时创建的，直接将这两个表交换
				_table.swap(newHT._table);
			}

线性探测优点：实现非常简单，
线性探测缺点：一旦发生哈希冲突，所有的冲突连在一起，容易产生数据“堆积”，即：不同关键码占据了可利用的空位置，使得寻找某关键码的位置需要许多次比较，导致搜索效率降低。如何缓解呢？
2. 二次探测
线性探测的缺陷是产生冲突的数据堆积在一块，这与其找下一个空位置有关系，因为找空位置的方式就是挨着往后逐个去找，因此二次探测为了避免该问题，找下一个空位置的方法为： $H_i$ = ( $H_0$ + $i^2$ )% m, 或者： $H_i$ = ( $H_0$ - $i^2$ )% m。其中：i =1,2,3…， $H_0$ 是通过散列函数Hash(x)对元素的关键码 key 进行计算得到的位置，m是表的大小。
对于2.1中如果要插入44，产生冲突，使用解决后的情况为：

研究表明：当表的长度为质数且表装载因子a不超过0.5时，新的表项一定能够插入，而且任何一个位置都不会被探查两次。因此只要表中有一半的空位置，就不会存在表满的问题。在搜索时可以不考虑表装满的情况，但在插入时必须确保表的装载因子a不超过0.5，如果超出必须考虑增容。
因此：闭散列最大的缺陷就是空间利用率比较低，这也是哈希的缺陷。

2.4.2 开散列

1. 开散列概念
开散列法又叫链地址法(开链法)，首先对关键码集合用散列函数计算散列地址，具有相同地址的关键码归于同一子集合，每一个子集合称为一个桶，各个桶中的元素通过一个单链表链接起来，各链表的头结点存储在哈希表中。

从上图可以看出，开散列中每个桶中放的都是发生哈希冲突的元素。

2. 开散列实现

#pragma once
#include

//哈希函数
template<class K>
struct DefaultHashFunc
{
	size_t operator() (const K& key)
	{
		return (size_t)key;
	}
};
//string类型的哈希函数
//特化
template<>
struct DefaultHashFunc<string>
{
	size_t operator() (const string& str)
	{
		//BKDR
		size_t hash = 0;
		for (auto ch : str)
		{
			hash *= 131;
			hash += ch;
		}

		return hash;
	}
};


// 泛型编程：不是针对某种具体类型，针对广泛的类型(两种及以上) -- 模板
namespace hash_bucket
{
	//每个节点存储自身的数据和连接下一个节点
	template<class T>
	struct HashNode
	{
		T _data;
		HashNode<T>* _next;

		HashNode(const T& data)
			:_data(data)
			,_next(nullptr)
		{}
	};

	//前置声明,因为HTIterator需要用到HashTable，要用到HashTable的私有变量_table
	template<class K, class T, class KeyOfT, class HashFunc>
	class HashTable;

	template<class K, class T, class Ptr, class Ref,  class KeyOfT, class HashFunc>
	struct HTIterator
	{
		typedef HashNode<T> Node;
		typedef HTIterator<K, T,Ptr, Ref, KeyOfT, HashFunc> Self;//迭代器自身类型
		typedef HTIterator<K, T,T*,T&, KeyOfT, HashFunc> Iterator;//永远都是普通迭代器，用于普通迭代器构造const迭代器时使用

		Node* _node;
		const HashTable<K, T, KeyOfT, HashFunc>* _pht;//这里也要加上const，否则下面构造函数用const的pht初始化的时候会报错(权限放大)

		HTIterator(Node* node, const HashTable<K, T, KeyOfT, HashFunc>* pht)//这里第二个参数要加上const，因为const迭代器返回调用这个构造传入的this指针是const指针
			:_node(node)
			,_pht(pht)
		{}

		// 普通迭代器时，他是拷贝构造
		// const迭代器时，他是构造
		//如果拷贝构造函数的参数不是引用类型，而是传值（by value），这会触发另一个拷贝构造函数的调用，形成无限递归的循环，导致栈溢出或程序崩溃。
		//通过引用，拷贝构造函数只会获取源对象的引用，并不会触发额外的拷贝构造函数调用。另外，常量引用作为参数类型可以接受常量对象和非常量对象，使拷贝构造函数更加灵活
		HTIterator(const Iterator& it)//拷贝构造这里要加上引用(拷贝构造函数的参数类型必须是引用)
			:_node(it._node)
			,_pht(it._pht)
		{}

		Ref operator*()
		{
			return _node->_data;
		}

		Ptr operator->()
		{
			return &_node->_data;
		}

		Self& operator++()
		{
			if (_node->_next)
			{
				//当前桶还没完
				_node = _node->_next;
			}
			//当前桶完了，返回下一个不为空的桶的头节点
			else
			{
				KeyOfT kot;
				HashFunc hf;
				size_t hashi = hf(kot(_node->_data)) % _pht->_table.size();
				++hashi;
				//从下一个位置查找下一个不为空的桶
				while (hashi < _pht->_table.size())
				{
					//下一个位置的桶不为空，返回头节点
					if (_pht->_table[hashi])
					{
						_node = _pht->_table[hashi];
						return *this;
					}
					//下一个位置的桶为空，继续往后查找
					else
					{
						++hashi;
					}
				}
				//走到这里说明已经走到最后一个节点的下一个位置，要把他置为空指针，否则使用迭代器打印会一直循环打印最后一位节点
				_node = nullptr;
			}
			return *this;
		}

		bool operator!=(const Self& s)
		{
			return _node != s._node;
		}

		bool operator==(const Self& s)
		{
			return _node == s._node;
		}
	};

	// 1、哈希表
	// 2、封装map和set
	// 3、普通迭代器
	// 4、const迭代器
	// 5、insert返回值  operator[]
	// 6、key不能修改的问题

	template<class K, class T, class KeyOfT ,class HashFunc = DefaultHashFunc<K>>
	class HashTable
	{
		typedef HashNode<T> Node;
		
		//友元声明
		template<class K, class T,class Ptr, class Ref, class KeyOfT, class HashFunc>
		friend struct HTIterator;

	public:
		typedef HTIterator<K, T,T*,T&, KeyOfT, HashFunc> iterator;
		typedef HTIterator<K, T,const T*,const T&,KeyOfT, HashFunc> const_iterator;

		iterator begin()
		{
			//第一个桶
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				if (cur)
				{
					return iterator(cur, this);
				}
			}

			return iterator(nullptr, this);
		}

		iterator end()
		{
			return iterator(nullptr, this);
		}

		const_iterator begin() const
		{
			//第一个桶
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				if (cur)
				{
					return const_iterator(cur, this);
				}
			}

			return const_iterator(nullptr, this);
		}

		const_iterator end() const//这里的const修饰的是*this
		{
			return const_iterator(nullptr, this);
		}

		HashTable()
		{
			_table.resize(10, nullptr);
		}

		//为什么闭散列不需要自己写析构?
		//这里有动态开辟的节点，需要自己写析构函数
		~HashTable()
		{
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				while (cur)
				{
					Node* next = cur->_next;
					delete cur;
					cur = next;
				}

				_table[i] = nullptr;
			}
		}

		pair<iterator, bool> Insert(const T& data)
		{
			KeyOfT kot;
			iterator it = Find(kot(data));		
			if (it != end())
			{
				return make_pair(it, false);//要插入的数据已经存在，返回已经存在数据的迭代器和false
			}

			HashFunc hf;
			//负载因子到1就扩容
			if (_n == _table.size())
			{
				size_t newSize = _table.size() * 2;
				//创建一个newsize大小的table
				vector<Node*> newTable;
				newTable.resize(newSize, nullptr);

				// 遍历旧表，顺手牵羊，把节点牵下来挂到新表
				for (size_t i = 0; i < newTable.size(); i++)
				{
					Node* cur = _table[i];
					while (cur)
					{
						Node* next = cur->_next;
						//头插到新表
						size_t hashi = hf(kot(cur->_data)) % newTable.size();
						cur->_next = newTable[hashi];
						newTable[hashi] = cur;

						cur = next;
					}
					_table[i] = nullptr;//把旧表清空
				}
				_table.swap(newTable);
			}

			size_t hashi = hf(kot(data)) % _table.size();
			//头插
			Node* newnode = new Node(data);
			newnode->_next = _table[hashi];
			_table[hashi] = newnode;
			++_n;

			return make_pair(iterator(newnode,this),true);
		}

		iterator Find(const K& key)
		{
			HashFunc hf;
			KeyOfT kot;
			//找到key在的哈希桶
			size_t hashi = hf(key) % _table.size();
			Node* cur = _table[hashi];
			//遍历该哈希桶查找key的数据
			while (cur)
			{
				//找到数据，返回他的迭代器
				if (kot(cur->_data) == key)
				{
					return iterator(cur,this);
				}
				cur = cur->_next;
			}

			//找不到该数据
			return end();
		}

		bool Erase(const K& key)
		{
			HashFunc hf;
			KeyOfT kot;

			size_t hashi = hf(key) % _table.size();
			Node* prev = nullptr;
			Node* cur = _table[hashi];

			while (cur)
			{
				if (kot(cur->_data) == key)
				{
					//cur是头节点
					if (prev == nullptr)
					{
						_table[hashi] = cur->_next;
					}
					//cur是中间节点
					else
					{
						//将cur从当前哈希桶中断开
						prev->_next = cur->_next;
					}

					//找到要删除的节点，有效数据个数-1，释放要删除的节点，返回true
					--_n;
					delete cur;
					return true;
				}

				//记录前一个节点，方便删除的时候链接要删除节点的下一个节点
				prev = cur;
				cur = cur->_next;
			}

			//要删除的节点没有在当前的哈希表中，返回false
			return false;
		}

		void Print()
		{
			for (size_t i = 0; i < _table.size(); i++)
			{
				printf("[&d]->", i);
				Node* cur = _table[i];
				while (cur)
				{
					cout << cur->_kv.first << ":" << cur->_kv.second << "->";
					cur = cur->_next;
				}
				printf("NULL\n");
			}
			cout << endl;
		}
	private:
		vector<Node*> _table;//指针数组
		size_t _n = 0;//存储有效数据
	};

}

3. 开散列增容
桶的个数是一定的，随着元素的不断插入，每个桶中元素的个数不断增多，极端情况下，可能会导致一个桶中链表节点非常多，会影响的哈希表的性能，因此在一定条件下需要对哈希表进行增容，那该条件怎么确认呢？开散列最好的情况是：每个哈希桶中刚好挂一个节点，再继续插入元素时，每一次都会发生哈希冲突，因此，在元素个数刚好等于桶的个数时，可以给哈希表增容。

			HashFunc hf;
			//负载因子到1就扩容
			if (_n == _table.size())
			{
				size_t newSize = _table.size() * 2;
				//创建一个newsize大小的table
				vector<Node*> newTable;
				newTable.resize(newSize, nullptr);

				// 遍历旧表，顺手牵羊，把节点牵下来挂到新表
				for (size_t i = 0; i < newTable.size(); i++)
				{
					Node* cur = _table[i];
					while (cur)
					{
						Node* next = cur->_next;
						//头插到新表
						size_t hashi = hf(kot(cur->_data)) % newTable.size();
						cur->_next = newTable[hashi];
						newTable[hashi] = cur;

						cur = next;
					}
					_table[i] = nullptr;//把旧表清空
				}
				_table.swap(newTable);
			}

开散列的思考
1.只能存储key为整形的元素，其他类型怎么解决？

// 整形数据不需要转化
template<class K>
struct DefaultHashFunc
{
	size_t operator() (const K& key)
	{
		return (size_t)key;
	}
};
//string类型的哈希函数
//特化
// key为字符串类型，需要将其转化为整形
template<>
struct DefaultHashFunc<string>
{
	size_t operator() (const string& str)
	{
		//BKDR
		size_t hash = 0;
		for (auto ch : str)
		{
			hash *= 131;
			hash += ch;
		}

		return hash;
	}
};

	// 为了实现简单，我们将比较直接与元素绑定在一起
	template<class K, class V, class HashFunc = DefaultHashFunc<K>>
	class HashTable
	{
		//.........
			
		private:
		vector<Node*> _table;//指针数组
		size_t _n = 0;//存储有效数据
	}

2.除留余数法，最好模一个素数，如何每次快速取一个类似两倍关系的素数？

		size_t GetNextPrime(size_t prime)
		{
			static const int __stl_num_primes = 28;
			static const unsigned long __stl_prime_list[__stl_num_primes] =
			{
			  53,         97,         193,       389,       769,
			  1543,       3079,       6151,      12289,     24593,
			  49157,      98317,      196613,    393241,    786433,
			  1572869,    3145739,    6291469,   12582917,  25165843,
			  50331653,   100663319,  201326611, 402653189, 805306457,
			  1610612741, 3221225473, 4294967291
			};

			size_t i = 0;
			for (; i < PRIMECOUNT; ++i)
			{
				if (primeList[i] > prime)
					return primeList[i];
			}

			return primeList[i];
		}

字符串哈希算法
5. 开散列与闭散列比较
应用链地址法处理溢出，需要增设链接指针，似乎增加了存储开销。事实上：由于开地址法必须保持大量的空闲空间以确保搜索效率，如二次探查法要求装载因子a <= 0.7，而表项所占空间又比指针大的多，所以使用链地址法反而比开地址法节省存储空间。

3. 模拟实现

3.1 哈希表的改造

模板参数列表的改造

// K:关键码类型
// V: 不同容器V的类型不同，如果是unordered_map，V代表一个键值对，如果是unordered_set,V 为 K
// KeyOfValue: 因为V的类型不同，通过value取key的方式就不同，详细见unordered_map/set的实现
// HashFunc: 哈希函数仿函数对象类型，哈希函数使用除留余数法，需要将Key转换为整形数字才能取模
	template<class K, class T, class KeyOfT ,class HashFunc = DefaultHashFunc<K>>
	class HashTable

增加迭代器操作

	//前置声明,为了实现简单，HTIterator需要用到HashTable，要用到HashTable的私有变量_table
	template<class K, class T, class KeyOfT, class HashFunc>
	class HashTable;
	
	// 注意：因为哈希桶在底层是单链表结构，所以哈希桶的迭代器不需要--操作
	template<class K, class T, class Ptr, class Ref,  class KeyOfT, class HashFunc>
	struct HTIterator
	{
		typedef HashNode<T> Node;
		typedef HTIterator<K, T,Ptr, Ref, KeyOfT, HashFunc> Self;//迭代器自身类型
		typedef HTIterator<K, T,T*,T&, KeyOfT, HashFunc> Iterator;//永远都是普通迭代器，用于普通迭代器构造const迭代器时使用

		Node* _node;
		const HashTable<K, T, KeyOfT, HashFunc>* _pht;//这里也要加上const，否则下面构造函数用const的pht初始化的时候会报错(权限放大)

		HTIterator(Node* node, const HashTable<K, T, KeyOfT, HashFunc>* pht)//这里第二个参数要加上const，因为const迭代器返回调用这个构造传入的this指针是const指针
			:_node(node)
			,_pht(pht)
		{}

		// 普通迭代器时，他是拷贝构造
		// const迭代器时，他是构造
		//如果拷贝构造函数的参数不是引用类型，而是传值（by value），这会触发另一个拷贝构造函数的调用，形成无限递归的循环，导致栈溢出或程序崩溃。
		//通过引用，拷贝构造函数只会获取源对象的引用，并不会触发额外的拷贝构造函数调用。另外，常量引用作为参数类型可以接受常量对象和非常量对象，使拷贝构造函数更加灵活
		HTIterator(const Iterator& it)//拷贝构造这里要加上引用(拷贝构造函数的参数类型必须是引用)
			:_node(it._node)
			,_pht(it._pht)
		{}

		Ref operator*()
		{
			return _node->_data;
		}

		Ptr operator->()
		{
			return &_node->_data;
		}

		Self& operator++()
		{
		// 当前迭代器所指节点后还有节点时直接取其下一个节点
			if (_node->_next)
			{
				//当前桶还没完
				_node = _node->_next;
			}
			//当前桶完了，返回下一个不为空的桶的头节点
			else
			{
				KeyOfT kot;
				HashFunc hf;
				size_t hashi = hf(kot(_node->_data)) % _pht->_table.size();
				++hashi;
				//从下一个位置查找下一个不为空的桶
				while (hashi < _pht->_table.size())
				{
					//下一个位置的桶不为空，返回头节点
					if (_pht->_table[hashi])
					{
						_node = _pht->_table[hashi];
						return *this;
					}
					//下一个位置的桶为空，继续往后查找
					else
					{
						++hashi;
					}
				}
				//走到这里说明已经走到最后一个节点的下一个位置，要把他置为空指针，否则使用迭代器打印会一直循环打印最后一位节点
				_node = nullptr;
			}
			return *this;
		}

		bool operator!=(const Self& s)
		{
			return _node != s._node;
		}

		bool operator==(const Self& s)
		{
			return _node == s._node;
		}
	};

增加通过key获取value操作

	template<class K, class T, class KeyOfT ,class HashFunc = DefaultHashFunc<K>>
	class HashTable
	{
		typedef HashNode<T> Node;
		
		//友元声明
		template<class K, class T,class Ptr, class Ref, class KeyOfT, class HashFunc>
		friend struct HTIterator;

	public:
		typedef HTIterator<K, T,T*,T&, KeyOfT, HashFunc> iterator;
		typedef HTIterator<K, T,const T*,const T&,KeyOfT, HashFunc> const_iterator;

		iterator begin()
		{
			//第一个桶
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				if (cur)
				{
					return iterator(cur, this);
				}
			}

			return iterator(nullptr, this);
		}

		iterator end()
		{
			return iterator(nullptr, this);
		}

		const_iterator begin() const
		{
			//第一个桶
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				if (cur)
				{
					return const_iterator(cur, this);
				}
			}

			return const_iterator(nullptr, this);
		}

		const_iterator end() const//这里的const修饰的是*this
		{
			return const_iterator(nullptr, this);
		}

		size_t GetNextPrime(size_t prime)
		{
			static const int __stl_num_primes = 28;
			static const unsigned long __stl_prime_list[__stl_num_primes] =
			{
			  53,         97,         193,       389,       769,
			  1543,       3079,       6151,      12289,     24593,
			  49157,      98317,      196613,    393241,    786433,
			  1572869,    3145739,    6291469,   12582917,  25165843,
			  50331653,   100663319,  201326611, 402653189, 805306457,
			  1610612741, 3221225473, 4294967291
			};

			size_t i = 0;
			for (; i < PRIMECOUNT; ++i)
			{
				if (primeList[i] > prime)
					return primeList[i];
			}

			return primeList[i];
		}

		HashTable()
		{
			_table.resize(GetNextPrime(1), nullptr);
		}

		//为什么闭散列不需要自己写析构?
		//这里有动态开辟的节点，需要自己写析构函数
		~HashTable()
		{
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				while (cur)
				{
					Node* next = cur->_next;
					delete cur;
					cur = next;
				}

				_table[i] = nullptr;
			}
		}

		pair<iterator, bool> Insert(const T& data)
		{
			KeyOfT kot;
			iterator it = Find(kot(data));		
			if (it != end())
			{
				return make_pair(it, false);//要插入的数据已经存在，返回已经存在数据的迭代器和false
			}

			HashFunc hf;
			//负载因子到1就扩容
			if (_n == _table.size())
			{
				size_t newSize = GetNextPrime(_table.size());
				//创建一个newsize大小的table
				vector<Node*> newTable;
				newTable.resize(newSize, nullptr);

				// 遍历旧表，顺手牵羊，把节点牵下来挂到新表
				for (size_t i = 0; i < newTable.size(); i++)
				{
					Node* cur = _table[i];
					while (cur)
					{
						Node* next = cur->_next;
						//头插到新表
						size_t hashi = hf(kot(cur->_data)) % newTable.size();
						cur->_next = newTable[hashi];
						newTable[hashi] = cur;

						cur = next;
					}
					_table[i] = nullptr;//把旧表清空
				}
				_table.swap(newTable);
			}

			size_t hashi = hf(kot(data)) % _table.size();
			//头插
			Node* newnode = new Node(data);
			newnode->_next = _table[hashi];
			_table[hashi] = newnode;
			++_n;

			return make_pair(iterator(newnode,this),true);
		}

		iterator Find(const K& key)
		{
			HashFunc hf;
			KeyOfT kot;
			//找到key在的哈希桶
			size_t hashi = hf(key) % _table.size();
			Node* cur = _table[hashi];
			//遍历该哈希桶查找key的数据
			while (cur)
			{
				//找到数据，返回他的迭代器
				if (kot(cur->_data) == key)
				{
					return iterator(cur,this);
				}
				cur = cur->_next;
			}

			//找不到该数据
			return end();
		}

		bool Erase(const K& key)
		{
			HashFunc hf;
			KeyOfT kot;

			size_t hashi = hf(key) % _table.size();
			Node* prev = nullptr;
			Node* cur = _table[hashi];

			while (cur)
			{
				if (kot(cur->_data) == key)
				{
					//cur是头节点
					if (prev == nullptr)
					{
						_table[hashi] = cur->_next;
					}
					//cur是中间节点
					else
					{
						//将cur从当前哈希桶中断开
						prev->_next = cur->_next;
					}

					//找到要删除的节点，有效数据个数-1，释放要删除的节点，返回true
					--_n;
					delete cur;
					return true;
				}

				//记录前一个节点，方便删除的时候链接要删除节点的下一个节点
				prev = cur;
				cur = cur->_next;
			}

			//要删除的节点没有在当前的哈希表中，返回false
			return false;
		}

		void Print()
		{
			for (size_t i = 0; i < _table.size(); i++)
			{
				printf("[&d]->", i);
				Node* cur = _table[i];
				while (cur)
				{
					cout << cur->_kv.first << ":" << cur->_kv.second << "->";
					cur = cur->_next;
				}
				printf("NULL\n");
			}
			cout << endl;
		}
	private:
		vector<Node*> _table;//指针数组
		size_t _n = 0;//存储有效数据
	};
}

3.2 unordered_map


namespace gty
{
// unordered_map中存储的是pair的键值对，K为key的类型，V为value的类型
// unordered_map在实现时，只需将hashtable中的接口重新封装即可
	template<class K,class V>
	class unordered_map
	{
		// 通过key获取value的操作
		struct KeyOfMap
		{
			const K& operator()(const pair<const K, V>& kv)
			{
				return kv.first;
			}
		};
	public:
		typedef typename hash_bucket::HashTable<K, pair<const K, V>, KeyOfMap>::iterator iterator;
		typedef typename hash_bucket::HashTable<K, pair<const K, V>, KeyOfMap>::const_iterator const_iterator;
		iterator begin()
		{
			return _ht.begin();
		}

		iterator end()
		{
			return _ht.end();
		}

		const_iterator begin() const
		{
			return _ht.begin();
		}

		const_iterator end() const
		{
			return _ht.end();
		}
		
		//这里将insert返回值处理成pair是为了重载[]运算符
		pair<iterator, bool> insert(const pair<K, V>& kv)
		{
			return _ht.Insert(kv);
		}

		V& operator[](const K& key)
		{
			pair<iterator, bool> ret = _ht.Insert(make_pair(key, V()));//key存在就返回它的V，不存在就返回缺省值V()
			return ret.first->second;
		}

	private:
		hash_bucket::HashTable<K, pair<const K, V>, KeyOfMap> _ht;
	};

}

3.3 unordered_set

namespace gty
{
	template<class K>
	class unordered_set
	{
		struct KeyOfSet
		{
			const K& operator()(const K& key)
			{
				return key;
			}
		};
	public:
		typedef typename hash_bucket::HashTable<K, K, KeyOfSet>::const_iterator iterator;
		typedef typename hash_bucket::HashTable<K, K, KeyOfSet>::const_iterator const_iterator;

		const_iterator begin() const
		{
			return _ht.begin();
		}

		const_iterator end() const
		{
			return _ht.end();
		}

		//unordered_set中的iterator也是const_iterator，所以这里我们需要调用HashTable中的普通迭代器来接受
		//然后再利用HashTable中的普通迭代器构造const迭代器的构造函数，再进行返回
		pair<iterator,bool> insert(const K& key)
		{
			//return _ht.Insert(key);
			pair<typename hash_bucket::HashTable<K,K,KeyOfSet>::iterator, bool>  ret = _ht.Insert(key);
			return pair<const_iterator, bool>(ret.first, ret.second);
		}
	private:
		hash_bucket::HashTable<K, K, KeyOfSet> _ht;
	};
}

你可能感兴趣的:(C++,哈希算法,算法)

树1 树的同构 C++实现
树1树的同构C++实现#题目给定两棵树T1和T2。如果T1可以通过若干次左右孩子互换就变成T2，则我们称两棵树是“同构”的。例如图1给出的两棵树就是同构的，因为我们把其中一棵树的结点A、B、G的左右孩子互换后，就得到另外一棵树。而图2就不是同构的。图1图2现给定两棵树，请你判断它们是否是同构的。输入格式:输入给出2棵二叉树树的信息。对于每棵树，首先在一行中给出一个非负整数N(≤10)，即该树的结点
【图像分割】基于模糊聚类FCM和改进的模糊聚类算法实现CT图像分割matlab代码天天Matlab科研工作室图像处理 Matlab各类代码算法聚类 matlab
1简介医学影像分割的基本目标是将图像分割成不同的解剖组织，从而可以从背景中提取出感兴趣区域。因为图像的低分辨率和弱对比度，实现医学影像分割是一件具有挑战的任务。而且，这个任务由于噪声和伪阴影变得更加困难，这些干扰项可能是因器材限制、重建算法和患者移动等原因造成的。目前还没有通用的医学图像分割算法，算法的优点和缺点经常根据所研究的问题而变化。将分割概念具体到颅内出血CT图像上，就是将颅腔中的出血病灶
FPGA通信设计十问
1.FFT有什么用？FFT（快速傅里叶变换）是离散傅里叶变换（DFT）的高效实现算法，它的核心作用是快速将信号从时域转换到频域，从而简化信号分析和处理的过程。自然界的信号（如声音、图像、电磁波等）通常以时域形式存在（即随时间变化的波形），但很多特性（如频率成分、谐波分布）在频域中更易分析FFT能快速计算信号中各频率分量的幅值和相位。可以进行频率拆分与实时处理。FFT是“信号的透视镜”，让我们能“看
C++ 数组详解：从基础到实战光の java jvm 前端
一、数组的定义与核心特性（一）什么是数组？数组（Array）是C++中用于存储一组相同类型元素的连续内存空间。它通过一个统一的名称（数组名）和索引（下标）来访问每个元素，是实现批量数据管理的基础工具。（二）核心特性特性说明同类型所有元素必须是同一数据类型（如int、double）连续性元素在内存中连续存放，地址递增（&arr[i+1]=&arr[i]+sizeof(类型)）固定大小数组声明时需指定
Java与机器学习的邂逅：Weka框架入门指南墨夶 Java学习资料1 java 机器学习数据挖掘
在这个数据驱动的时代，机器学习已经成为各行业创新和优化的关键技术。而Java，作为一门成熟且广泛应用的编程语言，在企业级应用开发中占据着重要地位。将二者结合起来，利用Java实现机器学习算法，不仅可以充分发挥其强大的生态系统优势，还能为开发者提供一个高效、稳定的开发环境。今天，我们将带您走进Java与机器学习的世界，探索如何使用Weka这一著名的机器学习库来开启您的智能之旅。Weka简介及其优势什
（C++）list，vector，set，map四种容器的应用——教务管理系统（测试版）（list基础教程）（vector基础教程）（set基础教程）（map基础教程）（STL库教程）双叶836 STL C++C++基础教学 C++项目 c++list 开发语言数据结构 c语言
目录源代码：代码详解：第1步：搭建基础框架和数据结构目标：定义数据结构和全局容器练习任务：第2步：实现学生管理功能（使用map）目标：添加学生和显示学生列表练习任务：第3步：实现课程管理功能（使用vector）目标：添加课程和显示课程列表练习任务：第4步：实现选课功能（使用list）目标：学生选课和退课功能练习任务：主函数：多说一点（重点代码解释）：一.list>enrollments;代码详解1
FPGA相关通信问题详解霖12 fpga开发笔记信号处理信息与通信学习开发语言
首先感谢大佬@征途黯然.-CSDN博客的就我的上篇文章《FPGA通信设计十问》提出的问题，我在此做出回复一.解释FFT（快速傅里叶变换）如何在FPGA的IP核中高效实现FFT作为将时域信号转换为频域的核心算法，其在FPGA中的高效实现依赖于硬件架构与算法特性的深度适配。1.流水线架构：提升吞吐量FFT的核心是“蝶形运算”，其计算过程可分解为log2(N)级（N为FFT点数），每级包含N/2次蝶形运
华为OD机考 2025C卷 - 围棋的气 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试2025C卷华为OD机考2025C卷华为OD2025C卷
围棋的气华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述围棋棋盘由纵横各19条线垂直相交组成，棋盘上一共19x19=361个交点，对弈双方一方执白棋，一方执黑棋，落子时只能将棋子置于交点上。“气”是围棋中很重要的一个概念，某个棋子有几口气，是指其上下左右方向四个相邻的交叉点中，有几个交叉点没有棋子，由此可知：在棋
华为OD机考 2025C卷 - 对称美学 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试2025C卷华为OD2025C卷华为OD机考2025C卷
对称美学华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述对称就是最大的美学，现有一道关于对称字符串的美学。已知：第1个字符串：R第2个字符串：BR第3个字符串：RBBR第4个字符串：BRRBRBBR第5个字符串：RBBRBRRBBRRBRBBR相信你已经发现规律了，没错！就是第i个字符串=第i-1号字符串取反+第
华为OD机试 2025 B卷 - We are a Team (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机考2025B卷华为OD机试2025B卷华为OD机试
WeareaTeam华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：消息构成为abc，整数a、b分别代表两个人的标号，整数c代表指令c==0代表a和b在一个团队内c==1
华为OD 面试手撕真题目录无限码力华为OD面试手撕代码真题合集华为od 面试华为OD面试手撕真题
华为OD面试手撕真题目录，收集的都是实际面试出现过的手撕代码真题，对于是力扣原题的我会在对应题目博客中给出对应对应链接，推荐自己写代码去通过。华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解目录序号题目名称考点1求1-n的最小公倍数数学原理2判断是IPV4还是IPV6字符串、模拟3旋转矩阵模拟4
数据并表技术全面指南：从基础JOIN到分布式数据融合熊猫钓鱼>_> 分布式
引言在现代数据处理和分析领域，数据并表（TableJoin）技术是连接不同数据源、整合分散信息的核心技术。随着企业数据规模的爆炸式增长和数据源的日益多样化，传统的数据并表方法面临着前所未有的挑战：性能瓶颈、内存限制、数据倾斜、一致性问题等。如何高效、准确地进行大规模数据并表，已成为数据工程师和架构师必须掌握的关键技能。数据并表不仅仅是简单的SQLJOIN操作，它涉及数据建模、算法优化、分布式计算、
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录推荐算法系统系列二算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南更多技术内容总结推荐算法系统系列二算
c语言找出递增子数组的长度,C语言实现最长递增子序列问题的解决方法梁肖松 c语言找出递增子数组的长度
本文实例展示了C语言实现最长递增子序列问题的解决方法。分享给大家供大家参考。具体方法如下：问题描述：给定一个序列，找出其最长递增子序列长度。比如输入1375输出3算法解决思路：利用动态规划的思想，以序列的每个点最为最右端，找出每个点作为最右端时的子序列长度的最大值，即问题的求解。因此，在计算前面的每个点的时候，将其结果保存下来，后面的点与前面的点的数值进行比较，如果大，则在其长度基础上加1，并且找
基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解
基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解文章目录基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解1.RELM原理2.分类问题求解3.基于探路者算法优化的RELM4.实验结果5.Matlab代码1.RELM原理极限学习机(ELM)具有训练速度快、泛化性能好的优点。极限学习机的结构是一种典型的单隐层前馈神经网络(SLFN)。极限学习机的结构见图RELM算法：若NNN
基于探路者算法优化的核极限学习机(KELM)分类算法智能算法研学社（Jack旭）智能优化算法应用机器学习 #核极限学习机（KELM）算法分类数据挖掘
基于探路者算法优化的核极限学习机(KELM)分类算法文章目录基于探路者算法优化的核极限学习机(KELM)分类算法1.KELM理论基础2.分类问题3.基于探路者算法优化的KELM4.测试结果5.Matlab代码摘要：本文利用探路者算法对核极限学习机(KELM)进行优化，并用于分类1.KELM理论基础核极限学习机（KernelBasedExtremeLearningMachine，KELM）是基于极限
LeetCode第337题_打家劫舍III @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习
LeetCode第337题：打家劫舍III文章摘要本文详细解析LeetCode第337题"打家劫舍III"，这是一道中等难度的二叉树动态规划问题。文章提供了基于深度优先搜索和动态规划的解法，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合想要提升二叉树和动态规划能力的程序员。核心知识点：二叉树、动态规划、深度优先搜索难度等级：中等推荐人群：具有基础数据结构知识，想要提
c++学习 | MFC —— 串口通信（一）串口设置驚蟄_ c++mfc c++学习
文章目录一、目标二、使用步骤1.打开串口2.设置串口3.显示串口状态3.关闭串口3.串口设置更改事件4.打开关闭串口按钮三、完整代码一、目标实现串口通信的上位机。二、使用步骤1.打开串口头文件.h中public://自定义变量HANDLEm_hCom;//串口句柄volatileintm_bConnected;//串口连接成功指示public://串口相关函数BOOLOpenComm(intNum
C++ | 基于PCL与CloudCompare的投影点密度法（DOPP）开发实战河工点云智绘WangG 点云深处 CloudCompare &PCL开发 c++开发语言
一、算法原理与详细步骤1.算法原理DOPP是一种用于点云地面滤波的算法，通过将三维点云投影到二维平面，并分析投影点密度的分布特征来区分地面点与非地面点（如植被、建筑物等）。其核心思想是：地面点在投影平面上通常呈现均匀且低密度的分布，而建筑物点等非地面点则密度高。DOPP本质是二维密度场分析，将三维分离问题转化为二维空间密度统计问题。2.算法详细步骤（1）点云投影（Projection）将三维点云沿
C++ | 玩转点云：CloudCompare & PCL原生开发核心指南与示例分享河工点云智绘WangG 点云深处 CloudCompare &PCL开发 c++开发语言
还在为点云处理的效率瓶颈和功能限制发愁吗？面对点云处理个性需求，是否让你感到束手束脚？调试困难、性能受限、定制化需求难以满足...本次分享将带你深入核心，走进点云深处，揭秘如何直接运用C++进行CloudCompare&PCL的原生集成开发。掌握核心步骤，规避常见陷阱，并附实用开发示例源码。助你：效率飙升：直达底层，性能最大化！灵活无限：自由定制算法流程，深度集成业务逻辑！掌控全局：彻底理解框架机
Java:对给定的字符串和给定的模式执行Boyer-Moore搜索算法（附带源码） Katie。 Java算法完整教程 java 开发语言
一、项目背景详细介绍在文本处理与信息检索中，需要在海量文本中高效地查找模式串（Pattern）。经典的朴素搜素在最坏情况下时间复杂度为O(N·M)，效率不够高。Boyer–Moore算法则采用“坏字符”与“好后缀”两种启发规则，从模式尾部匹配开始，通常能大幅跳过不可能匹配的位置，平均时间复杂度接近O(N/M)，在实际应用（如grep、数据库索引）中非常高效。本项目旨在用Java实现Boyer–Mo
Java:实现Ternary search三元搜索算法（附带源码） Katie。 Java算法完整教程算法
一、项目背景详细介绍在计算机科学与软件工程领域，查找算法是最基础也是最重要的模块之一。对于有序数组的查找，经典的二分（Binary）查找算法凭借O(log N)的时间复杂度在许多场景中被广泛应用。另一方面，三元（Ternary）查找作为对二分查找的扩展，将区间划分为三段，每次比对两个“探测点”而非一个，从理论上也能达到对数级时间复杂度。三元查找常用于以下几种场景：函数极值查找当我们要在一个unim
全平台兼容+3倍加载提速：GISBox将重新定义三维可视化标准 GISBox GISBox GISBox 纹理压缩数字孪生智慧城市 3DTiles 三维可视化 BIM
在智慧城市、数字孪生、BIM工程等领域的三维可视化浪潮中，模型加载卡顿、存储成本高、跨平台兼容差已成为行业痛点。无论是Web端的实时渲染，还是移动端的户外作业，高精度模型与低性能设备之间的矛盾，始终制约着项目的落地效率。而GISBox的纹理压缩功能，正是破解这一难题的“金钥匙”——它通过算法革新与硬件加速，让超大规模三维模型“瘦身”80%，加载速度提升3倍，真正实现“轻量化、高性能、全兼容”的三维
实现按字典顺序查找的 Booth 算法（Java） CyberXZ java 算法 python
实现按字典顺序查找的Booth算法（Java）Booth算法是一种用于按字典顺序查找的算法，它通过比较目标字符串与排序好的字符串数组中的元素来找到匹配的位置。在这篇文章中，我将介绍并给出一个Java实现的Booth算法，并附上相应的源代码。首先，让我们来了解Booth算法的基本思想。该算法的核心是利用了字符串的字典顺序特性。假设我们有一个已经排序好的字符串数组，我们需要查找的目标字符串。我们可以通
Leetcode 06 java im_AMBER leetcode java
136.只出现一次的数字题目给你一个非空整数数组nums，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。你必须设计并实现线性时间复杂度的算法来解决此问题，且该算法只使用常量额外空间。示例1：输入：nums=[2,2,1]输出：1示例2：输入：nums=[4,1,2,1,2]输出：4示例3：输入：nums=[1]输出：1提示：1map=newHashMapentry
全面的学生成绩管理系统设计与实现柴木头 B2B电商
本文还有配套的精品资源，点击获取简介：学生成绩管理系统是一个教育管理工具，利用QT平台和C++语言开发，支持高校和教育机构进行学生成绩的记录、统计和分析。系统包含用户管理、课程管理、成绩录入与查询、统计分析、数据备份与恢复以及安全权限控制等核心模块。开发者需遵循良好的编程规范，进行单元测试和集成测试，确保系统的稳定性和可靠性。1.学生成绩管理系统概述系统的定义与功能学生成绩管理系统是为了简化教师和
零基础搭建免费IP代理池：从原理到实战的保姆级指南傻啦嘿哟关于代理IP那些事儿 tcp/ip 网络协议网络
目录一、代理池的核心价值与底层原理二、环境搭建全流程详解2.1开发环境准备2.2核心组件安装三、核心配置深度解析3.1配置文件精要（setting.py）3.2自定义代理源开发四、核心模块实现原理4.1调度系统架构4.2代理验证算法五、运维实战技巧5.1性能优化策略5.2故障排查手册六、安全加固方案七、扩展升级路径八、典型问题解决方案九、性能基准测试十、合规使用指南一、代理池的核心价值与底层原理在
力扣算法学习(简单) 绿龙蛋算法 leetcode 学习
(每题第一个代码仅供参考,后面是官方题解)1.两数之和题目:给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以按任意顺序返回答案。示例1：输入：nums=[2,7,11,15],target=9输出：[0,1]解释：因为nums[0]+nums[1
力扣题目算法分类【持续更新】 Gene_INNOCENT 比赛题解各类重要算法讲解力扣算法分类
基础算法二分704.二分查找-简单-整数二分34.在排序数组中查找元素的第一个和最后一个位置-中等69.x的平方根-简单-浮点二分287.寻找重复数-中等-二分答案410.分割数组的最大值-困难-二分答案4.寻找两个正序数组的中位数-困难
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>