wanglx2012

哈希表之bkdrhash算法解析及扩展

BKDRHASH是一种字符哈希算法,像BKDRHash，APHash，DJBHash，JSHash，RSHash，SDBMHash，PJWHash，ELFHash等等,这些都是比较经典的，通过http://blog.csdn.net/wanglx_/article/details/40300363（字符串哈希函数）这篇文章，我们可知道，BKDRHash是比较好的一个获取哈希值的方法。下面就讲解这个BKDRHash函数是如何推导实现的。

当我看到BKDRHash的代码时，不禁就疑惑了，这里面有个常数Seed，取值为31、131等，为什么要这么取，我取其他的值不行吗？还有为什么要将每个字符相加，并乘以这个Seed？这些到底是什么含义？最后想了老半天都是不得其解，最后绕进素数里面出不来了……最后在一位牛人的指点下，才茅塞顿开，下面把我的想法和推导过程记录如下。

BKDRHash计算公式的推导

由一个字符串（比如：ad）得到其哈希值，为了减少碰撞，应该使该字符串中每个字符都参与哈希值计算，使其符合雪崩效应，也就是说即使改变字符串中的一个字节，也会对最终的哈希值造成较大的影响。我们直接想到的办法就是让字符串中的每个字符相加，得到其和SUM，让SUM作为哈希值，如SUM（ad）= a+d;可是根据ascii码表得知a(97)+d(100)=b(98)+c(99)，那么发生了碰撞，我们发现直接求和的话会很容易发生碰撞，那么怎么办哪？我们可以对字符间的差距进行放大，乘以一个系数：

SUM(ad) =系数1 * a + 系数2 * d

SUM(bc)= 系数1 * b + 系数2 * c

系数1不等于系数2，这样SUM(ad)等于SUM(bc)的概率就会大大减小。

可是我们的字符串不可能只有两位或者三位，我们也不可能为每个系数去人为的赋值，但是字符串中有位数的顺序，比如在”ab”中，b是第0位，a是第1位,那么我们可以用系数的n次方作为每个字符的系数，但这个系数不能为1:

SUM(ad) =系数^1 * a + 系数^0 * d

SUM(bc)= 系数^1 * b + 系数^0 * c

这样我们就大大降低了碰撞的发生，下面我们假设有个字符数组p，有n个元素，那么

即:

下面就是这个“系数”取值的问题，取什么值那？从上面的分析来看，取除1之外的什么值都可以，我们知道整数不是奇数就是偶数，为了便于推算我们将偶数分为2的幂的偶数和非2的幂的偶数，也就是分3种取值讨论

系数的推导

现在我们的任务是推导系数的值，分2的幂的偶数、非2的幂的偶数、奇数三个部分讨论。

a. 取2的幂

假如我们取32，也就是2^5，那么我们计算SUM(ad)和SUM(bc)结果如下:

结果不同，有效处理了碰撞。

但是当我们进一步测试会发现，当我们取SUM(ahijklmn)和SUM(hijklmn)时计算得:

取SUM(abhijklmn)和SUM(abchijklmn)时计算得:

SUM(abcdefghijklmn)和SUM(123456hijklmn)时计算得:

我们会发现，只要最末尾的”hijklmn”这几个字符不变，不管前面怎么变，得到的哈希值都是一样的，完全碰撞了！这是为什么那？

首先哈希值SUM的存储类型用什么？当然用unsignedint ,因为值会很大，unsigned int 是32位，而只要计算就可能会溢出，CPU对于溢出的处理是抛弃最高位，比如两个unsigned int 的值相加结果为33位，那么最高位33位就会被抛弃，那么我们对上面的情况进行计算:

计算SUM(ahijklmn)和SUM(bhijklmn)：

SUM(ahijklmn)= 32^7*a + 32^6*h + 32^5*I + 32^4*j + 32^3*k + 32^2*l + 32^1*m + 32^0*n

SUM(bhijklmn)= 32^7*b + 32^6*h + 32^5*I + 32^4*j + 32^3*k + 32^2*l + 32^1*m + 32^0*n

将32换为2^5得：

SUM(ahijklmn)= 2^35*a + 2^30*h + 2^25*I + 2^20*j + 2^15*k + 2^10*l + 2^5*m + 2^0*n

SUM(bhijklmn)= 2^35*b + 2^30*h + 2^25*I + 2^20*j + 2^15*k + 2^10*l + 2^5*m + 2^0*n

由此可知SUM(ahijklmn)和SUM(bhijklmn)都大于unsignedint所能表达的最大值，所以需要抛弃最高位，也就是对0x100000000(也就是2^33)取余，根据同余定理：

(a+b)%m= (a%m + b%m)%m

(a*b)%m= (a%m * b%m)%m

可知

SUM(ahijklmn)%2^33 = (2^35*a% 2^33 + 2^30*h% 2^33 + … + 2^0*n%2^33)% 2^33

SUM(bhijklmn)%2^33 = (2^35*b % 2^33 + 2^30*h % 2^33 + … + 2^0*n%2^33) 2^33

2^35*a% 2^33和 2^35*b % 2^33 为零，所以因溢出被CPU舍弃，得

SUM(ahijklmn)%2^33 = (2^30*h% 2^33 + … + 2^0*n% 2^33) 2^33

SUM(bhijklmn)%2^33 = (2^30*h % 2^33 + … + 2^0*n% 2^33) 2^33

最终他们的哈希值为

SUM(ahijklmn)= 2^30*h + 2^25*I + 2^20*j + 2^15*k + 2^10*l + 2^5*m + 2^0*n

SUM(bhijklmn)= 2^30*h + 2^25*I + 2^20*j + 2^15*k + 2^10*l + 2^5*m + 2^0*n

所以SUM(ahijklmn)等于SUM(bhijklmn)，这就是为什么” hijklmn”不变时，不管前面是什么字符串都会被舍弃，得到一样的字符串。这里用的是32=2^5，只要你用2^n，n不管为多少都不行，都会因为字符串的长度达到一定值而造成前面的被舍弃，造成一直碰撞。

b. 取非2的幂的偶数

既然去取2的幂不行，那么我们取非2的幂的偶数，假如我们取6作为系数，6为2^2+2，我们由上面取2的幂的推导可知，当字符的长度大于等于33时，系数就会变为6^32=3*2^33，可知系数大于2^32，对2^33取余，被舍弃，那么造成只要后32个字符不变，前面不管有多少个同的字符，都会被舍弃，计算所得的哈希值也就一样。

由上面两块可知，系数取偶数行不通

c. 取奇数（大于1）

假如我们取9=2^3+1，9^2=81=80+1，9^3=729=728+1，… ，9^n=9^n-1+1，我们知道9的幂肯定是奇数，那么9^n-1肯定为偶数，由上面的推论可知字符串达到一定的长度时，偶数系数前面的字符是可以舍弃的，可是9^n=9^n-1+1，最后的1是永远不会被舍弃的，所以每个字符都会参与运算，取大于1的奇数可行。

结论

由上面三步的推导可知，这个系数应当选择大于1的奇数，这样可以很好的降低碰撞的几率，那么我们就可以根据上面推导的公式，用代码实现:

bkdrhash的初步代码实现如下:

#include <iostream>
#include <MATH.H>

unsigned int str_hash_1(const char* s)
{
	unsigned char *p = (unsigned char*)s;
	unsigned int hash = 0;
	unsigned int seed = 3;//3,5,7,9,...,etc奇数
	unsigned int nIndex = 0;
	unsigned int nLen = strlen((char*)p);
	while( *p )
	{
		hash = hash + pow(3,nLen-nIndex-1)*(*p);
		++p;
		nIndex++;
	}
	return hash;
}

int main(int argc, char* argv[])
{
	std::cout << str_hash_1("hijklmn")<<std::endl;
	std::cout << str_hash_1("bhijklmn")<<std::endl;
	getchar();
	return 0;
}

其实我们可以对代码进行简化，即利用递归进行实现，但是在使用bkdrhash时你会发现里面大多源码使用的都是特殊的奇数2^n-1，那是因为在CPU的运算中移位和减法比较快。代码如下:

#include <iostream>

unsigned int bkdr_hash(const char* key)
{
	char* str = const_cast<char*>(key);
			
	unsigned int seed = 31; // 31 131 1313 13131 131313 etc.. 37
	unsigned int hash = 0;
	while (*str)
	{
		hash = hash * seed + (*str++);
	}
	return hash;
}

int main(int argc, char* argv[])
{
	std::cout << bkdr_hash("hijklmn")<<std::endl;
	std::cout << bkdr_hash("bhijklmn")<<std::endl;
	getchar();
	return 0;
}

扩展

注意：即使最终求得的bkdrhash值几乎不会冲突碰撞，但他们都是很大的值，不可能直接映射到哈希数组地址上，所以一般都是直接对哈希数组大小取余，以余数作为索引地址，但是这就造成了，可能的地址冲突。bkdrhash值不一样，但是取余后得到的索引地址一样，也就是冲突，只是这种冲突的概率很小。对于哈希表不可能完全消除碰撞，只能降低碰撞的几率。作为对哈希知识的进一步熟悉，下面罗列几点提升哈希表效率的注意点:

1.选用的哈希函数

哈希函数的目的就是为了产生譬如字符串的哈希值，让不同的字符串尽量产生不同的哈希值的函数就是好的哈希函数，完全不会产生相同的哈希函数就是完美的。

2.处理冲突的方法

处理冲突的方法有多种，拉链法、线性探测等，我喜欢用拉链法

3.哈希表的大小

这个哈希表的大小是固定的，但可以动态调整，也就是创建个新的数组，用旧的给新的循环重新计算Key赋值，删除旧的。但最好根据需求数据量设置足够大的初始值，防止动态调整的频繁，因为调整是很费时又费空间的。还有重要的是，这个哈希表的大小要设为一个质数，为什么是质数？因为质数只有1和它本身两个约数，当用bkdrhash算得的key对哈希表大小取余时，不会因为存在公约数而缩小余数的范围，如果余数范围缩小的话，就会加大碰撞的几率(说法有点牵强，知道的童鞋请给个合理的解释)。

4.装载因子，即哈希表的饱和程度

一般来说装载因子越小越好，装载因子越小，碰撞也就越小，哈希表的速度就会越快，可是这样会大大的浪费空间，假如装载因子为0.1，那么哈希表只有10%的空间被真正利用，其余的90%都浪费了，这就是时间和空间的矛盾点，为了平衡，现在大部分采用的是0.75作为装载因子，装载因子达到0.75，那么就动态增加哈希表的大小。

哈希表的初步C++封装实现

//my_hash_map.h
//哈希表的初步实现
//参考互联网资料实现
#pragma once
#define HASH_MAX_STRING_LEN 128
#include <WINDOWS.H>
template<typename objectType> 
class my_strhash_map
{
protected:
	struct Assoc 
	{
		Assoc()
		{
			memset(sKey,0,HASH_MAX_STRING_LEN);
			pData = NULL;
			pNext = NULL;
		}
		char sKey[HASH_MAX_STRING_LEN];
		objectType* pData;
		Assoc* pNext;
	};

	typedef Assoc* LPAssoc;
public:
	struct iterator 
	{
		friend class my_strhash_map;
		iterator()
		{
			m_pIter = NULL;
			m_nIndex = 0;
			m_pMap = NULL;
		}
		//前缀，如++i
		iterator& operator++()
		{
			if ( m_pIter->pNext )
			{
				m_pIter = m_pIter->pNext;
				return *this
			}
			for ( ULONG i=m_nIndex+1; i<m_pMap->m_nHashSize; i++ )
			{
				if ( NULL != m_pMap->m_pHashTable[i] )
				{
					m_pIter = m_pMap->m_pHashTable[i];
					m_nIndex = i;
					return *this;
				}
			}
			m_pIter = NULL;
			m_nIndex = 0;
			return *this;
		}
		//后缀 如i++
		const iterator operator++(int)
		{
			iterator tmp( m_pIter,m_nIndex,m_pMap );
			if ( m_pIter->pNext )
			{
				m_pIter = m_pIter->pNext;
				return tmp;
			}

			for ( ULONG i=m_nIndex+1; i<m_pMap->m_nHashSize; i++ )
			{
				if ( NULL != m_pMap->m_pHashTable[i] )
				{
					m_pIter = m_pMap->m_pHashTable[i];
					m_nIndex = i;
					return tmp;
				}
			}
			m_pIter = NULL;
			m_nIndex = 0;
			return tmp;
		}
		objectType& operator *()
		{
			return *( m_pIter->pData );
		}
		bool operator== (const iterator& obj)
		{
			return m_pMap == obj.m_pMap && m_pIter == obj.m_pIter;
		}
		bool operator != (const iterator& obj)
		{
			return m_pMap != obj.m_pMap || m_pIter != obj.m_pIter;
		}
	protected:
		iterator(LPAssoc pAssoc,ULONG nIndex,my_strhash_map* map)
		{
			m_pIter = pAssoc;
			m_nIndex = nIndex;
			m_pMap = map;
		}
		LPAssoc m_pIter;
		ULONG m_nIndex;
		my_strhash_map* m_pMap;

	};
	my_strhash_map(ULONG nInitSize = 199,BOOL bAutoIncr = TRUE)
	{
		m_bAutoIncr = bAutoIncr;
		m_nHashSize = 0;
		m_nCount = 0;
		m_nConflictCount = 0;
		m_pHashTable = NULL;
		InitMap(nInitSize);
	}

	BOOL insert(const char* sKey,objectType obj)
	{
		if ( NULL == sKey || strlen(sKey) > HASH_MAX_STRING_LEN )
		{
			return FALSE;
		}

		ULONG nHash = BkdrHashKey(sKey) % m_nHashSize;
		LPAssoc pAssoc = m_pHashTable[nHash];
		if ( NULL == pAssoc )
		{
			m_pHashTable[nHash] = new Assoc;
			strcpy(m_pHashTable[nHash]->sKey,sKey);
			m_pHashTable[nHash]->pData = new objectType(obj);
			m_pHashTable[nHash]->pNext = NULL;
			m_nCount++;
		}
		else
		{
			LPAssoc pAssocPre = pAssoc;
			while( pAssoc )
			{
				//重复插入同一sKey，则返回
				if ( 0 == strcmp(pAssoc->sKey,sKey) )
					break;
				pAssocPre = pAssoc;
				pAssoc = pAssoc->pNext;
			}
			if ( NULL == pAssoc )
			{
				pAssoc = new Assoc;
				strcpy(pAssoc->sKey,sKey);
				pAssoc->pData = new objectType(obj);
				pAssoc->pNext = NULL;
				pAssocPre->pNext = pAssoc;
				m_nConflictCount++;
			}
		}

		if ( m_nCount > m_nHashSize )
		{
			ReSetTableSize( AdjustSize(m_nCount) );
		}
		return TRUE;
	}
	BOOL Find(const char* sKey,objectType& obj)
	{
		if ( NULL == sKey || strlen(sKey) > HASH_MAX_STRING_LEN )
		{
			return FALSE;
		}
		
		ULONG nHash = BkdrHashKey(sKey);
		nHash = nHash % m_nHashSize;
		LPAssoc pAssoc = m_pHashTable[nHash];
		while( pAssoc )
		{
			if ( 0 == strcmp(pAssoc.sKey,sKey) )
			{
				obj = *(pAssoc->pData);
				return TRUE;
			}
			pAssoc = pAssoc->pNext;
		}
		return FALSE;
	}
	BOOL Containts(const char* sKey)
	{
		if ( NULL == sKey || strlen(sKey) > HASH_MAX_STRING_LEN )
		{
			return FALSE;
		}

		ULONG nHash = BkdrHashKey(sKey);
		nHash = nHash % m_nHashSize;
		LPAssoc pAssoc = m_pHashTable[nHash];
		while( pAssoc )
		{
			if ( 0 == strcmp(pAssoc->sKey,sKey) )
				return TRUE;
			pAssoc = pAssoc->pNext;
		}
		return FALSE;
	}

	void RemoveKey(const char* sKey)
	{
		if ( NULL == sKey )
			return;
		ULONG nHash = BkdrHashKey(sKey)%m_nHashSize;
		LPAssoc pAssoc = m_pHashTable[nHash];
		if ( pAssoc && strcmp(pAssoc->sKey,sKey) == 0 )
		{
			m_pHashTable[nHash] = pAssoc->pNext;
			delete pAssoc->pData;
			delete pAssoc;
			m_nCount--;
		}
		else
		{
			LPAssoc pAssocPre = pAssoc;
			pAssoc = pAssoc->pNext;
			while( pAssoc )
			{
				if ( strcmp(pAssoc->sKey,sKey) == 0 )
				{
					pAssocPre->pNext = pAssoc->pNext;
					delete pAssoc->pData;
					delete pAssoc;
					m_nConflictCount--;
					break;
				}
				pAssocPre = pAssoc;
				pAssoc = pAssoc->pNext;
			}
		}
	}

	ULONG Size()
	{
		return m_nCount+m_nConflictCount;
	}
	void Clear()
	{
		LPAssoc pAssoc = NULL;
		LPAssoc pDelAssoc = NULL;
		for ( int i = 0;i < m_nHashSize;i++ )
		{
			pAssoc = m_pHashTable[i];
			while( pAssoc )
			{
				pDelAssoc = pAssoc;
				pAssoc = pAssoc->pNext;
				delete pDelAssoc->pData;
				delete pDelAssoc;
			}
			m_pHashTable[i] = NULL;
		}
		m_nCount = 0;
		m_nConflictCount = 0;
	}
	iterator begin()
	{
		for ( ULONG i=0; i<m_nHashSize; i++ )
		{
			if ( NULL != m_pHashTable[i] )
			{
				return iterator(m_pHashTable[i],i,this);
			}
		}
		return iterator(NULL,0,this);
	}
	iterator end()
	{
		return iterator(NULL,0,this);
	}
	ULONG GetTableSize()
	{
		return m_nHashSize;
	}
	BOOL AutoIncrease()
	{
		return m_bAutoIncr;
	}
protected:
 
	void ReSetTableSize(ULONG nSize)
	{
		LPAssoc* pNewAssocTable = new LPAssoc[nSize];
		memset( pNewAssocTable,0,sizeof((LPAssoc*)pNewAssocTable) );
		for ( ULONG i = 0;i < m_nHashSize;i++ )
		{
			LPAssoc pOldAssoc = m_pHashTable[i];
			while( NULL != pOldAssoc )
			{
				ULONG nHash = BkdrHashKey(pOldAssoc->sKey)%nSize;
				if ( NULL == pNewAssocTable[nHash] )
				{
					pNewAssocTable[nHash] = pOldAssoc;
					pNewAssocTable[nHash]->pNext = NULL;
				}
				else
				{
					LPAssoc pAssocTemp = pNewAssocTable[nHash];
					while( NULL != pAssocTemp->pNext )
						pAssocTemp = pAssocTemp->pNext;
					pAssocTemp->pNext = pOldAssoc;
					pAssocTemp->pNext->pNext = NULL;
				}
				pOldAssoc = pOldAssoc->pNext;
			}
		}

		delete[] m_pHashTable;
		m_pHashTable = pNewAssocTable;
		m_nHashSize = nSize;
	}
	void InitMap(ULONG nSize)
	{
		m_nHashSize = AdjustSize(nSize);
		if ( m_pHashTable )
		{
			delete[] m_pHashTable;
			m_pHashTable = NULL;
		}

		m_pHashTable = new LPAssoc[m_nHashSize];
		memset(m_pHashTable,0,sizeof(LPAssoc)*m_nHashSize );
	}
	ULONG AdjustSize(ULONG nSize)
	{
		// 注意：假设 long 至少有 32 bits。  
		//定义28个素数（大概是2倍关系增长），用来做hash table的大小
		const ULONG size_list[] = {
			53,			97,				193,		389,		769,
			1543,		3079,			6151,		12289,		24593,
			49157,		98317,			196613,		393241,		786443,
			1572869,	3145739,		6291469,	12582917,	25165842,
			50331553,	100663319,		201326611,	402653189,	805306457,
			1610612741,	3221225473ul,	4294967291ul
		};
		int nlistsize = sizeof(size_list) / sizeof(ULONG);
		int i = 0;
		for (;i<nlistsize;i++)
		{
			if ( size_list[i] >= nSize )
				break;
		}

		if ( i == nlistsize )
			i--;
		return size_list[i];
	}

	ULONG BkdrHashKey(const char* key) 
	{
		if (1)
		{
			char* str = const_cast<char*>(key);
			
			unsigned int seed = 31; // 31 131 1313 13131 131313 etc.. 37
			unsigned int hash = 0;
			
			while (*str)
			{
				hash = hash * seed + (*str++);
			}
			
			return (hash & 0x7FFFFFFF);
		}
		
		if ( NULL == key )
			return 0;
		ULONG nHash = 0;
		while (*key)
			nHash = (nHash<<5) + nHash + *key++;
		return nHash;
	}

protected:
	ULONG m_nHashSize;				//哈希表大小
	ULONG m_nCount;					//哈希表中当前元素个数
	ULONG m_nConflictCount;			//哈希表中冲突的个数
	LPAssoc* m_pHashTable;			//哈希表头指针
	BOOL m_bAutoIncr;				//是否自动调整表大小


};

数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
✔2848. 与车相交的点程序员小小聪力扣 leetcode
代码实现：方法一：哈希表#definefmax(a,b)((a)>(b)?(a):(b))intnumberOfPoints(int**nums,intnumsSize,int*numsColSize){inthash[101]={0};intmax=0;for(inti=0;i=x){j--;}if(i=nums[i][0]){r=r>nums[i][1]?r:nums[i][1];}else{
Lombok：Java开发者的代码简化神器【后端 17】终末圆 Java后端 java 开发语言 mysql 数据库后端 spring boot python
Lombok：Java开发者的代码简化神器在Java开发中，我们经常需要编写大量的样板代码，如getter、setter、equals、hashCode、toString等方法。这些代码虽然基础且必要，但往往占据了大量开发时间，且容易在属性变更时引发错误。幸运的是，Lombok这个Java库通过注解的方式，为我们提供了一种高效的解决方案。本文将详细介绍Lombok的使用及其优势。什么是Lombok
python使用MD5 18.程序员哈希算法算法
一、要使用Python进行MD5加密，可以使用Python标准库中的hashlib模块。二、案例importhashlibstring="Hello,World!"#要进行加密的字符串hash_object=hashlib.md5(string.encode())#将字符串编码并进行MD5加密hash_hex=hash_object.hexdigest()#获取加密后的十六进制字符串print(h
2019-05-29 vue-router的两种模式的区别 Kason晨
1、大家都知道vue是一种单页应用,单页应用就是仅在页面初始化的时候加载相应的html/css/js一单页面加载完成,不会因为用户的操作而进行页面的重新加载或者跳转,用javascript动态的变化html的内容优点:良好的交互体验,用户不需要刷新页面,页面显示流畅,良好的前后端工作分离模式,减轻服务器压力,缺点:不利于SEO,初次加载耗时比较多2、hash模式vue-router默认的是hash
【RabbitMQ 项目】服务端数据管理模块之交换机管理月夜星辉雪 rabbitmq oracle 数据库
文章目录一.编写思路二.代码实践一.编写思路定义交换机类型直接交换广播交换主题交换定义交换机名字类型是否持久化定义交换机持久化类(持久化到sqlite3)构造函数(只能成功，不能失败)如果数据库(文件)不存在则创建打开数据库打开exchange_table数据库表插入交换机移除交换机将数据库中的交换机恢复到内存中传入一个哈希表，key为名字，value为交换机的智能指针，填充该哈希表定义交换机管理
synchronized锁升级过程 liang8999 java jvm 开发语言
一、synchronized锁加到什么地方synchronized上锁，其实锁信息是加在对象头中的markdown，对象中的前四个字节表示markdown；markdown还记录了对象的gc、hashcode信息注意：markdown结构与jvm虚拟机的实现有关，I）32位Hotspot虚拟机markdown结构如下：II）64位Hotspot虚拟机的markdown结构如下：二、synchron
【编程底层原理】HashMap Hashtable ConcurrentHashMap Dylanioucn 开发语言后端 java
在Java的不同版本中，集合的实现原理有所变化，尤其是在HashMap、Hashtable和ConcurrentHashMap这三种实现中。以下是它们的一些关键区别和实现原理：一、HashMapJDK1.7：HashMap使用数组和链表的组合来解决冲突。当一个桶（数组的每个位置）中的元素超过一定数量时，会使用链表来存储这些元素。HashMap在JDK1.7中不是线程安全的。JDK1.8：进行了优化
关于Redis集群同步/持久化/淘汰机制的详解尾巴尖上的阳光大数据 redis 数据库
Redis是非常常用的KV数据库,使用内存以及HashMap进行存储的特点带来了高效的查询.本文将围绕Redis的常见开发使用场景,阐述在Redis集群中各个节点是如何进行数据同步,每个节点如何进行持久化以及在长期使用中如何对数据进行更新和淘汰.如果对Redis有更多的兴趣,可以查看我的技术博客:https://dingyuqi.com下面是Redis在开发过程中常用的几种使用场景.集群Redis
互联网 Java 工程师面试题（Java 面试题四）苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
下面列出这份Java面试问题列表包含的主题多线程，并发及线程基础数据类型转换的基本原则垃圾回收（GC）Java集合框架数组字符串GOF设计模式SOLID抽象类与接口Java基础，如equals和hashcode泛型与枚举JavaIO与NIO常用网络协议Java中的数据结构和算法正则表达式JVM底层Java最佳实JDBCDate,Time与CalendarJava处理XMLJUnit编程现在是时候给
区块链私有链new qis_qis 区块链区块链以太坊数字货币
{“config”:{“chainld”:666,“homesteadBlock”:0,“eip150Block”:0,“eip150Hash”:“0x0000000000000000000000000000000000000000000000000000000000000000”,“eip155Block”:0,“eip158Block”:0,“byzantiumBlock”:0,“consta
区块链私有链 qis_qis 区块链区块链以太坊数字货币
{"config":{"chainld":666,"homesteadBlock":0,"eip150Block":0,"eip150Hash":"0x0000000000000000000000000000000000000000000000000000000000000000","eip155Block":0,"eip158Block":0,"byzantiumBlock":0,"consta
注册中心 Nacos 异常实例需要30s才能剔除 Nacos心跳时间设置（踩坑） 2401_84046645 程序员 java 开发语言
instance.setPort(9999);Mapmetadata=newHashMap();//设置心跳的周期，单位为秒，这里将心跳间隔设置为3秒：metadata.put(PreservedMetadataKeys.HEART_BEAT_INTERVAL,“3000”);//设置心跳超时时间，单位为秒，这里将心跳超时时间设为6秒，//即服务端6秒收不到客户端心跳，会将该客户端注册的实例设为不
微服务治理：Nacos, Zookeeper, consul, etcd, Eureka等 5 个常用微服务注册工具对比 surfirst 架构微服务 zookeeper consul
当然！下面是Nacos、Zookeeper、Consul、etcd和Eureka这五个常用的注册中心的详细对比：Nacos：Nacos是由HashiCorp开发的高度可扩展和可靠的服务发现、配置管理和服务网格解决方案。它的架构基于一组服务器代理形成的共识组和与服务器交互的许多客户端代理。主要特点包括：服务发现：服务在Nacos中注册，客户端可以通过DNS或HTTPAPI发现服务及其位置。健康检查：
AtCoder Beginner Contest 363 菜比乌斯反演 AtCoder 算法 c++开发语言
A-PilingUp题意不同的分数段有不同的^数量，Takahashi想要使得他的^数量增加，问他所需要的最少分数增幅。思路我们只需要找到下一阶段的下限。a/100是本阶段+1变成下一阶段，再*100变成下限，再与原来的相减即可。代码inlinevoidsolve(){inta;cin>>a;cout>n>>t>>p;vectora(n+1);for(inti=1;i>a[i];nth_eleme
哈希表 383.赎金信柴... 散列表算法 leetcode
统计两个字符串中，每个字母出现的次数，最后统计，当数组所有位置都>0时，就能确定。classSolution{publicbooleancanConstruct(StringransomNote,Stringmagazine){int[]record=newint[26];if(ransomNote.length()>magazine.length()){returnfalse;}for(inti
Redis的持久化和高可用性小辛学西嘎嘎 redis 数据库缓存
目录一、淘汰策略1、背景2、淘汰策略二、持久化1、背景2、fork进程写时复制机制3、Redis持久化方式1、aof2、rdb三、高可用1、主从复制2、Redis哨兵模式3、Rediscluster集群一、淘汰策略1、背景首先Redis是一个内存数据库，将所有数据存放在内存中，通过对K值进行hash后存储在散列表中。有一个小问题Redis数据库占96G，但为什么最终占满只有48G呢。因为中间有个过
哈希表 and 算法 (笑)z 算法散列表哈希算法
哈希表：哈希表（Hashtable），也被称为散列表，是一种根据关键码值（Keyvalue）而直接进行访问的数据结构。它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数被称为散列函数或哈希函数，而存放记录的数组则被称为散列表或哈希表。哈希表的优点查找速度快：哈希表通过哈希函数直接定位到数组中的位置，因此查找速度非常快，时间复杂度接近O(1)。插入和删除操作方便：由于哈希表
Java面试必问之Hashmap底层实现原理(JDK1.7) 当我遇上你csy Java基础 java hashmap 面试源码
1.前言Hashmap可以说是Java面试必问的，一般的面试题会问:Hashmap有哪些特性？Hashmap底层实现原理(get\put\resize)Hashmap怎么解决hash冲突？Hashmap是线程安全的吗？…今天就从源码角度一探究竟。笔者的源码是OpenJDK1.72.构造方法首先看构造方法的源码//默认初始容量staticfinalintDEFAULT_INITIAL_CAPACIT
HashMap 原理解释及其常见面试题 Justdoforever java
HashMap原理解释及其常见面试题在多线程下在javaHashMap的1948或2239行都会出现死循环情况，1948行treeify函数中将链表转为树的时候，2239在balanceInsertion函数中，让树变为平衡时，总之多线程下HashMap在链表转树或涉及树的操作时会出现死循环。测试代码：importjava.util.*;publicclassMainTest{Mapmap=new
Java后端面试高频问题：HashMap的底层原理 2401_84408267 程序员 java 面试开发语言
④如果该位置不为null,则判断key是否一样(hashCode和equals)，如果一样则直接覆盖value⑤如果key不一样，则判断该元素是否为红黑树的节点，如果是，则直接在红黑树中插入键值对⑥如果不是红黑树的节点，则就是链表，遍历这个链表执行插入操作，如果遍历过程中若发现key已存在，直接覆盖value即可。如果链表的长度大于等于8且数组中元素数量大于等于阈值64，则将链表转化为红黑树，（先
《数据结构与算法》知识点（四）游戏原画设计
第七章查找顺序查找、折半查找、索引查找、分块查找是静态查找，动态查找有二叉排序树查找，最优二叉树查找，键树查找，哈希表查找静态查找表顺序表的顺序查找：应用范围：顺序表或线性链表表示的表，表内元素之间无序。查找过程：从表的一端开始逐个进行记录的关键字和给定值的比较。顺序有序表的二分查找。平均查找时间(n+1)/nlog2(n+1)分块查找：将表分成几块，块内无序，块间有序，即前一块中的最大值小于后一
你必须掌握的 21 个 Java 核心技术！ 2401_83916204 程序员 java 开发语言
Object类型：equals，hashcodeString类型的特点4.对象和实例，对象的创建在这方面，开发者需要了解class和instance的概念以及之间的差别，这是java面向对象特性的一个基础。主要知识点有：Class和Instance的概念Instance创建的过程：1、无继承：分配内存空间，初始化变量，调用构造函数2、有继承：处理静态动作，分配内存空间，变量定义为初始值，从基类->
SingleFlight模式你这个代码我看不懂 Spring python 开发语言
SingleFlight在Java中实现SingleFlight模式，可以通过使用ConcurrentHashMap和CompletableFuture来管理并发请求。以下是一个示例代码，展示了如何在Java中实现SingleFlight模式：示例代码importjava.util.concurrent.CompletableFuture;importjava.util.concurrent.Co
OJ2219左移右移（链表）——蓝桥杯2022年国赛爱干饭的boy 数据结构与算法题目数据结构算法
代码为（双向链表）：#includeusingnamespacestd;structlink{intdata;link*prev;link*next;};intmain(){intn,m;cin>>n>>m;link*l=newlink();//创建头节点，不存储实际数据，仅作为起始点link*tail=l;//尾指针初始指向头节点unordered_maph;//哈希表，用于快速查找任何节点fo
喜大普奔：HashiCorp Vagrant 2.2.0发布！ HashiCorpChina
OCT172018BRIANCAINWearepleasedtoannouncethereleaseofVagrant2.2.0.Vagrantisatoolforbuildinganddistributingdevelopmentenvironments.ThehighlightofthisreleaseistheintroductionofVagrantCloudcommandlinetool
Python 对文件的加密和解密 Jinx Boy python 哈希算法开发语言
cryptography库中的Fernet模块提供了一种简单的方法来加密和解密数据。它使用对称加密算法，其中相同的密钥用于加密和解密数据。以下是用Fernet模块对文件进行的加密和解密。加密：importhashlibimportbase64fromcryptography.fernetimportFernetimportosdefstring_to_fernet_key(input_string
flask-sqlalchemy的模型类两个表，既有一对一又有一对多的情况时，解决方法 skyTree,, Flask python
这种情况时，直接进行数据迁移会回报错，因为一个表需要依赖另一个表，所以可以将两个表的基本字段先迁移好，然后再新增外键字段进行迁移，就不会报错了fromdatetimeimportdatetimefromapi.models.baseimportBaseModelfromapiimportdbfromwerkzeug.securityimportcheck_password_hash,generat
Redis基础知识学习笔记(三) 晚睡早起₍˄·͈༝·͈˄*₎◞ ̑̑ redis redis 学习笔记
文章目录Redis命令一.Redis命令1.启动redis服务器2.本地启动redis客户端3.远程启动redis客户端4.测试是否建立连接二.Redis键(key)RedisKey相关命令三.Redis字符串(String)Redis字符串命令四.Redis哈希(Hash)Redis字符串命令五.Redis列表(List)Redis列表命令六.Redis集合(Set)Redis集合基本命令七.R
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =