c语言数组散列高效 HashTable Dictionary

声明：图片转载自@http://www.cnblogs.com/1-2-3/archive/2010/10/25/generic-dictionary-source-part2.html

c语言数组散列高效 HashTable Dictionary ，不管集合大小，任意长度根据key查询都最快一次寻址，so 最快时间复杂度为O1！

目的：

　　首先了解需求，我们要的是一个Dictionary，字典，就是一个 <key,value>集合，

　　要求：

　　　　根据key查找时间复杂度很低！很快！

　　　　而且我们需要删除的方法，时间复杂度很低！很快！

准备：

　　首先我们来了解hash，就是散列， hash ——>就是把任意长度的输入，通过算法，变换成固定长度的输出，该输出就是散列值”!

int GetHashCode(char* str)
{
	int hashcode=0;
	char *p;
	for(p=str; *p; p++){
		hashcode = hashcode*CM_STR_HASHFUNC_CONSTANT + *p;
	}
	return hashcode;
}

　　以上方法实现了输入字符串得到一个数值的功能，但是并不是定长！，定长的标准hash算法有很多，你可以google，比如MD5~

　　　　@http://page.renren.com/601301709/note/818040393

　　这是一个简单的获取hash的方法！c#或者其他语言很容易得到一个对象的hash！c#: object.gethashcode();

　　然后我们来说碰撞：

　　　　　　碰撞就是hash算法里面两个不同的输入，得到的hash输出是一样的，这就称之为碰撞！比如MD5理论上是不会发生碰撞的！

重点：

　　　我们知道计算机查找集合里面数组是最快的，因为数组内存是连续存储的，直接根据计算的地址得到值，

char * name="dark89757";

char  _4=name[3];

　　name[3]=>name首地址+3 内存取值为sizeof(char)！

　　我们现在有一个keyvalue型列表。每行都是<key,value>，我们想让这个字典列表集合也拥有数组差不多的查找优势！　

　　但是，我们的key不是内存地址！

　　没事，一步一步来，

　　不是有hash吗？我们可以计算出key的hash，

　　通过文中的gethashcode，我们可以得到一个key(字符串)的hash，一个数值！

　　那么我们是不是可以这样做，定义一个超长的数组，数组类型为key value 的value类型，你可以这样 void* data [maxint];

　　Insert：我们先计算出key的hash，然后根据得到的keyhash，写入数组 ,

　　Get:：同样的，先计算key的hash，然后return data[code];

　　实现如下

void* data [maxint];

void insert(char *key,void* value)
{
         int code=gethashcode(key);
        data[code]=value;
}

void* get(char* key)
{
     int code=gethashcode(key);
     return data[code];
}

　　但是这样做并不科学，首先是数组太大，可能有些hash值maxint根本没法存！而且开辟的空间大部分都没有，其次是碰撞，如果两个不同key的hash是一样的，是不是就数据丢失了！

　　人总是聪明的，首先我们来解决第二个问题，

　　就是两个不同key的hash值一样的问题，我们可以这样做，把数组的值弄成一个链表，

　　因为c不甚了解了，太慢了，所以用了c#代替写！

    class Program
    {

        class Item
        {
            public string key = null;
            public object value = null;
            public Item nextitem;
        }

        static Item[] data = new Item[Int32.MaxValue];//存储链表的首节头，第一个节点

        static int gethashcode(string key)
        {
            return key.GetHashCode();
        }

        static void insert(string key, object value)
        {
            int code = gethashcode(key);
            Item keyindex = data[code];

            if (data[code] == null)//没有链表
            {
                keyindex = new Item();
                keyindex.key = key;
                keyindex.value = value;
                data[code] = keyindex;
                return;
            }

            if (keyindex.key == key)//是否和当前新添加key相同
            {
                keyindex.value = value;
                return;
            }

            while (keyindex.nextitem != null)//循环至尾
            {
                keyindex = keyindex.nextitem;
            }
            var temp = new Item();//结尾添加链表节点
            keyindex.nextitem = temp;
            temp.key = key;
            temp.value = value;
            return;
        }

        static object get(string key)
        {
            int code = gethashcode(key);
            Item keyindex = data[code];

            while (keyindex != null)//遍历链表节点
            {
                if (keyindex.key == key)
                    return keyindex.value;

                keyindex = keyindex.nextitem;
            }
            return null;
        }

        static void Main(string[] args)
        {
            insert("123", "123 value~~");
            Console.WriteLine(get("123"));
            insert("456", "456 value~~");
            insert("123", "123  new value~~");
            Console.WriteLine(get("123"));
            Console.ReadKey();
        }
    }

　　以上代码并不能运行，因为maxint的缘故！可以参考下流程，我们把碰撞的hash弄成了一个链表了，这样值完全存贮了，

　　然后我们来解决下一个问题，原来方案需要开辟N大的空间，根本不实际，可能程序都不会让你开辟maxint的数组，！

　　然后数学是美好的，记得求余吗？

int hashcode;
int  qiuyuhashcode=hashcode%100;

　　这样得到的hash总是在0~99之间的！，说道这里，聪明的人一下就想到了！

　　我们将以上maxint数组的链表，该成100长度的数组！

　　将上面的代码改成这样：

    // out -》static Item[] data = new Item[Int32.MaxValue];

        static int length=100;
        static Item[] data = new Item[length];//存储链表的首节头，第一个节点

        static int gethashcode(string key)
        {
            // out -》return key.GetHashCode();
            return Math.Abs(key.GetHashCode() % length);
        }

　　再次运行将会成功！这是一个简单的除hash数组！

　　我们将key的hash求余，这样我们只会有一百个链表，不会有maxint长的链表！

　　但这并不能实践，首先一个问题是数组只有一百个，如果字典行很多，大概这一百个链表都很长！查找时涉及到的遍历链表这还是会很慢！

　　然后是删除，这也会遍历链表！还是很慢！

　　这里还能继续优化，就是我们的数组动态增长，增长判断为插入key的条数，让数组的长度始终大于key的长度，

　　因为hash碰撞的几率是很小的，我们如果我们有1000个<key,value>，我们就定义1000个数组，可能90%都会只有数组头，另外10%都是除余数的hash碰撞，存在链表尾！

　　如果你要将上述代码添加动态增长大小方法，有一点别忘了，必须重新排列原来的100个链表，比如增长到1000大小，把key%1000再插入！

　　这样做完全的提升了删除和查找的速度！

　　然而问题还有！

　　我们先看下现在解决方案图：

　　就是这种链表在内存不是连续的，如果你用c/c++写，在内存上插入和删除都需要开辟和释放空间的！

　　内存池管理，是的，我们把这一百个链表的内存集合起来处理，

　　假如我有一百个<key,value>，我先定义一百的数组来存链表头的指针，然后定义一百个来放{key，value，nextnode}链表节点！这就是最终hashtable方案！

　　最后一个问题，就是删除，我们定义两个变量，一个是int freecount，删除个数，另一个node freenode；是链节点链表头，我们把所有删除的链表都串起来！

　　下次我添加的时候，先判断free，然后再次利用 freenode这个节点，如果 freenode 的next还有值，我们将这个值赋给 freenode，下次再利用！

　　以上就是整个hashtable整个简单讲解！如果你觉得本文对你有些许帮助，请点一下右下角的顶！

　下面有我c写的hashtable的实现，附带有测试代码和下载地址。

HashDictionary.h

#define CM_STR_HASHFUNC_CONSTANT 31
#define KEYSIZE 40

struct Entry
{
	int hashCode;
	int next;
	char key[KEYSIZE];
	void* value;
};

struct HashDictionary
{
	int* buckets;
	Entry* entrys;
	int bucketslength;
	int entryslength;
	int count;
	int freeList;
	int freeCount;
};

static int primes[] = {
	3, 7, 11, 17, 23, 29, 37, 47, 59, 71, 89, 107, 131, 163, 197, 239, 293, 353, 431, 521, 631, 761, 919,
	1103, 1327, 1597, 1931, 2333, 2801, 3371, 4049, 4861, 5839, 7013, 8419, 10103, 12143, 14591,
	17519, 21023, 25229, 30293, 36353, 43627, 52361, 62851, 75431, 90523, 108631, 130363, 156437,
	187751, 225307, 270371, 324449, 389357, 467237, 560689, 672827, 807403, 968897, 1162687, 1395263,
	1674319, 2009191, 2411033, 2893249, 3471899, 4166287, 4999559, 5999471, 7199369};



//获取hash
int GetHashCode(char* str);

//是否质数
bool IsPrime(int candidate);

//获取>min最近的质数
int GetPrime(int min);

//初始化
void Initialize(HashDictionary* hd);

//初始化
void Initialize(HashDictionary* hd,int capacity);

//释放
void Disponse(HashDictionary* hd);

//重定义大小
void Resize(HashDictionary* hd);

//插入 add如果是true，并且key存在，则返回-1，否则替换新值 
int Insert(HashDictionary* hd,char* key,void* value,bool add);

//找到下标 没有返回 -1
int FindEntryIndex(HashDictionary* hd,char* key);

//查找 没有返回null
Entry* FindEntry(HashDictionary* hd,char* key);

//删除 如果没有返回false
bool Remove(HashDictionary* hd,char* key);

//是否含有key
bool ContainsKey(HashDictionary* hd,char* key);

int GetCount(HashDictionary* hd);

void GetAllKey(HashDictionary* hd,char* allkey);

HashDictionary.cpp

#include "stdafx.h"
#include "HashDictionary.h"
#include <malloc.h>
#include <math.h>
#include <limits.h>
#include <string.h>

int GetHashCode(char* str)
{
	int hashcode=0;
	char *p;
	for(p=str; *p; p++){
		hashcode = hashcode*CM_STR_HASHFUNC_CONSTANT + *p;
	}
	return hashcode;
}

bool IsPrime(int candidate)
{
	if ((candidate & 1) != 0) 
	{
		int limit = (int)sqrt((double)candidate);
		int divisor;
		for (divisor = 3; divisor <= limit; divisor += 2) 
		{
			if ((candidate % divisor) == 0)
				return false;
		}
		return true;
	}
	return (candidate == 2); 
}

int GetPrime(int min) 
{
	if (min < 0)
		return 3;
	int i;
	int length=sizeof(primes)/sizeof(primes[0]);
	for (i = 0; i < length; i++) 
	{
		int prime = primes[i];
		if (prime >= min)
			return prime;
	}
	for (int i = (min | 3); i < INT_MAX;i+=2) 
	{
		if (IsPrime(i))
			return i;
	}
	return min;
}

void Initialize(HashDictionary** hd)
{
	Initialize(*hd,3);
}

void Initialize(HashDictionary* hd,int capacity)
{
	int size=GetPrime(capacity);
	hd->buckets=(int*)malloc(sizeof(int)*size);

	int i = 0;
	for (; i < size; i++)
	{
		hd->buckets[i]=-1;
	}
	hd->bucketslength=size;
	hd->entrys=(Entry*)malloc(sizeof(Entry)*size);
	i = 0;
	for (; i < size; i++)
	{
		hd->entrys[i].hashCode=-1;
		hd->entrys[i].next=-1;
		hd->entrys[i].value=0;
	}
	hd->entryslength=size;

	hd->count=0;
	hd->freeCount=0;
	hd->freeList=-1;
};

void Disponse(HashDictionary* hd)
{
	free(hd->buckets);
	free(hd->entrys);
}

void Resize(HashDictionary* hd)
{
	int newsize=hd->count*2;
	int* newbuckets=(int*)malloc(sizeof(int)*newsize);
	Entry* newentrys=(Entry*)malloc(sizeof(Entry)*newsize);

	int i = 0;
	for (; i < newsize; i++)
	{
		newbuckets[i]=-1;
	}
	for ( i = 0; i < newsize; i++)
	{
		newentrys[i].hashCode=-1;
		newentrys[i].next=-1;
		newentrys[i].value=0;
	}

	hd->bucketslength=hd->entryslength=newsize;

	memcpy(newentrys,hd->entrys,sizeof(Entry)*hd->count);

	free(hd->buckets);
	free(hd->entrys);

	hd->buckets=newbuckets;
	hd->entrys=newentrys;

	//重新排列
	for (int i = 0; i < hd->count; i++) {
		if (hd->entrys[i].hashCode >= 0) {
			int bucket = hd->entrys[i].hashCode % hd->bucketslength;
			hd->entrys[i].next = hd->buckets[bucket];
			hd->buckets[bucket] = i;
		}
	}
}

int Insert(HashDictionary* hd,char* key,void* value,bool add)
{
	int hashCode = GetHashCode(key) & 0x7FFFFFFF;
	int targetBucket = hashCode % hd->bucketslength;
	//new value
	int i = hd->buckets[targetBucket];
	for (i = hd->buckets[targetBucket]; i >= 0; i = hd->entrys[i].next) {
		if (hd->entrys[i].hashCode == hashCode && strcmp(hd->entrys[i].key,key)==0) {
			if (add) { 
				return -1;
			}
			hd->entrys[i].value = value;
			return 2;
		}
	}
	int index;
	if (hd->freeCount > 0) {
		index = hd->freeList;
		hd->freeList =hd-> entrys[index].next;
		hd->freeCount--;
	}
	else {
		if (hd->count == hd->entryslength)
		{
			Resize(hd);
			targetBucket = hashCode % hd->bucketslength;
		}
		index = hd->count;
		hd->count++;
	}
	/*if( buckets[targetBucket]!=-1)
	printf("碰撞");*/
	hd->entrys[index].hashCode = hashCode;
	hd->entrys[index].next = hd->buckets[targetBucket];
	memcpy(hd->entrys[index].key,key,strlen(key)+1);
	hd->entrys[index].value = value;
	hd->buckets[targetBucket] = index;
	return 1;
}

int FindEntryIndex(HashDictionary* hd,char* key)
{ 
	int hashCode = GetHashCode(key) & 0x7FFFFFFF;
	int i = hd->buckets[hashCode % hd->bucketslength];
	for (; i >= 0; i = hd->entrys[i].next) {
		//printf("%s find item \n",entrys[i].key);
		if (hd->entrys[i].hashCode == hashCode &&  strcmp(hd->entrys[i].key,key)==0) 
		{	
			return i;
		}
	}
	return -1;
}

Entry* FindEntry(HashDictionary* hd,char* key)
{ 
	int index=FindEntryIndex(hd,key);
	if(index>=0)
	{
		return &hd->entrys[index];
	}
	return 0;
}

bool Remove(HashDictionary* hd,char* key) 
{
	int hashCode = GetHashCode(key) & 0x7FFFFFFF;
	int bucket = hashCode % hd->bucketslength;
	int last = -1;
	for (int i = hd->buckets[bucket]; i >= 0; last = i, i = hd->entrys[i].next) {
		if (hd->entrys[i].hashCode == hashCode && strcmp(hd->entrys[i].key,key)==0) {
			if (last < 0) {
				hd->buckets[bucket] = hd->entrys[i].next;//如果第一个
			}
			else {
				hd->entrys[last].next = hd->entrys[i].next;
			}
			hd->entrys[i].hashCode = -1;
			hd->entrys[i].next = hd->freeList;//串连逻辑删除链表
			memset(hd->entrys[i].key,0,20);
			hd->entrys[i].value =0;
			hd->freeList = i;
			hd->freeCount++;
			return true;
		}
	}
		return false;

}

bool ContainsKey(HashDictionary* hd,char* key) 
{
	return FindEntryIndex(hd,key) >= 0;
}

int GetCount(HashDictionary* hd)
{
	return hd->count-hd->freeCount;
}

void GetAllKey(HashDictionary* hd,char* allkey)
{
	
	int length=(hd->count-hd->freeCount);
	memset(allkey,0,KEYSIZE*length);
	int bytelength=KEYSIZE*length;
	for (int i = 0; i < hd->entryslength; i++)
	{
		if(hd->entrys[i].hashCode!=-1)
		{
			//strcat_s(allkey,bytelength,hd->entrys[i].key);
			memcpy_s(allkey+i*KEYSIZE,bytelength,hd->entrys[i].key,KEYSIZE);
		}
	}

}

测试代码

// testDic.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"
#include "HashDictionary.h"
#include <malloc.h>
#include <Windows.h>
#include<time.h>
int _tmain(int argc, _TCHAR* argv[])
{
    //dark 89757


    HashDictionary* hashdic=(HashDictionary*)malloc(sizeof(HashDictionary));

    Initialize(hashdic,3);//3 这个参数是默认数组初始大小，一般设置为=估计有多少条数据，小了也无所谓，是动态增长的

#pragma region 基本操作

    Insert(hashdic,"abc","this abc value",true);

    Insert(hashdic,"12341","this 12341 value~~~~",true);

    printf("键值对12341是否含有：%d\n",FindEntryIndex(hashdic,"12341"));
    Remove(hashdic,"12341");//删除
    printf("键值对12341是否含有：%d\n",FindEntryIndex(hashdic,"12341"));

    Insert(hashdic,"name","国人自强不息！",true);

    Insert(hashdic,"32.252","this abc value",true);

    printf(" abc: %s \n",FindEntry(hashdic,"abc")->value);
    Insert(hashdic,"abc","this NEW v~~~~",false);// <-false
    printf(" abc: %s \n",FindEntry(hashdic,"abc")->value);

    printf(" name: %s \n",FindEntry(hashdic,"name")->value);  

    int count=GetCount(hashdic);
    printf("table条数:%d\n",count);
    char* allkey=(char*)malloc(count*KEYSIZE);
    GetAllKey(hashdic,allkey);//返回的结果是以KEYSIZE为单位长度的字符集合=》KEYSIZE+KEYSIZE+KEYSIZE+KEYSIZE

    for (int i = 0; i < count; i++)
    {
        printf("key item:%s\n",allkey+i*KEYSIZE);//零食输出 应该是   i*KEYSIZE~（i+1）*KEYSIZE 这段才是一个key
    }


#pragma endregion

    Entry* find;
    printf( "---------------------------------------------\n");
#pragma region 删除 插入时间检测
    clock_t start, finish;  
    double  duration; 

    char* value="这是共有的value~~~~";
    start = clock();  
    int i = 0;
    char tempkey[20];
    for (; i < 1000000; i++)
    {
        _itoa_s(i,tempkey,10);
        if(i==50000){
            Insert(hashdic,tempkey,"this debug 5000",true);
        }
        Insert(hashdic,tempkey,value,true);
    }

    finish = clock();  
    duration = (double)(finish - start) / CLOCKS_PER_SEC;  
    printf( "插入hashtable 一百万条数：1000000 条！ 消费时间: %f seconds\n", duration ); 
    printf("table条数:%d\n",GetCount(hashdic));

    Remove(hashdic,"100");
    Remove(hashdic,"235");
    Remove(hashdic,"888888");

    //检测所有插入是否存在
    for ( i = 0;i < 1000000; i++)
    {
        _itoa_s(i,tempkey,10);
        find= FindEntry(hashdic,tempkey);
        if(find==NULL)
            printf("%s没有找到!!!\n",tempkey);
        else
        {
            //printf( "%s\n", find->value ); 打印100万条很耗时
        }
    }
    printf( "检查100万完成~\n");

#pragma endregion

    printf( "---------------------------------------------\n");
    start = clock();
    char *testkey="50000";
    find= FindEntry(hashdic,testkey);
    printf("指定key查找: key:%s  value:%s\n",testkey,find->value);
    char *testkey2="50001";
    find= FindEntry(hashdic,testkey2);
    printf("指定key查找:  key:%s  value:%s\n",testkey2,find->value);
    finish = clock();  

    duration = (double)(finish - start) / CLOCKS_PER_SEC;  
    printf( "查找两条耗时: %f seconds\n", duration );  

    printf( "---------------------------------------------\n");

    start = clock();
    Insert(hashdic,"汉字","this 汉字 的值",true);
    find= FindEntry(hashdic,"汉字");
    printf("指定key查找: key:%s  value:%s\n","汉字",find->value);

    duration = (double)(finish - start) / CLOCKS_PER_SEC;  
    printf( "插入+查找耗时: %f seconds\n", duration );  

    printf("table条数:%d\n",GetCount(hashdic));

    Disponse(hashdic);//malloc -》free

    system("pause");
    return 0;
}

demo源码下载地址1：链接: http://pan.baidu.com/s/1vstEu 密码: y5lq

demo源码下载地址2:http://bcs.duapp.com/darkweb/testDic.zip

数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
【编程底层原理】HashMap Hashtable ConcurrentHashMap Dylanioucn 开发语言后端 java
在Java的不同版本中，集合的实现原理有所变化，尤其是在HashMap、Hashtable和ConcurrentHashMap这三种实现中。以下是它们的一些关键区别和实现原理：一、HashMapJDK1.7：HashMap使用数组和链表的组合来解决冲突。当一个桶（数组的每个位置）中的元素超过一定数量时，会使用链表来存储这些元素。HashMap在JDK1.7中不是线程安全的。JDK1.8：进行了优化
哈希表 and 算法 (笑)z 算法散列表哈希算法
哈希表：哈希表（Hashtable），也被称为散列表，是一种根据关键码值（Keyvalue）而直接进行访问的数据结构。它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数被称为散列函数或哈希函数，而存放记录的数组则被称为散列表或哈希表。哈希表的优点查找速度快：哈希表通过哈希函数直接定位到数组中的位置，因此查找速度非常快，时间复杂度接近O(1)。插入和删除操作方便：由于哈希表
高阶数据结构之哈希表基础讲解与模拟实现渡我白衣 c++知识点数据结构 c++
程序猿的读书历程：x语言入门—>x语言应用实践—>x语言高阶编程—>x语言的科学与艺术—>编程之美—>编程之道—>编程之禅—>颈椎病康复指南。前言：哈希表（HashTable）是一种高效的键值对存储数据结构，广泛应用于各种需要快速查找的场景，如数据库索引、缓存系统、集合等。它的基本思想是通过哈希函数将键映射到哈希表中的一个位置，从而实现快速的数据插入、删除和查找操作。下面我们将详细介绍哈希表的工作
Leetcode 两数之和 Wils0nEdwards Leetcode leetcode 哈希算法散列表
这道题利用Hashtable哈希表来做。如果不使用hashtable，进行暴力循环的话，时间复杂度较高O(N2)O(N^2)O(N2)。哈希表（HashTable）可以被视为一种空间换时间的策略哈希表利用哈希函数将键（Key）映射到值（Value），从而能够在常数时间内（O(1)）完成查找和插入操作。对于这道题目的求解思路：首先创建一个空的hashtable，然后我们开始循环遍历向量，对当前元素，
Java面试题路飞Fly了 java 面试开发语言
Java面试题文章目录1、抽象类和接口的区别2、重载和重写的区别3、==和equals的区别4、讲一讲什么是map、set、list5、HashMap原理6、什么是JSP？它与Servlet有什么区别7、synchronized关键字8、HashTable与HashMap的区别9、ArrayList和LinkedList的区别10、Session和Cookie的区别11、String、String
梧桐数据库（WuTongDB）：哈希表原理、实现方法、代码例子和应用场景鲁鲁517 梧桐数据库散列表哈希算法梧桐数据库
哈希表（HashTable）是一种高效的数据结构，用于在常数时间内存储和查找键值对。它通过将键值映射到表中的一个位置来实现这一点，这个位置由哈希函数决定。哈希表广泛用于数据库、缓存实现和各种算法中。1.哈希表的原理哈希函数：哈希函数将键（通常是字符串或整数）转换为哈希值。这个哈希值是一个整数，用来表示哈希表中的索引位置。理想情况下，不同的键会映射到不同的哈希值，但由于键的数量通常大于哈希表的大小，
2021年大厂Java面试题（基础+框架+系统架构+分布式+实战） 2401_85195615 java 系统架构分布式
Java线程的状态进程和线程的区别，进程间如何通讯，线程间如何通讯HashMap的数据结构是什么？如何实现的。和HashTable，ConcurrentHashMap的区别Cookie和Session的区别索引有什么用？如何建索引？ArrayList是如何实现的，ArrayList和LinkedList的区别？ArrayList如何实现扩容。equals方法实现面向对象线程状态，BLOCKED和W
面试：说一下HashMap的底层实现原理，我懵了一只程序猿哟
哈希表（hashtable）也叫散列表，是一种非常重要的数据结构，应用场景及其丰富，许多缓存技术（比如memcached）的核心其实就是在内存中维护一张大的哈希表，而HashMap的实现原理也常常出现在各类的面试题中，重要性可见一斑。本文会对java集合框架中的对应实现HashMap的实现原理进行讲解，然后会对JDK7的HashMap源码进行分析（JDK8会有所不同，需要了解的可自行阅读JDK8的
哈希表算法详解真的没事鸭数据结构与算法散列表算法哈希算法
哈希表哈希表（Hashtable，也叫散列表），是根据关键码值(Keyvalue)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做哈希函数，存放记录的数组叫做哈希表。给定表M，存在函数f(key)，对任意给定的关键字值key，代入函数后若能得到包含该关键字的记录在表中的地址，则称表M为哈希（Hash）表，函数f(key)为哈希(H
数据结构哈希表五大排序算法二分查找（折半查找）安亿103 数据结构排序算法 c语言 linux 软件构建算法
1、哈希表1.1创建哈希表哈希表:将数据通过哈希算法映射称为一个键值存时在键值对应的位置存储取时通过键值对应的位置查找哈希冲突（哈希碰撞）：多个数据通过哈希算法映射成同一个键值#include#include#include#include"list.h"#defineINDEX10structlist_headhashtable[INDEX];typedefstructData{structli
哈希（C语言）写代码的大学生哈希算法 c语言算法
文章目录1.数据结构——哈希表1.1哈希表的工作原理1.2哈希表的代码实现2.哈希算法2.1哈希算法介绍2.2C语言实现示例本文介绍一个常用的算法——哈希算法，哈希算法依赖于哈希表来实现，首先我会介绍一下哈希表，并在哈希表的基础上衍生出哈希算法。1.数据结构——哈希表哈希表（hashtable），又称散列表，它通过建立键key与值value之间的映射，实现高效的元素查询。具体而言，我们向哈希表中输
主体概述 kindol
Java的容器类主要由两个接口派生而出——Collection和Map：ALL1.jpgALL2.jpgTreeMap实现了SortedMap接口，因而是有顺序的Set、List、Queue继承了Collection接口TreeMap是基于树的实现，HashMap，HashTable，ConcurrentHashMap是基于hash表的实现HashMap与TreeMap区别：HashMap通过ha
Java中HashSet、HashMap和HashTable的区别 Sueko 日常学习笔记 Java java 开发语言
今天写每日一题时，看到题解用到了HashSet。之前数据结构学习的时候并没有区别这三者，于是在这里做一个整理。是Leetcode上的这题720.词典中最长的单词，等我写完题解也会把题解再贴上来。Java中HashSet、HashMap和HashTable的区别1.官方文档对这三者的介绍1.1Hashtable1.2HashMap1.3HashSet2.三者之间的区别2.1Hashtable和Has
C# Dictionary 躺下睡觉~ c#java 开发语言
目录Dictionary的本质申明增删查改遍历练习Dictionary的本质可以将Dictionary理解为拥有泛型的Hashtable它也是基于键的哈希代码组织起来的键/值对键值对类型从Hashtable的object变为了可以自己制定的泛型申明需要引用命名空间usingSystem.Collections.GenericDictionarydictionary=newDictionary();
Java笔试面试题AI答之集合（5）工程师老罗 Java笔试面试题AI答 java 开发语言
文章目录25.简述HashMap和HashTable有何不同？26.ArrayList和Vector有何异同点？相同点不同点27.Array和ArrayList有何区别？什么时候更适合用Array？主要区别何时更适合使用Array总结28.解释Java并发集合类是什么？29.简述Vector,ArrayList,LinkedList的区别？1.底层实现2.性能3.线程安全4.扩容机制5.构造方法3
Java笔试面试题AI答之集合（6）工程师老罗 Java笔试面试题AI答 java 开发语言
文章目录31.简述JavaSet有哪些实现类？32.简述Java哪些集合类是线程安全的?33.简述ConcurrentHashMap和HashTable有什么区别？1.线程安全机制2.支持null键和值3.迭代器和分割器4.性能和扩展性5.初始化和默认参数总结34.简述HasmMap和HashSet的区别？一、存储方式二、唯一性三、排序四、访问速度五、功能六、适用场景31.简述JavaSet有哪些
【转】-Java并发编程：阻塞队列 booleandev JUC Java 转载
Java并发编程：阻塞队列该博客转载自**Matrix海子的Java并发编程：阻塞队列**Java并发编程：阻塞队列在前面几篇文章中，我们讨论了同步容器(Hashtable、Vector），也讨论了并发容器（ConcurrentHashMap、CopyOnWriteArrayList），这些工具都为我们编写多线程程序提供了很大的方便。今天我们来讨论另外一类容器：阻塞队列。在前面我们接触的队列都是非
数据结构面试常见问题工作学习小贴士 java 数据结构
数据结构是面试中经常被问及的重要主题之一，以下是一些常见的数据结构面试问题：什么是数据结构？为什么需要数据结构？数组和链表有什么区别？各自的优缺点是什么？树的常见类型有哪些？请解释它们的特点。图的常见表示方法有哪些？有向图和无向图有什么区别？栈和队列是什么？它们在哪些场景中有用？常见的排序算法有哪些？请分别介绍它们的思想和时间复杂度。什么是哈希表（HashTable）？它的工作原理是什么？如何处理
软通动力华为java机考题库_软通动力Java考试题库.doc 假行酥软通动力华为java机考题库
软通动力Java考试题库.doc软通动力培训课程题库Java编号：ISS-TJ-TC版本：1.0作者：JavaSE基础康佳琪日期作者：JavaEE高级张建军日期：审批人：张林福日期：目录JavaSE基础部分Java基础Java面向对象Java异常Java集合框架J2EE中，下列不属于集合类的是()。(选择一项)CVectorStackEnumerationHashtable2)在J2EE中，下列元
Hashtable排序 Roy_Sashulin J2se object java
Hashtable内部排列的方式是散列排布，所以当输出信息时会是无序的。为了能保证输出的数据按照顺序排列，不要渴望用java自带的函数来对Hashtable对象进行调整处理。当我们获取Hashtable里的KEY和VALUE时，一般都运行了Map.Entry类来转换，好，现在就用这个类来作文章，我具体写了一个方法。代码：/***方法名称：getSortedHashtable*参数：Hashtabl
数据结构与算法-哈希表时光不老c 数据结构与算法算法数据结构 java
引言在计算机科学中，数据结构与算法是构建高效软件系统的关键基石。其中，哈希表作为一种非常实用的数据结构，以其快速查找、插入和删除等特性，在诸多领域发挥着无可替代的作用。本文将深入探讨哈希表的工作原理、实现细节以及其在实际应用中的价值。一、什么是哈希表？哈希表（HashTable）是一种通过哈希函数将键（key）映射到特定数组索引位置的数据结构，以实现对数据的高效存储和检索。通过巧妙地设计哈希函数，
ConcurrentHashMap多线程下比HashTable效率更高 z.jiaminf java 开发语言
HashTable使用一把锁处理并发问题，当有多个线程访问时，需要多个线程竞争一把锁，导致阻塞ConcurrentHashMap则使用分段，相当于把一个HashMap分成多个，然后每个部分分配一把锁，这样就可以支持多线程访问术语定义术语英文解释哈希算法hashalgorithm是一种将任意内容的输入转换成相同长度输出的加密方式，其输出被称为哈希值。哈希表hashtable根据设定的哈希函数H(ke
hashcode方法一个人的飘
hashCode方法的主要作用是为了配合基于散列的集合一起正常运行，这样的散列集合包括HashSet、HashMap以及HashTable。为什么这么说呢？考虑一种情况，当向集合中插入对象时，如何判别在集合中是否已经存在该对象了？（注意：集合中不允许重复的元素存在）也许大多数人都会想到调用equals方法来逐个进行比较，这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据，如果采用eq
LeetCode 热题 100 Day01 庄园特聘拆椅狂魔刷题训练营 leetcode 数据结构算法
哈希模块哈希结构：哈希结构，即hashtable，哈希表|散列表结构。图摘自《代码随想录》哈希表本质上表示的元素和索引的一种映射关系。若查找某个数组中第n个元素，有两种方法：1.从头遍历，复杂度：O(n)2.使用数组这种hash结构，根据下标(索引)来查找，复杂度：O(1)实现了快速判断元素是否出现在集合里。哈希函数：哈希函数指：根据映射关系，构造hash表的方法哈希碰撞：当根据映射方法进行映射，
布隆过滤器 shuff1e
如果想要判断一个元素是不是在一个集合里，一般想到的是将所有元素保存起来，然后通过比较确定。，树等等数据结构都是这种思路.但是随着集合中元素的增加，我们需要的存储空间越来越大，检索速度也越来越慢(O(n),O(logn))。不过世界上还有一种叫作散列表（又叫哈希表，Hashtable）的数据结构。它可以通过一个Hash函数将一个元素映射成一个位阵列（Bitarray）中的一个点。这样一来，我们只要看
Object 有哪些常用方法？大致说一下每个方法的含义？说说Hashtable 与 HashMap 的区别？ weixin_53180424 java java jvm 开发语言
Object有哪些常用方法？大致说一下每个方法的含义？clone方法保护方法，实现对象的浅复制，只有实现了Cloneable接口才可以调用该方法，否则抛出CloneNotSupportedException异常，深拷贝也需要实现Cloneable，同时其成员变量为引用类型的也需要实现Cloneable，然后重写clone方法。finalize方法该方法和垃圾收集器有关系，判断一个对象是否可以被回收
数据结构1.0（基础） Network porter 日常数据结构前端
近java的介绍，文章目录第一章、数据结构1、数据结构？2、常用的数据结构数据结构？逻辑结构and物理结构第二章、数据结构基本介绍2.1、数组（Array）2.2、堆栈（Stack）2.3、队列（Queue）2.4、链表（LinkedList）2.5、树（Tree)2.6、散列表（Hashtable）哈希表2.7、堆，堆积（Heap）2.8、图（Graph）参考文章参考维基百科and菜鸟教程等第一
【Redis】深入理解 Redis 常用数据类型源码及底层实现(4.详解Hash数据结构) AQin1012 Redis Redis 中间件 Hash 数据结构源码分析
Hash数据结构看过前面的介绍，大家应该知道Redis的Hash结构的底层实现在6和7是不同的，Redis6是ziplist和hashtable，Redis7是listpack和hashtable。我们先使用configgethash*看下Redis6和Redis7的Hash结构配置情况（在Redis客户端的命令行界面中使用INFOserver可以查看包括版本号等各个信息）通过Docker拉取一个
哈希表？自律即自由w 散列表哈希算法数据结构
哈希表首先什么是哈希表，哈希表（英文名字为Hashtable，国内也有一些算法书籍翻译为散列表，大家看到这两个名称知道都是指hashtable就可以了）。哈希表是根据关键码的值而直接进行访问的数据结构。这么这官方的解释可能有点懵，其实直白来讲其实数组就是一张哈希表。哈希表中关键码就是数组的索引下标，然后通过下标直接访问数组中的元素，如下图所示：那么哈希表能解决什么问题呢，一般哈希表都是用来快速判断
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

c语言 数组散列 高效 HashTable Dictionary

你可能感兴趣的:(Hashtable)

c语言数组散列高效 HashTable Dictionary