icoding数据结构——哈希表添加(详细注释)

题目:

哈希表(Hash Table,也叫散列表),是根据键(Key)而直接访问在内存存储位置的数据结构。也就是说,它通过计算一个关于键值的函数,将所需查询的数据映射到表中一个位置来访问记录,这加快了查找速度。这个映射函数称做哈希函数,存放记录的数组称做哈希表。哈希表相关定义如下:

typedef enum{
    HASH_OK,
    HASH_ERROR,
    HASH_ADDED,
    HASH_REPLACED_VALUE,
    HASH_ALREADY_ADDED,
    HASH_DELETED,
    HASH_NOT_FOUND,
} HASH_RESULT;

typedef struct __HashEntry HashEntry;
struct __HashEntry{
    union{
        char  *str_value;
        double dbl_value;
        int       int_value;
    } key;
    union{
        char  *str_value;
        double dbl_value;
        int       int_value;
        long   long_value;
        void  *ptr_value;
    } value;
    HashEntry *next;
};

struct __HashTable{
    HashEntry **bucket;        
    int size;
    HASH_RESULT last_error;
};
typedef struct __HashTable HashTable;

// 向哈希表中添加元素,其中键类型为char*, 元素类型为int。
HASH_RESULT hash_add_int(HashTable * table, const char * key, int value);

哈希表相关说明:

  • HASH_RESULT 类型为相关函数的返回类型
  • HashEntry 为哈希表所保存元素(即键值对 《key, value》)类型
  • HashTable 为哈希表,其中 bucket 指向大小为size的、元素类型为 HashEntry*的指针数组
  • 哈希表采用链地址法处理冲突

请实现 hash_add_int 函数,向哈希表中添加元素,其中键类型为char*, 元素类型为int。在添加过程中,如果要添加的键值key已在哈希表中,且对应的值value也已存在,则函数返回 HASH_ALREADY_ADDED;如果要添加的键值key已在哈希表中,但对应的值value不同,则函数将value值更新到哈希表中,之后返回 HASH_REPLACED_VALUE;如果要添加的键值key不在哈希表中,则函数创建 HashEntry 类型,并将其加入到哈希表中,且函数返回 HASH_ADDED。本题所用的哈希函数如下:

long hash_string(const char *str)
{
    long hash = 5381;
    int c;

    while (c = *str++)
        hash = ((hash << 5) + hash) + c; /* hash * 33 + c */
    if(hash < 0)
        hash *= -1;
    return hash;
}

代码:

#include 
#include "stdlib.h"
#include "hash.h"
#include 

HASH_RESULT hash_add_int(HashTable* table, const char* key, int value) {
    long hash_value = hash_string(key);  // 计算键的哈希值
    int index = hash_value % table->size;  // 根据哈希值计算链表头指针数组索引

    // 在对应链表中查找是否已存在相同的键
    HashEntry* entry = table->bucket[index];
    while (entry != NULL) {
        if (strcmp(entry->key.str_value, key) == 0) {
            // 键已存在
            if (entry->value.int_value != value) {
                // 值不同,更新值
                entry->value.int_value = value;
                return HASH_REPLACED_VALUE;
            } else {
                // 值相同,不做修改
                return HASH_ALREADY_ADDED;
            }
        }
        entry = entry->next;
    }

    // 创建新的哈希表元素
    HashEntry* new_entry = (HashEntry*)malloc(sizeof(HashEntry));
    if (new_entry == NULL) {
        return HASH_ERROR;
    }

    // 复制键字符串到新的内存中 
    // 注意在分配new_entry->key.str_value的内存时,为了容纳字符串结尾的空字符\0,我们将分配的大小设置为strlen(key)+1
    new_entry->key.str_value = (char*)malloc(sizeof(char) * (strlen(key) + 1));
    if (new_entry->key.str_value == NULL) {
        free(new_entry);
        return HASH_ERROR;
    }
    strcpy(new_entry->key.str_value, key);

    // 设置值
    new_entry->value.int_value = value;

    // 头插法
    new_entry->next = table->bucket[index];
    table->bucket[index] = new_entry;

    return HASH_ADDED;
}

你可能感兴趣的:(数据结构,数据结构,散列表,哈希算法,算法,c语言)