⭐算法入门⭐《哈希表》中等04 —— LeetCode 347. 前 K 个高频元素

文章目录

  • 一、题目
    • 1、题目描述
    • 2、基础框架
    • 3、原题链接
  • 二、解题报告
    • 1、思路分析
    • 2、时间复杂度
    • 3、代码详解
  • 三、本题小知识
  • 四、加群须知

一、题目

1、题目描述

  给你一个整数数组nums和一个整数k,请你返回其中出现频率前k高的元素。你可以按 任意顺序 返回答案。
  样例输入: nums = [1,1,1,2,2,3], k = 2
  样例输出: [1,2]

2、基础框架

  • C语言 版本给出的基础框架代码如下:
int* topKFrequent(int* nums, int numsSize, int k, int* returnSize){
     }

3、原题链接

LeetCode 347. 前 K 个高频元素
剑指 Offer II 060. 出现频率最高的 k 个数字

二、解题报告

1、思路分析

  首先,建立一个 1 0 5 10^5 105 的哈希表;
  2)遍历一遍所有元素,并且在哈希表中记录;
  3)再建立一个桶,桶的每个元素是一个链表头,链表结点的元素代表了具体数字,桶的的位置代表了数字的出现次数,遍历哈希表记录到桶中;注意,插入桶的时候采用头插,这样可以做到每次插入都是 O ( 1 ) O(1) O(1)
  4)将桶从后往前遍历,获取前 k k k 大的链表头记录下所有数字;

2、时间复杂度

  由于需要把所有元素都遍历一遍,所以时间复杂度为 O ( n ) O(n) O(n)

3、代码详解


/******************** 哈希表 开放定址法 ********************/
#define maxn (1<<17)
#define mask (maxn-1)
#define DataType int
#define Boolean int
#define NULLKEY (1<<30)    /* 空槽标记不能用-1,会导致正常值也为-1的情况*/

typedef struct {
     
    DataType data[maxn];
}HashTable;

void HashInit(HashTable *ht) {
     
    int i;
    for(i = 0; i < maxn; ++i) {
     
        ht->data[i] = NULLKEY;
    }
}

int HashGetAddr(DataType key) {
     
    return key & mask;        // 除留余数法
}

Boolean HashSearchKey(HashTable *ht, DataType key, int *addr) {
     
    int startaddr = HashGetAddr(key);
    *addr = startaddr;
    while(ht->data[*addr] != key) {
     
        *addr = HashGetAddr(*addr + 1);
        if(ht->data[*addr] == NULLKEY) {
     
            return 0;                    // 遇到了空槽,说明没找到,返回 0
        }
        if(*addr == startaddr) {
     
            return 0;                    // 找了一圈都没找到,循环了
        }
    }
    return 1;
}

int HashInsert(HashTable *ht, DataType key) {
     
    int addr = HashGetAddr(key);
    int retaddr;
    if ( HashSearchKey(ht, key, &retaddr ) ) {
     
        return retaddr;
    } 
    while(ht->data[addr] != NULLKEY)
        addr = HashGetAddr(addr + 1);
    ht->data[addr] = key;
    return addr;
}

int HashRemove(HashTable *ht, DataType key) {
     
    int addr;
    if ( !HashSearchKey(ht, key, &addr ) ) {
     
        return NULLKEY;
    } 
    ht->data[addr] = NULLKEY;
    return addr;
}

/******************** 哈希表 开放定址法 ********************/





HashTable ht;
int Hash[maxn];
struct Node {
     
    int val;
    struct Node *next;
};
struct Node *Bucket[maxn];

void add(struct Node **Bucket, int pos, int val) {
          // (1)
    struct Node* tmp = (struct Node*) malloc( sizeof(struct Node) );
    tmp->val = val;
    tmp->next = Bucket[pos];
    Bucket[pos] = tmp;
}

int* topKFrequent(int* nums, int numsSize, int k, int* returnSize){
     
    int i, hashVal, *ret;
    struct Node *head;
    HashInit(&ht);                                    // (2)
    memset(Hash, 0, sizeof(Hash));                    // (3)
    memset(Bucket, NULL, sizeof(Bucket));             // (4)
    for(i = 0; i < numsSize; ++i) {
     
        hashVal = HashInsert(&ht, nums[i]);           // (5)
        ++ Hash[ hashVal ];                           // (6)
    }
    for(i = 0; i < maxn; ++i) {
     
        if(Hash[i]) {
     
            add(Bucket, Hash[i], i);                  // (7)
        }
    }
    ret = (int *)malloc( maxn * sizeof(int) );        // (8)
    *returnSize = 0;                                  // (9)

    for(i = maxn-1; i >= 0; --i) {
     
        if(!k) {
     
            break;
        }
        if(Bucket[i]) {
     
            head = Bucket[i];                        // (10)
            while(head) {
     
                ret[ (*returnSize)++ ] = ht.data[ head->val ];
                head = head->next;                   // (11)
                --k;
            }
        }
    }
    return ret;
}
  • ( 1 ) (1) (1) 在 pos 这个桶的位置,插入一个值为 val 的元素;
  • ( 2 ) (2) (2) 用于大范围整数到小范围整数的散列哈希;
  • ( 3 ) (3) (3) 初始化元素哈希计数器;
  • ( 4 ) (4) (4) 初始化桶;
  • ( 5 ) (5) (5) 由于数字范围不确定,所以需要获取一个映射后的值;
  • ( 6 ) (6) (6) 增加计数器;
  • ( 7 ) (7) (7) 计数器不为0,则将 i 这个值插入桶中,位置为 Hash[i];
  • ( 8 ) (8) (8) 生成结果数组;
  • ( 9 ) (9) (9) 生成结果数组的长度;
  • ( 10 ) (10) (10) 获取对应位置的桶的头结点;
  • ( 11 ) (11) (11) 遍历桶对应的链表,将答案存到结果数组中;

三、本题小知识

  当数字范围不确定的时候,需要采用哈希函数进行映射取模到下标,才能映射到数组中。


四、加群须知

  相信看我文章的大多数都是「 大学生 」,能上大学的都是「 精英 」,那么我们自然要「 精益求精 」,如果你还是「 大一 」,那么太好了,你拥有大把时间,当然你可以选择「 刷剧 」,然而,「 学好算法 」,三年后的你自然「 不能同日而语 」
  那么这里,我整理了「 几十个基础算法 」 的分类,点击开启:

算法入门指引

  如果链接被屏蔽,或者有权限问题,可以私聊作者解决。

  大致题集一览:


在这里插入图片描述


  为了让这件事情变得有趣,以及「 照顾初学者 」,目前题目只开放最简单的算法 「 枚举系列 」 (包括:线性枚举、双指针、前缀和、二分枚举、三分枚举),当有 一半成员刷完 「 枚举系列 」 的所有题以后,会开放下个章节,等这套题全部刷完,你还在群里,那么你就会成为「 夜深人静写算法 」专家团 的一员。
  不要小看这个专家团,三年之后,你将会是别人 望尘莫及 的存在。如果要加入,可以联系我,考虑到大家都是学生, 没有「 主要经济来源 」,在你成为神的路上,「 不会索取任何 」
  联系作者,或者扫作者主页二维码加群,加入刷题行列吧


让天下没有难学的算法

C语言免费动漫教程,和我一起打卡!
光天化日学C语言

入门级C语言真题汇总
C语言入门100例

几张动图学会一种数据结构
画解数据结构

组团学习,抱团生长
算法入门指引

竞赛选手金典图文教程
夜深人静写算法

你可能感兴趣的:(《LeetCode算法全集》,算法,leetcode,数据结构,哈希表,除留余数法)