【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)

本文章代码以c++为例!

一、力扣第242题:有效的字母异位词

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第1张图片

先说一下暴力的解法,两层for循环,同时还要记录字符是否重复出现,很明显时间复杂度是 O(n^2)。

暴力的方法这里就不做介绍了,直接看一下有没有更优的方式。

数组其实就是一个简单哈希表,而且这道题目中字符串只有小写字符,那么就可以定义一个数组,来记录字符串s里字符出现的次数。

如果对哈希表的理论基础关于数组,set,map不了解的话可以看这篇:关于哈希表,你该了解这些!

(opens new window)

需要定义一个多大的数组呢,定一个数组叫做record,大小为26 就可以了,初始化为0,因为字符a到字符z的ASCII也是26个连续的数值。

为了方便举例,判断一下字符串s= "aee", t = "eae"。

操作动画如下:

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第2张图片

定义一个数组叫做record用来上记录字符串s里字符出现的次数。

需要把字符映射到数组也就是哈希表的索引下标上,因为字符a到字符z的ASCII是26个连续的数值,所以字符a映射为下标0,相应的字符z映射为下标25。

再遍历 字符串s的时候,只需要将 s[i] - ‘a’ 所在的元素做+1 操作即可,并不需要记住字符a的ASCII,只要求出一个相对数值就可以了。 这样就将字符串s中字符出现的次数,统计出来了。

那看一下如何检查字符串t中是否出现了这些字符,同样在遍历字符串t的时候,对t中出现的字符映射哈希表索引上的数值再做-1的操作。

那么最后检查一下,record数组如果有的元素不为零0,说明字符串s和t一定是谁多了字符或者谁少了字符,return false。

最后如果record数组所有元素都为零0,说明字符串s和t是字母异位词,return true。

时间复杂度为O(n),空间上因为定义是的一个常量大小的辅助数组,所以空间复杂度为O(1)。

C++ 代码如下:

class Solution {
public:
    bool isAnagram(string s, string t) {
        int record[26] = {0};
        for (int i = 0; i < s.size(); i++) {
            // 并不需要记住字符a的ASCII,只要求出一个相对数值就可以了
            record[s[i] - 'a']++;
        }
        for (int i = 0; i < t.size(); i++) {
            record[t[i] - 'a']--;
        }
        for (int i = 0; i < 26; i++) {
            if (record[i] != 0) {
                // record数组如果有的元素不为零0,说明字符串s和t 一定是谁多了字符或者谁少了字符。
                return false;
            }
        }
        // record数组所有元素都为零0,说明字符串s和t是字母异位词
        return true;
    }
};
  • 时间复杂度: O(n)
  • 空间复杂度: O(1)

二、力扣第349题:两个数组的交集

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第3张图片

思路:

这道题目,主要要学会使用一种哈希数据结构:unordered_set,这个数据结构可以解决很多类似的问题。

注意题目特意说明:输出结果中的每个元素一定是唯一的,也就是说输出的结果的去重的, 同时可以不考虑输出结果的顺序

这道题用暴力的解法时间复杂度是O(n^2),那来看看使用哈希法进一步优化。

那么用数组来做哈希表也是不错的选择,例如242. 有效的字母异位词

(opens new window)

但是要注意,使用数组来做哈希的题目,是因为题目都限制了数值的大小。

而这道题目没有限制数值的大小,就无法使用数组来做哈希表了。

而且如果哈希值比较少、特别分散、跨度非常大,使用数组就造成空间的极大浪费。

此时就要使用另一种结构体了,set ,关于set,C++ 给提供了如下三种可用的数据结构:

  • std::set
  • std::multiset
  • std::unordered_set

std::set和std::multiset底层实现都是红黑树,std::unordered_set的底层实现是哈希表, 使用unordered_set 读写效率是最高的,并不需要对数据进行排序,而且还不要让数据重复,所以选择unordered_set。

思路如图所示:

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第4张图片

C++代码如下:

class Solution {
public:
    vector intersection(vector& nums1, vector& nums2) {
        unordered_set result_set; // 存放结果,之所以用set是为了给结果集去重
        unordered_set nums_set(nums1.begin(), nums1.end());
        for (int num : nums2) {
            // 发现nums2的元素 在nums_set里又出现过
            if (nums_set.find(num) != nums_set.end()) {
                result_set.insert(num);
            }
        }
        return vector(result_set.begin(), result_set.end());
    }
};
  • 时间复杂度: O(mn)
  • 空间复杂度: O(n)

代码解释如下:

这段代码实现了一个函数 intersection,它接受两个整数数组 nums1 和 nums2 作为参数,返回两个数组的交集。下面我会逐行详细解释这段代码的功能:
 
vector intersection(vector& nums1, vector& nums2) {

    这是函数的定义,它的返回类型是一个整数数组 vector。函数名是 intersection,参数列表中有两个引用类型的参数 nums1 和 nums2,这意味着在函数内部对这两个数组的修改将直接影响到调用函数时传入的实际数组。
 
unordered_set result_set; // 存放结果,之所以用set是为了给结果集去重

    这里定义了一个名为 result_set 的无序集合(unordered_set),用来存放结果集。使用集合的原因是可以自动去重,确保结果中不会有重复的元素。
 
unordered_set nums_set(nums1.begin(), nums1.end());

    这里通过 nums1 数组的迭代器构造了一个名为 nums_set 的无序集合。这样做的目的是为了在后面的比较过程中,能够快速地判断某个元素是否在 nums1 中出现过。
 
for (int num : nums2) {
    if (nums_set.find(num) != nums_set.end()) {
        result_set.insert(num);
    }
}

    这是一个循环,遍历了 nums2 数组中的每一个元素。在循环的每一步中,它检查当前元素 num 是否存在于 nums_set 集合中。如果存在,就将该元素插入到 result_set 集合中。
   
return vector(result_set.begin(), result_set.end());

    最后,将 result_set 集合转换为 vector 类型,然后作为函数的返回值返回。这样做可以将集合中的元素顺序化为一个数组,并返回给调用函数的地方。
总结一下,这段代码的功能是找出两个数组 nums1 和 nums2 的交集,并以数组的形式返回。它使用了无序集合来进行元素的去重和快速查找,从而实现了高效的计算交集的功能。

# 拓展

那有同学可能问了,遇到哈希问题我直接都用set不就得了,用什么数组啊。

直接使用set 不仅占用空间比数组大,而且速度要比数组慢,set把数值映射到key上都要做hash计算的。

不要小瞧 这个耗时,在数据量大的情况,差距是很明显的。

# 后记

本题后面 力扣改了 题目描述 和 后台测试数据,增添了 数值范围:

  • 1 <= nums1.length, nums2.length <= 1000
  • 0 <= nums1[i], nums2[i] <= 1000

所以就可以 使用数组来做哈希表了, 因为数组都是 1000以内的。

对应C++代码如下:

class Solution {
public:
    vector intersection(vector& nums1, vector& nums2) {
        unordered_set result_set; // 存放结果,之所以用set是为了给结果集去重
        int hash[1005] = {0}; // 默认数值为0
        for (int num : nums1) { // nums1中出现的字母在hash数组中做记录
            hash[num] = 1;
        }
        for (int num : nums2) { // nums2中出现话,result记录
            if (hash[num] == 1) {
                result_set.insert(num);
            }
        }
        return vector(result_set.begin(), result_set.end());
    }
};
  • 时间复杂度: O(m + n)
  • 空间复杂度: O(n)

三、力扣第202题:快乐数

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第5张图片

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第6张图片

思路:

这道题目看上去貌似一道数学问题,其实并不是!

题目中说了会 无限循环,那么也就是说求和的过程中,sum会重复出现,这对解题很重要!

正如:关于哈希表,你该了解这些!

(opens new window)中所说,当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法了。

所以这道题目使用哈希法,来判断这个sum是否重复出现,如果重复了就是return false, 否则一直找到sum为1为止。

判断sum是否重复出现就可以使用unordered_set。

还有一个难点就是求和的过程,如果对取数值各个位上的单数操作不熟悉的话,做这道题也会比较艰难。

C++代码如下:

class Solution {
public:
    // 取数值各个位上的单数之和
    int getSum(int n) {
        int sum = 0;
        while (n) {
            sum += (n % 10) * (n % 10);
            n /= 10;
        }
        return sum;
    }
    bool isHappy(int n) {
        unordered_set set;
        while(1) {
            int sum = getSum(n);
            if (sum == 1) {
                return true;
            }
            // 如果这个sum曾经出现过,说明已经陷入了无限循环了,立刻return false
            if (set.find(sum) != set.end()) {
                return false;
            } else {
                set.insert(sum);
            }
            n = sum;
        }
    }
};
  • 时间复杂度: O(logn)
  • 空间复杂度: O(logn)

四、力扣第1题:两数之和

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第7张图片

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第8张图片

思路:

很明显暴力的解法是两层for循环查找,时间复杂度是O(n^2)。 

这道题目是用数组作为哈希表来解决哈希问题,349. 两个数组的交集

(opens new window)这道题目是通过set作为哈希表来解决哈希问题。

首先我在强调一下 什么时候使用哈希法,当我们需要查询一个元素是否出现过,或者一个元素是否在集合里的时候,就要第一时间想到哈希法。

本题呢,我就需要一个集合来存放我们遍历过的元素,然后在遍历数组的时候去询问这个集合,某元素是否遍历过,也就是 是否出现在这个集合。

那么我们就应该想到使用哈希法了。

因为本地,我们不仅要知道元素有没有遍历过,还要知道这个元素对应的下标,需要使用 key value结构来存放,key来存元素,value来存下标,那么使用map正合适

再来看一下使用数组和set来做哈希法的局限。

  • 数组的大小是受限制的,而且如果元素很少,而哈希值太大会造成内存空间的浪费。
  • set是一个集合,里面放的元素只能是一个key,而两数之和这道题目,不仅要判断y是否存在而且还要记录y的下标位置,因为要返回x 和 y的下标。所以set 也不能用。

此时就要选择另一种数据结构:map ,map是一种key value的存储结构,可以用key保存数值,用value在保存数值所在的下标。

C++中map,有三种类型:

映射 底层实现 是否有序 数值是否可以重复 能否更改数值 查询效率 增删效率
std::map 红黑树 key有序 key不可重复 key不可修改 O(log n) O(log n)
std::multimap 红黑树 key有序 key可重复 key不可修改 O(log n) O(log n)
std::unordered_map 哈希表 key无序 key不可重复 key不可修改 O(1) O(1)

std::unordered_map 底层实现为哈希表,std::map 和std::multimap 的底层实现是红黑树。

同理,std::map 和std::multimap 的key也是有序的(这个问题也经常作为面试题,考察对语言容器底层的理解)。 更多哈希表的理论知识请看关于哈希表,你该了解这些!

(opens new window)。

这道题目中并不需要key有序,选择std::unordered_map 效率更高! 使用其他语言的录友注意了解一下自己所用语言的数据结构就行。

接下来需要明确两点:

  • map用来做什么
  • map中key和value分别表示什么

map目的用来存放我们访问过的元素,因为遍历数组的时候,需要记录我们之前遍历过哪些元素和对应的下标,这样才能找到与当前元素相匹配的(也就是相加等于target)

接下来是map中key和value分别表示什么。

这道题 我们需要 给出一个元素,判断这个元素是否出现过,如果出现过,返回这个元素的下标。

那么判断元素是否出现,这个元素就要作为key,所以数组中的元素作为key,有key对应的就是value,value用来存下标。

所以 map中的存储结构为 {key:数据元素,value:数组元素对应的下标}。

在遍历数组的时候,只需要向map去查询是否有和目前遍历元素匹配的数值,如果有,就找到的匹配对,如果没有,就把目前遍历的元素放进map中,因为map存放的就是我们访问过的元素。

过程如下:

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第9张图片

【LeetCode题目详解】242. 有效的字母异位词349. 两个数组的交集202. 快乐数1. 两数之和(day6补)_第10张图片

C++代码:

class Solution {
public:
    vector twoSum(vector& nums, int target) {
        std::unordered_map  map;
        for(int i = 0; i < nums.size(); i++) {
            // 遍历当前元素,并在map中寻找是否有匹配的key
            auto iter = map.find(target - nums[i]); 
            if(iter != map.end()) {
                return {iter->second, i};
            }
            // 如果没找到匹配对,就把访问过的元素和下标加入到map中
            map.insert(pair(nums[i], i)); 
        }
        return {};
    }
};
  • 时间复杂度: O(n)
  • 空间复杂度: O(n)

# 总结

本题其实有四个重点:

  • 为什么会想到用哈希表
  • 哈希表为什么用map
  • 本题map是用来存什么的
  • map中的key和value用来存什么的

把这四点想清楚了,本题才算是理解透彻了。

很多人把这道题目 通过了,但都没想清楚map是用来做什么的,以至于对代码的理解其实是 一知半解的。

day6(补)

 

你可能感兴趣的:(算法,数据结构,leetcode,c++)