集合与字典 :
- 集合常见的形式是Set,字典常见的形式是Map
- Set 和 Map 主要的应用场景在于 数据重组 和 数据储存。
集合 与 字典 的区别:
- 共同点:集合、字典 可以储存不重复的值
- 不同点:集合类似于数组,元素的只有key没有value,value就是key。字典是以 [key, value] 的形式储存,键的范围不限于字符串,各种类型的值(包括对象)都可以当作键
时间复杂度:
set或map可以用哈希表或平衡二叉搜索树实现
哈希表实现的map或者set查找的时间复杂度是O(1)
,哈希表优点是查找非常快,哈希表的缺点是失去了数据的顺序性,平衡二叉搜索树实现的map或set查找时间复杂度是O(logn)
,它保证了数据顺序性
哈希函数
哈希函数是一个接受输入值的函数,由此输入计算出一个确定输出。
- 均匀分布:哈希函数计算出来的地址均匀分布
哈希碰撞:哈希函数计算出来的结果冲突
- 开放定址法
- 链地址法
242. 有效的字母异位词 (easy)
给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。
注意:若 s 和 t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词。
示例 1:
输入: s = "anagram", t = "nagaram"
输出: true
示例 2:输入: s = "rat", t = "car"
输出: false提示:
1 <= s.length, t.length <= 5 * 104
s 和 t 仅包含小写字母进阶: 如果输入字符串包含 unicode 字符怎么办?你能否调整你的解法来应对这种情况?
方法1.排序
- 思路:两个字符串转成数组,排序后转回字符串进行比较。
- 复杂度分析:时间复杂度
O(nlogn)
,排序采用快排,时间复杂度是nlogn,比较两字符串是否相等时间复杂度为n,O(n)+O(nlogn)=O(nlogn)
。空间复杂度为O(logn)
,排序需要O(logn)
的空间,java和js字符串是不可变的,需要额外的O(n)
空间来拷贝字符串,我们忽略这个复杂度,这依赖不同语言实现的细节。
方法2.哈希表:
- 思路:采用空间换时间的策略,准备一个数组,循环字符串s,每个元素出现一次加1,然后循环t元素,每次出现的字符减1,如果t中出现一些不在s中的字符 则返回false,所有循环结束 说明两个字符串中每个字符的数量相同
- 复杂度分析: 时间复杂度
O(n)
,n是字符串的长度,空间复杂度O(s)
,s为字符集大小
js:
var isAnagram = function(s, t) {
if (s.length !== t.length) {//长度不想等 直接返回false
return false;
}
const table = new Array(26).fill(0);//大小为26的数组
for (let i = 0; i < s.length; ++i) {//循环字符串s,每个元素出现一次加1
table[s.codePointAt(i) - 'a'.codePointAt(0)]++;
}
for (let i = 0; i < t.length; ++i) {//循环t元素
table[t.codePointAt(i) - 'a'.codePointAt(0)]--;//每次出现的字符减1
//如果t中出现一些字符对于s中的字符 则返回false
if (table[t.codePointAt(i) - 'a'.codePointAt(0)] < 0) {
return false;
}
}
return true;//所有循环结束 说明两个字符串中每个字符的数量相同
}
454. 四数相加 II( medium)
给你四个整数数组 nums1、nums2、nums3 和 nums4 ,数组长度都是 n ,请你计算有多少个元组 (i, j, k, l) 能满足:
0 <= i, j, k, l < n
nums1[i] + nums2[j] + nums3[k] + nums4[l] == 0示例 1:
输入:nums1 = [1,2], nums2 = [-2,-1], nums3 = [-1,2], nums4 = [0,2]
输出:2
解释:
两个元组如下:
- (0, 0, 0, 1) -> nums1[0] + nums2[0] + nums3[0] + nums4[1] = 1 + (-2) + (-1) + 2 = 0
- (1, 1, 0, 0) -> nums1[1] + nums2[1] + nums3[0] + nums4[0] = 2 + (-1) + (-1) + 0 = 0
示例 2:输入:nums1 = [0], nums2 = [0], nums3 = [0], nums4 = [0]
输出:1提示:
n == nums1.length
n == nums2.length
n == nums3.length
n == nums4.length
1 <= n <= 200
-228 <= nums1[i], nums2[i], nums3[i], nums4[i] <= 228
方法1:哈希表
- 思路:在A和B中取出两个数的组合,将这两个数的和作为键,出现次数作为值加入哈希表中,循环C、D,判断C和D中是否存在两个数的和 加 AB中的俩元素的和正好是0,统计组合数
- 复杂度:时间复杂度
O(n^2)
,两个嵌套循环。空间复杂度O(n^2)
,哈希表的空间,最差的情况下是n^2
js:
var fourSumCount = function(A, B, C, D) {
const countAB = new Map();
//在A和B中取出两个数的组合,将这两个数的和作为键,出现次数作为值加入哈希表中,
A.forEach(u => B.forEach(v => countAB.set(u + v, (countAB.get(u + v) || 0) + 1)));
let ans = 0;
for (let u of C) {//循环C、D
for (let v of D) {
if (countAB.has(-u - v)) {//判断C和D中是否存在两个数的和 加 AB中的俩元素的和正好是0
ans += countAB.get(-u - v);//累加组合数
}
}
}
return ans;
};
187. 重复的DNA序列 (medium)
DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。
例如,"ACGAATTCCG" 是一个 DNA序列 。
在研究 DNA 时,识别 DNA 中的重复序列非常有用。给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
示例 1:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]提示:
0 <= s.length <= 105
s[i]=='A'、'C'、'G' or 'T'
- 思路:用map存储子串出现的次数,循环dna序列,每次截取长度为10的子串,加入map中 并更新出现的次数,次数超过2,加入ans
- 复杂度:时间复杂度
O(n)
,n是字符串的长度。空间复杂度O(n)
js:
var findRepeatedDnaSequences = function(s) {
const L = 10;
const ans = [];
const cnt = new Map();
const n = s.length;
for (let i = 0; i <= n - L; ++i) {
const sub = s.slice(i, i + L)//截取长度为10的子串
cnt.set(sub, (cnt.get(sub) || 0) + 1);//加入map中 并更新出现的次数
if (cnt.get(sub) === 2) {
ans.push(sub);
}
}
return ans;
};
1. 两数之和 (easy)
给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。
你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。
你可以按任意顺序返回答案。
示例 1:
输入:nums = [2,7,11,15], target = 9
输出:[0,1]
解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1] 。
示例 2:输入:nums = [3,2,4], target = 6
输出:[1,2]
示例 3:输入:nums = [3,3], target = 6
输出:[0,1]提示:
2 <= nums.length <= 104
-109 <= nums[i] <= 109
-109 <= target <= 109
只会存在一个有效答案
进阶:你可以想出一个时间复杂度小于 O(n2) 的算法吗?
方法1.暴力枚举
- 思路:两层for循环,第一层
for i:0->n
-1, 枚举nums中的每一个数x,第二层for j:i+1->n-1
,寻找是否存在两个数字的和是target。 - 复杂度分析:时间复杂度:
O(n^2)
, n为数组的长度。空间复杂度O(1)
。
方法2.哈希表:
- 思路:方法一第一层循环是必须的,关键是优化第二次循环,也就是寻找
targrt-x
的过程,这里关键采用空间换时间,也就是采用哈希表进行优化,让查找的过程变为O(1)
。首先还是遍历nums数组,然后在哈希表中寻找target-x
,如果不存在就把当前元素x和下标存入哈希表,如果存在就返回target-x
和当前元素的下标 - 复杂度分析:时间复杂度
O(n)
, n为数组的长度,空间复杂度O(n)
,n为数组的长度,主要是哈希表的空间开销
js:
var twoSum = function (nums, target) {
const map = new Map();
for (let i = 0; i < nums.length; i++) {//第一层循环
const complement = target - nums[i];
if (map.has(complement)) {//判断complement是否在map中
return [map.get(complement), i]; //存在的话返回两个数的下标
} else {
map.set(nums[i], i);//不存在map中就将当前元素和下标存入map
}
}
return [];
};
447. 回旋镖的数量 (medium)
给定平面上 n 对 互不相同 的点 points ,其中 points[i] = [xi, yi] 。回旋镖 是由点 (i, j, k) 表示的元组 ,其中 i 和 j 之间的距离和 i 和 k 之间的欧式距离相等(需要考虑元组的顺序)。
返回平面上所有回旋镖的数量。
示例 1:
输入:points = [[0,0],[1,0],[2,0]]
输出:2
解释:两个回旋镖为 [[1,0],[0,0],[2,0]] 和 [[1,0],[2,0],[0,0]]
示例 2:输入:points = [[1,1],[2,2],[3,3]]
输出:2
示例 3:输入:points = [[1,1]]
输出:0提示:
n == points.length
1 <= n <= 500
points[i].length == 2
-104 <= xi, yi <= 104
所有点都 互不相同
- 思路:循环数组,找出与当前元素距离相同的点,记录频次加入map中,最后循环map,从相同距离的数量中选取两个组合出来,加入结果中。从m个元素中选取两个的排列组合数 是
m*(m-1)
- 复杂度:时间复杂度
O(n^2)
,数组遍历两层,空间复杂度O(n)
,哈希表的空间
js:
//m = {1:3,2:5}
var numberOfBoomerangs = function (points) {
let ans = 0;
for (const p of points) {
const m = new Map();
for (const q of points) {
//统计距离当前点相同距离的数量 加入map中
const dis = (p[0] - q[0]) * (p[0] - q[0]) + (p[1] - q[1]) * (p[1] - q[1]);
m.set(dis, (m.get(dis) || 0) + 1);
}
for (const [_, item] of m.entries()) {//从相同距离的点的数量中选取两个
ans += item * (item - 1);
}
}
return ans;
};
49. 字母异位词分组 (medium)
给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。
字母异位词 是由重新排列源单词的字母得到的一个新单词,所有源单词中的字母通常恰好只用一次。
示例 1:
输入: strs = ["eat", "tea", "tan", "ate", "nat", "bat"]
输出: [["bat"],["nat","tan"],["ate","eat","tea"]]
示例 2:输入: strs = [""]
输出: [[""]]
示例 3:输入: strs = ["a"]
输出: [["a"]]提示:
1 <= strs.length <= 104
0 <= strs[i].length <= 100
strs[i] 仅包含小写字母
方法1.排序
- 思路:遍历字符串数组,对每个字符串中的字符排序,加入map对应的key的数组中。
- 复杂度:时间复杂度
O(n*klogk)
,n是字符串的个数,k是最长的字符串的长度,排序复杂度O(klogk)
,n次排序,哈希表更新O(1)
。空间复杂度O(nk)
,排序空间复杂度O(nlogk)
,map空间复杂度O(nk)
,取较大的O(nk)
js:
var groupAnagrams = function(strs) {
const map = new Map();
for (let str of strs) {
let array = Array.from(str);//字符转成数组
array.sort();//排序
let key = array.toString();
let list = map.get(key) ? map.get(key) : new Array();//从map中取到相应的数组
list.push(str);//加入数组
map.set(key, list);//重新设置该字符的数组
}
return Array.from(map.values());//map中的value转成数组
};
方法2.计数
- 思路:题意是字符串的字符都是小写,可以对每个字符串统计其中字符的频次,将每个字符频次相同的字符串放在一组
- 复杂度:时间复杂度
O(n*k)
,n是字符串个数,k是最长字符串长度,循环字符串数组复杂度O(n)
,对每个字符串统计频次复杂度O(k)
。空间复杂度O(n*k)
,map中存放了n个大小最长为k的字符串。
js:
var groupAnagrams = function(strs) {
const map = {};
for (let s of strs) {//循环字符串数组
const count = new Array(26).fill(0);//字符都是小写,初始化大小为26的数组
for (let c of s) {//对字符串的每个字符统计频次
count[c.charCodeAt() - 'a'.charCodeAt()]++;
}
map[count] ? map[count].push(s) : map[count] = [s];//加入map
}
return Object.values(map);
};
视频讲解:传送门