给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。
示例:
输入: ["eat", "tea", "tan", "ate", "nat", "bat"],
输出:
[
["ate","eat","tea"],
["nat","tan"],
["bat"]
]
说明:
所有输入均为小写字母。
不考虑答案输出的顺序。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/group-anagrams
这道题的关键在于:1.要把模式,值存到一个hash表中。2.一个模式对于多个值,值用[]存,一组值的模式应该相同,考虑什么模式可以存进键中。(因为hash索引,键中只能存不可变元素,比如str'',tuple()。可变元素list[],set{}是不能塞进键中的)
leetcode官方解答一:链接:https://leetcode-cn.com/problems/group-anagrams/solution/zi-mu-yi-wei-ci-fen-zu-by-leetcode/ 来源:力扣(LeetCode)
class Solution:
def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
ans = collections.defaultdict(list)
for s in strs:
ans[tuple(sorted(s))].append(s)
return list(ans.values())
defaultdict和普通dict的区别是,如果字典中没有值,defaultdict会返回一个默认值。相当于普通dict:dict.get("a", 0)。键a没有值时,默认返回0,等同于dict = defautldict(int),dict[a] 默认返回0。defautldict(list)默认返回空链表[].用这个是为了第一次存值时不报错。
官方解答中用了sorted排序使得模式都相同,并用tuple值作为键,因为tuple是不可变元素。第一组模式(a,e,t)
自己用字符串做键:
class Solution:
def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
sim_dict = {}
for word in strs:
w = ''.join(sorted(word)) #用字符串表示模式,可以放进下一行里面
sim_dict.setdefault(w, []).append(word) #跟defaultdict差不多意思
return list(sim_dict.values())
最开始想比较几个值的set是否相同,但set不能做键所以不行
leetcode官方解答二:链接:https://leetcode-cn.com/problems/group-anagrams/solution/zi-mu-yi-wei-ci-fen-zu-by-leetcode/ 来源:力扣(LeetCode)
class Solution:
def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
ans = collections.defaultdict(list)
for s in strs:
count = [0] * 26
for c in s:
count[ord(c) - ord('a')] += 1
ans[tuple(count)].append(s)
return list(ans.values())
这个方法很有意思,相当于nlp里的one-hot.因为只考虑小写英文字母,建立字典[0]*26
['eat', 'tea', 'ate']它们的模式的tuple类型都为:
(1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0) a,e,t