python算法日记(字符串系列)_leetcode 49. 字母异位词分组

给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。

示例:

输入: ["eat", "tea", "tan", "ate", "nat", "bat"],
输出:
[
  ["ate","eat","tea"],
  ["nat","tan"],
  ["bat"]
]
说明:

所有输入均为小写字母。
不考虑答案输出的顺序。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/group-anagrams


这道题的关键在于:1.要把模式,值存到一个hash表中。2.一个模式对于多个值,值用[]存,一组值的模式应该相同,考虑什么模式可以存进键中。(因为hash索引,键中只能存不可变元素,比如str'',tuple()。可变元素list[],set{}是不能塞进键中的)

leetcode官方解答一:链接:https://leetcode-cn.com/problems/group-anagrams/solution/zi-mu-yi-wei-ci-fen-zu-by-leetcode/ 来源:力扣(LeetCode)

class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        ans = collections.defaultdict(list)
        for s in strs:
            ans[tuple(sorted(s))].append(s)
        return list(ans.values())

defaultdict和普通dict的区别是,如果字典中没有值,defaultdict会返回一个默认值。相当于普通dict:dict.get("a", 0)。键a没有值时,默认返回0,等同于dict = defautldict(int),dict[a] 默认返回0。defautldict(list)默认返回空链表[].用这个是为了第一次存值时不报错。

官方解答中用了sorted排序使得模式都相同,并用tuple值作为键,因为tuple是不可变元素。第一组模式(a,e,t)

自己用字符串做键:

class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        sim_dict = {}
        for word in strs:
            w = ''.join(sorted(word)) #用字符串表示模式,可以放进下一行里面
            sim_dict.setdefault(w, []).append(word) #跟defaultdict差不多意思
        return list(sim_dict.values())

最开始想比较几个值的set是否相同,但set不能做键所以不行

leetcode官方解答二:链接:https://leetcode-cn.com/problems/group-anagrams/solution/zi-mu-yi-wei-ci-fen-zu-by-leetcode/ 来源:力扣(LeetCode)

class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        ans = collections.defaultdict(list)
        for s in strs:
            count = [0] * 26
            for c in s:
                count[ord(c) - ord('a')] += 1
            ans[tuple(count)].append(s)
        return list(ans.values())

这个方法很有意思,相当于nlp里的one-hot.因为只考虑小写英文字母,建立字典[0]*26

 ['eat', 'tea', 'ate']它们的模式的tuple类型都为:

(1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0) a,e,t

 

 

 

你可能感兴趣的:(python算法日记(字符串系列)_leetcode 49. 字母异位词分组)