leetcode--49--字母异位词分组

题目描述:

给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。

示例:

输入: ["eat", "tea", "tan", "ate", "nat", "bat"],
输出:
[
["ate","eat","tea"],
["nat","tan"],
["bat"]
]

解题思路1:排序字母解题

只要每个单词的字母按规律排好后组成的字符串相同, 则归为一类

构建一个字典dict,遍历字符串数组,将字符串进行排序后作为dict的key,字典的value是一个列表,字符串原串作为列表中的元素


代码1:

class Solution():
    def groupAnagrams(self, strs):
        dic = {}
        for word in strs:
            cur = str(sorted(word))  # ['a', 'e', 't']...['a', 'b', 't']
            if cur not in dic:
                dic[cur] = [word]    # [word] = ['eat']['tan']['bat']
            else:
                dic[cur].append(word)

        res = []
        for key, value in dic.items():
            res.append(value)
        return res

List = ["eat", "tea", "tan", "ate", "nat", "bat"]
s = Solution()
print(s.groupAnagrams(List))

结果为:[['eat', 'tea', 'ate'], ['tan', 'nat'], ['bat']]


代码2:

class Solution(object):
    def groupAnagrams(self, strs):
        """
        :type strs: List[str]
        :rtype: List[List[str]]
        """
        dt = {}
        for s in strs:
            str_sort = ''.join(sorted(list(s)))  # list(s)=['e', 'a', 't'],['t', 'e', 'a']...['b', 'a', 't']
            print(str_sort)
            if str_sort not in dt:
                dt[str_sort] = [s]
            else:
                dt[str_sort].append(s)

        return dt.values()

List = ["eat", "tea", "tan", "ate", "nat", "bat"]
s = Solution()
print(str(list(s.groupAnagrams(List))))

结果为:[['eat', 'tea', 'ate'], ['tan', 'nat'], ['bat']]


解题思路2:统计字频解题

一个单词最多由 26 个英文字母组成, 不就也可以建立一个哈希映射吗? 如:

对于单词 "aeat" :
建立哈希映射{ 'a' : 2 ; 'e' : 1; t : 1 }

key 为出现的单词, value 出现的频次。如果遍历每个 key 判断字母是否相等, 再判断出现次数是否相等, 这显然是更复杂了。

可以将每个字母出现的频次组成连续字符:

每个字母 a-z 出现频次: [2,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0]
组成字符串: "20001000000000000001000000"

只需判断每个单词的字母频次字符串是否相同就可以了。

对于求词频还可以优化, 字母数量固定 26 个, 直接建立一个长度为 26 的数组, 其索引代表二十六个字母位, 遍历单词中的字母, 字母每出现一次, 数组中代表该字母的元素值加 1。

这样就避免了排序操作

import collections  # Python中通过Key访问字典,当Key不存在时,会引发‘KeyError’异常。为了避免这种情况的发生,可以使用collections类中的defaultdict()方法来为字典提供默认值。

class Solution:
    def groupAnagrams(self, strs):
        ans = collections.defaultdict(list)  # 建立映射关系
        for s in strs:                       # 遍历该字符串数组
            count = [0] * 26   # 建立一个 26 字母的映射关系
            for c in s:       # 遍历字符串每个字母
                count[ord(c) - 97] += 1   # 每个字母出现的频次(元素值)加1 , ord()函数的返回值是对应的十进制整数
            ans[tuple(count)].append(s)   # 加入其对应的 Value 所在的数组
        return ans.values()  # 返回 Values 组成的数组

List = ["eat", "tea", "tan", "ate", "nat", "bat"]
s = Solution()
print(str(list(s.groupAnagrams(List))))

结果为:[['eat', 'tea', 'ate'], ['tan', 'nat'], ['bat']]


学习链接:

[1]. python关于dict类型数据怎么去掉dict_values()和dict_keys()前缀
[2]. python中join函数
[3]. collections.defaultdict()的使用
[4]. Collections模块-python

拓展解法:

[1]. LeetCode 49: 字母异位词分组 Group Anagrams

你可能感兴趣的:(多味的LeetCode,leetcode,字母异位词分组)