题目描述:
给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。
示例:
输入: ["eat", "tea", "tan", "ate", "nat", "bat"],
输出:
[
["ate","eat","tea"],
["nat","tan"],
["bat"]
]
解题思路1:排序字母解题
只要每个单词的字母按规律排好后组成的字符串相同, 则归为一类
构建一个字典dict,遍历字符串数组,将字符串进行排序后作为dict的key,字典的value是一个列表,字符串原串作为列表中的元素
代码1:
class Solution():
def groupAnagrams(self, strs):
dic = {}
for word in strs:
cur = str(sorted(word)) # ['a', 'e', 't']...['a', 'b', 't']
if cur not in dic:
dic[cur] = [word] # [word] = ['eat']['tan']['bat']
else:
dic[cur].append(word)
res = []
for key, value in dic.items():
res.append(value)
return res
List = ["eat", "tea", "tan", "ate", "nat", "bat"]
s = Solution()
print(s.groupAnagrams(List))
结果为:[['eat', 'tea', 'ate'], ['tan', 'nat'], ['bat']]
代码2:
class Solution(object):
def groupAnagrams(self, strs):
"""
:type strs: List[str]
:rtype: List[List[str]]
"""
dt = {}
for s in strs:
str_sort = ''.join(sorted(list(s))) # list(s)=['e', 'a', 't'],['t', 'e', 'a']...['b', 'a', 't']
print(str_sort)
if str_sort not in dt:
dt[str_sort] = [s]
else:
dt[str_sort].append(s)
return dt.values()
List = ["eat", "tea", "tan", "ate", "nat", "bat"]
s = Solution()
print(str(list(s.groupAnagrams(List))))
结果为:[['eat', 'tea', 'ate'], ['tan', 'nat'], ['bat']]
解题思路2:统计字频解题
一个单词最多由 26 个英文字母组成, 不就也可以建立一个哈希映射吗? 如:
对于单词 "aeat" :
建立哈希映射{ 'a' : 2 ; 'e' : 1; t : 1 }
key 为出现的单词, value 出现的频次。如果遍历每个 key 判断字母是否相等, 再判断出现次数是否相等, 这显然是更复杂了。
可以将每个字母出现的频次组成连续字符:
每个字母 a-z 出现频次: [2,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0]
组成字符串: "20001000000000000001000000"
只需判断每个单词的字母频次字符串是否相同就可以了。
对于求词频还可以优化, 字母数量固定 26 个, 直接建立一个长度为 26 的数组, 其索引代表二十六个字母位, 遍历单词中的字母, 字母每出现一次, 数组中代表该字母的元素值加 1。
这样就避免了排序操作
import collections # Python中通过Key访问字典,当Key不存在时,会引发‘KeyError’异常。为了避免这种情况的发生,可以使用collections类中的defaultdict()方法来为字典提供默认值。
class Solution:
def groupAnagrams(self, strs):
ans = collections.defaultdict(list) # 建立映射关系
for s in strs: # 遍历该字符串数组
count = [0] * 26 # 建立一个 26 字母的映射关系
for c in s: # 遍历字符串每个字母
count[ord(c) - 97] += 1 # 每个字母出现的频次(元素值)加1 , ord()函数的返回值是对应的十进制整数
ans[tuple(count)].append(s) # 加入其对应的 Value 所在的数组
return ans.values() # 返回 Values 组成的数组
List = ["eat", "tea", "tan", "ate", "nat", "bat"]
s = Solution()
print(str(list(s.groupAnagrams(List))))
结果为:[['eat', 'tea', 'ate'], ['tan', 'nat'], ['bat']]
学习链接:
[1]. python关于dict类型数据怎么去掉dict_values()和dict_keys()前缀
[2]. python中join函数
[3]. collections.defaultdict()的使用
[4]. Collections模块-python
拓展解法:
[1]. LeetCode 49: 字母异位词分组 Group Anagrams