给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。
示例:
输入:
[“eat”, “tea”, “tan”, “ate”, “nat”, “bat”],
输出:
[ [“ate”,“eat”,“tea”],
[“nat”,“tan”],
[“bat”] ]
解法一
美版leetcode大神的思路,用质数表示26个字母,把字符串的各个字母相乘,这样可保证字母异位词的乘积必定是相等的。用map存储。
int[] arr = {2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97,101};
public List<List<String>> groupAnagrams2(String[] strs) {
List<List<String>> list = new ArrayList<>();
HashMap<Long,Integer> map = new HashMap<>();
for(String i : strs){
int index = contains(map,i);
if(index!=-1){
list.get(index).add(i);
}else{
int s = map.size();
List<String> li = new ArrayList<>();
li.add(i);
list.add(li);
map.put(computeKey(i),s);
}
}
return list;
}
int contains(HashMap map,String s){
long key = computeKey(s);
if(map.containsKey(key))return (int)map.get(key);
else
return -1;
}
long computeKey(String s){
long sum = 1;
for(int i = 0;i<s.length();i++){
sum *= arr[(int)s.charAt(i)-97];
}
return sum;
}
解法二排序数组分类
思路
当且仅当它们的排序字符串相等时,两个字符串是字母异位词。
算法
维护一个映射 ans : {String -> List},其中每个键 K 是一个排序字符串,每个值是初始输入的字符串列表,排序后等于 K。
在 Java 中,我们将键存储为字符串,例如,code。 在 Python 中,我们将键存储为散列化元组,例如,(‘c’, ‘o’, ‘d’, ‘e’)。
int[] arr = {2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97,101};
public List<List<String>> groupAnagrams2(String[] strs) {
List<List<String>> list = new ArrayList<>();
HashMap<Long,Integer> map = new HashMap<>();
for(String i : strs){
int index = contains(map,i);
if(index!=-1){
list.get(index).add(i);
}else{
int s = map.size();
List<String> li = new ArrayList<>();
li.add(i);
list.add(li);
map.put(computeKey(i),s);
}
}
return list;
}
@SuppressWarnings("rawtypes")
int contains(HashMap map,String s){
long key = computeKey(s);
if(map.containsKey(key))return (int)map.get(key);
else
return -1;
}
long computeKey(String s){
long sum = 1;
for(int i = 0;i<s.length();i++){
sum *= arr[(int)s.charAt(i)-97];
}
return sum;
}
解法三按计数分类
思路
当且仅当它们的字符计数(每个字符的出现次数)相同时,两个字符串是字母异位词。
算法
我们可以将每个字符串 s 转换为字符数 count,由26个非负整数组成,表示 a,b,c 的数量等。我们使用这些计数作为哈希映射的基础。
在 Java 中,我们的字符数 count 的散列化表示将是一个用 # 字符分隔的字符串。 例如,abbccc 将表示为 #1#2#3#0#0#0 …#0,其中总共有26个条目。 在 python 中,表示将是一个计数的元组。 例如,abbccc 将表示为 (1,2,3,0,0,…,0),其中总共有 26 个条目。
public List<List<String>> groupAnagrams(String[] strs) {
if (strs.length == 0) return new ArrayList();
Map<String, List> ans = new HashMap<String, List>();
int[] count = new int[26];
for (String s : strs) {
Arrays.fill(count, 0);
for (char c : s.toCharArray()) count[c - 'a']++;
StringBuilder sb = new StringBuilder("");
for (int i = 0; i < 26; i++) {
sb.append('#');
sb.append(count[i]);
}
String key = sb.toString();
if (!ans.containsKey(key)) ans.put(key, new ArrayList());
ans.get(key).add(s);
}
return new ArrayList(ans.values());
}