LeetCode每日一题:anagrams

问题描述

Given an array of strings, return all groups of strings that are anagrams.
Note: All inputs will be in lower-case.

问题分析

这题不太理解:Anagrams — LeetCode - Code Ganker - 博客频道 - CSDN.NET附上参考博客

这是一道很经典的面试题了,在cc150里面也有,就是把一个数组按照易位构词分类。易位构词其实也很好理解,就是两个单词所包含的字符和数量都是一样的,只是顺序不同。
这个题简单的版本是判断两个单词是不是anagram,一般来说有两种方法。第一种方法是用hashmap,key是字符,value是出现的次数,如果两个单词构成的hashmap相同,那么就是anagram。实现起来就是用一个构建hashmap,然后另一个在前面的hashmap中逐个去除,最后如果hashmap为空,即返回true。这个方法时间复杂度是O(m+n),m,n分别是两个单词的长度。而空间复杂度是O(字符集的大小)。第二种方法是将两个单词排序,如果排序之后结果相同,就说明两个单词是anagram。这种方法的时间复杂度取决于排序算法,一般排序算法是O(nlogn),如果字符集够小,也可以用线性的排序算法。不过总体来说,如果是判断两个单词的,第一种方法要直接简单一些。
接下来我们看看这道题,是在很多字符串里面按照anagram分类,如果用hashmap的方法,然后两两匹配,在分组会比较麻烦。而如果用排序的方法则有一个很大的优势,就是排序后的字符串可以作为一个key,也就是某一个class的id,如此只要对每一个字符串排序,然后建立一个hashmap,key是排序后的串,而value是所有属于这个key类的字符串,这样就可以比较简单的进行分类。假设我们有n个字符串,字符串最大长度是k,那么该算法的时间复杂度是O(nklogk),其中O(klogk)是对每一个字符串排序(如果用线性算法也可以提高)。空间复杂度则是O(nk),即hashmap的大小。实现代码如下:

代码实现

public ArrayList anagrams(String[] strs) {
        ArrayList result = new ArrayList<>();
        Map> map = new HashMap<>();
        for (String s : strs) {
            String key = sortString(s);
            if (!map.containsKey(key)) {
                map.put(key, new ArrayList());
            }
            map.get(key).add(s);
        }
        for (String s : map.keySet()) {
            ArrayList list = map.get(s);
            if (list.size() > 1)
                result.addAll(list);
        }
        ArrayList output = new ArrayList<>();
        for (int i = result.size() - 1; i >= 0; i--) {
            output.add(result.get(i));
        }
        return output;
    }

    private String sortString(String string) {
        char[] chars = string.toCharArray();
        Arrays.sort(chars);
        return new String(chars);
    }

你可能感兴趣的:(LeetCode每日一题:anagrams)