Leetcode 187 Repeated DNA Sequences

Leetcode 187 Repeated DNA Sequences_第1张图片
思路一: 遍历s,i从0到s.length()-10,因为要确保i之后至少还有10个字符用来匹配。每取到10个字符,就查看i+1到末尾这个字符串里面是否含有当前取到的这10个字符,如果有的话,那说明当前的这10个字符需要输出,是正确答案。但是按这个方式来写代码的话会有一个testcase time limit exceeded,原因是因为有大量的重复计算。至于怎么优化我还没想出来。但是毕竟思路是对的,还是展示一下我的代码吧:

class Solution {
    public List<String> findRepeatedDnaSequences(String s) {
        List<String> list = new LinkedList<>();
        for(int i = 0; i < s.length() - 10; i++){
            String curt = s.substring(i,i+10);
            if(list.contains(curt)){continue;}
            String str = s.substring(i+1);
            if(str.contains(curt)){list.add(curt);}
        }
        return list;
    }
}

思路二: 上面思路一相当于是利用了arraylist的contains方法,那么思路二可以认为是巧妙使用了hashset的性质。同样也是遍历s,i从0到s.length()-9。这边为啥可以比思路一多前进一个字符呢,是因为这边我们其实是取s中所有可能的10个字符的字符串。如果当前的10个字符不能加入set,说明set中已经有该字符串,也就是说之前遇到过同样的10个字符,那就表示当前的这10个字符是正确答案,我们需要输出。

class Solution {
    public List<String> findRepeatedDnaSequences(String s) {
        List<String> list = new ArrayList<>();
        Set<String> set = new HashSet<>();
        for(int i = 0; i < s.length() - 9; i++){
            String curt = s.substring(i,i+10);
            if(!set.add(curt) && !list.contains(curt)){list.add(curt);}
        }
        return list;
    }
}
这个代码其实是我按照自己的思路改的,使用的数据结构和该思路作者所用的数据结构不太一样。

最后展示思路二原作者所写的代码,可以说是巧妙的一批了。

 public List<String> findRepeatedDnaSequences(String s) {
    Set seen = new HashSet(), repeated = new HashSet();
    for (int i = 0; i + 9 < s.length(); i++) {
        String ten = s.substring(i, i + 10);
        if (!seen.add(ten))
            repeated.add(ten);
    }
    return new ArrayList(repeated);
}

总结:无

你可能感兴趣的:(Leetcode)