java实现重复的DNA序列

一 题目描述:

所有 DNA 都由一系列缩写为 'A','C','G' 和 'T' 的核苷酸组成,例如:"ACGAATTCCG"。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。

编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。

leetcode链接:重复的DNA序列

二 算法思路

因为题目的特殊性,我们可以采用空间换时间复杂度的思想,把10个长度单位的字符串存在集合中,如果出现了重复元素,直接放到结果集里即可。

三 算法实现


    public List findRepeatedDnaSequences(String s) {
        List result = new ArrayList<>();
        Set existString = new HashSet<>();

        if (s.length() <= 10) {
            return result;
        }
        for (int i = 0; i <= s.length() - 10; i++) {
            String temp = s.substring(i, i + 10);
            if (existString.contains(temp) && !result.contains(temp)) {
                result.add(temp);
            }
            existString.add(temp);
        }
        return result;
    }

你可能感兴趣的:(Java,算法,java,开发语言,后端)