187. 重复的DNA序列 --力扣 --JAVA

题目

DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。

例如,"ACGAATTCCG" 是一个 DNA序列 。
在研究 DNA 时,识别 DNA 中的重复序列非常有用。

给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。

解题思路

  1. 遍历将字符串每十个字符分割成一个字符串存储到Map中进行统计出现次数;
  2. 将出现次数超过1次的存储到list当中输出。

代码展示

class Solution {
    public List findRepeatedDnaSequences(String s) {
        Map data = new HashMap<>();
        for (int i = 0; i <= s.length() - 10; i++){
            String str = s.substring(i, i + 10);
            Integer temp = data.getOrDefault(str, 0);
            data.put(str, temp + 1);
        }
        List ans = new ArrayList<>();
        for (String str : data.keySet()){
            if(data.get(str) > 1){
                ans.add(str);
            }
        }
        return ans;
    }
}

你可能感兴趣的:(力扣练习,算法,数据结构)