leetcode187. 重复的DNA序列(中等)

leetcode187. 重复的DNA序列(中等)_第1张图片
leetcode187. 重复的DNA序列(中等)_第2张图片
思路:长度为10+子数组->固定滑动窗口
细节:
1.怎么比较两个字符串相等?也就是如何映射?

方法一:字符串hash
方法二:由于只有4个字符,因此用两个位表示一个字符,10个字符需要20位,int可以表示出该字符串。
A:0 C:1 G:2 T:3
右边界添加一个字符:
flag <<= 2;
flag |= hash[s[r]];
左边界删掉一个字符:&(1<<20)-1

2.分组0…9分别为一组不仅不会降低复杂度,反而增加10倍复杂度。因为,分组和不分组实际上都是访问了以所有下标开始的长度为10的子字符串,如果分组的话,每10个之间的flag没有关系,必须得各自计算,即多了10倍得复杂度。

class Solution {
public:
    vector<string> findRepeatedDnaSequences(string s) {
        
        unordered_map<char, int> hash{{'A', 0}, {'C', 1}, {'G', 2}, {'T', 3}};
        unordered_set<int> hash2;
        unordered_set<string> ans;
        int flag = 0, n = s.size();
        if (n < 10) return {};
        int l = 0;
        for (int r = 0; r < n; ++r) {
            if (r >= 10) l++;
            flag <<= 2;
            flag |= hash[s[r]];
            flag &= ((1 << 20) - 1);
            if (hash2.count(flag)) ans.insert(s.substr(l, 10));
            if (r - l + 1 == 10) hash2.insert(flag);
        }
        return vector<string>(ans.begin(), ans.end());
    }
};

你可能感兴趣的:(#,slide,windows&双指针,哈希算法,leetcode,算法)