leetcode 438.找到字符串中所有字母异位词

题目: 找到字符串中所有字母异位词

https://leetcode-cn.com/problems/find-all-anagrams-in-a-string/

题目描述

给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。

异位词 指由相同字母重排列形成的字符串(包括相同的字符串)。

 

示例 1:

输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。


 示例 2:

输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。


 

提示:

1 <= s.length, p.length <= 3 * 104
s 和 p 仅包含小写字母

前置知识

双指针与滑动窗口

双指针模板

for (int i = 0, j = 0; i < n; i ++ )
{
    while (j < i && check(i, j)) j ++ ;

    // 具体问题的逻辑
}

常见问题分类:

(1) 对于一个序列,用两个指针维护一段区间

(2) 对于两个序列,维护某种次序,比如归并排序中合并两个有序序列的操作

思路

先统计字符串p所有字母出现的个数,利用双指针i, j在字符串s上维护一个和字符串p长度相同的区间,该区间不断向后滑动,比较这个区间内是否是字符串p的异位词。
伪代码如下所示:

            初始化前后指针 = 0
            初始化 结果集合res

            for 前指针 in 字符串p
                更新窗口内信息(前指针进窗口,后指针出窗口)
                后指针移动
                判断是否是异位词,更新答案
            返回 res

关键点

如何快速比较这个区间内是否是字符串p的异位词?

i , j i,j i,j所维护的一个和字符串p长度相同的区间 [ j , i ] [j, i] [j,i], i为前指针,j为后指针,该区间长度不会变化,每次向后移动一格,那么只涉及到前指针 i i i和后指针 j j j对结果有影响;前指针进窗口某种字母的个数+1, 后指针出窗口某种字符的个数-1

对于异位词,需要含有字母的种类和数量相同。先计算出字符串p有多少种字母以及对应的数量。其次,我们维护一个变量 s a m e same same s a m e same same代表该区间长度的字符串,有多少个和字符串p包含的字母及其数量相同的,例如,字符串p为 a a b b c c c aabbccc aabbccc,字符串s为 c b c a c a cbcaca cbcaca,字符串s的 s a m e same same值为2,当 s a m e same same值等于字符串p的字母种数时,说明该字符串是p的异位词,因为他们包含的字母种类及其数量都相同。

那么回到滑动窗口,头指针i进窗口,对应字母的数量+1,如果该头指针对应的字母的数量=字符串p该字母的数量,same+1;若窗口大于字符串p的长度,尾指针出窗口, 尾指针对应字母的数量-1。如果该尾指针对应的字母的数量=字符串p该字母的数量,same-1;最后判断 s a m e same same是否等于字符串p的字母种数,是则说明是异位词,加入结果

代码

C++ Code:


class Solution {
public:
    int cnts[26], cntp[26];                 // 分别统计字符串s,p的各个字母的个数
    vector findAnagrams(string s, string p) {
        int plen = p.size();   
        for(auto x : p)         cntp[x - 'a']++;   // 统计字符串p各个字母出现的次数
        int wordcnt = 0;      // 字符串p字母种数
        for(int i = 0; i < 26; i ++ )       wordcnt += (cntp[i] != 0);         // 统计字符串p有多少种字母

        int n = s.size(), same = 0;  
        vector res;                                
        for(int i = 0, j = 0; i < n; i ++ )
        {
            cnts[s[i] - 'a'] ++;            // 头指针i进窗口,对应字母的数量+1
            if(cnts[s[i] - 'a'] == cntp[s[i] - 'a'])    same++;  //如果该头指针对应的字母的数量=字符串p该字母的数量,same+1
            if(i - j + 1 > plen)           //  窗口大于字符串p的长度
            {
                if(cnts[s[j] - 'a'] == cntp[s[j] - 'a'])    same--;      // 如果该尾指针对应的字母的数量=字符串p该字母的数量,same-1
                cnts[s[j] - 'a']--;          // 尾指针对应字母的数量-1
                j++;                          // 尾指针出窗口
            }
            if(same == wordcnt)         res.push_back(j);  // 判断same是否等于字符串p的字母种数
        }

        return res;
    }
};

复杂度分析

n 为数组长度。

  • 时间复杂度: O ( n ) O(n) O(n)
  • 空间复杂度: O ( n ) O(n) O(n)

你可能感兴趣的:(算法学习,Leetcode,算法,c++)