Leetcode 2851. String Transformation

  • Leetcode 2851. String Transformation
    • 0. 吐槽
    • 1. 算法思路
      • 1. 整体思路
      • 2. 字符串匹配优化
    • 2. 代码实现
  • 题目链接:2851. String Transformation

0. 吐槽

这道题多少有点坑爹,题目本身挺有意思的,是一道数组题目,其实用数学方法直接可以写出结果的数学表达式,因此做的时候成就感非常强。

但是,坑爹的来了,谁会想到这道题最终卡人的是数组匹配算法,真心晕菜!!!

举个不太恰当的例子,就像是你去复原一个魔方,你想了n久,终于想到了魔方的复原方法,然后到了考场上面,面试官给了你一块木头和一把锯子,让你先做个魔方然后再复原,还限时2h……

就尼玛坑爹啊!!!

不过万幸,总算是搞定了,顺道也优化了一下字符串的匹配算法,虽然非我所愿,但多少也有点成就感吧……

1. 算法思路

1. 整体思路

这一题整体思路上可以视为一道数组题目。

显然的,对于一个长度为 n n n的字符串s,我们经过 k k k此操作之后可能的操作方式总数有 ( n − 1 ) k (n-1)^{k} (n1)k种。

我们假设第 k k k次操作之后字符串s恰好变为t的操作方式总数为 a k a_k ak,那么显然我们有如下递推公式:

a k = a k − 1 × ( m − 1 ) + ( ( n − 1 ) k − 1 − a k − 1 ) × m = m ⋅ ( n − 1 ) k − 1 − a k − 1 \begin{aligned} a_k &= a_{k-1} \times (m-1) + ((n-1)^{k-1} - a_{k-1}) \times m \\ &= m \cdot (n-1)^{k-1} - a_{k-1} \end{aligned} ak=ak1×(m1)+((n1)k1ak1)×m=m(n1)k1ak1

其中, m m m表示s的所有循环字符串(至多经过一次操作之后得到的字符串)当中t的个数,亦即,s可以通过 m m m种旋转方式直接变为t

此时,我们由上述递推公式,不难迭代写出:

a k = m ⋅ ( n − 1 ) k − 1 − a k − 1 a k − 1 = m ⋅ ( n − 1 ) k − 2 − a k − 2 ⋯ a 1 = m ⋅ ( n − 1 ) 0 − a 0 \begin{aligned} a_k &= m \cdot (n-1)^{k-1} - a_{k-1} \\ a_{k-1} &= m \cdot (n-1)^{k-2} - a_{k-2} \\ \cdots \\ a_1 &= m \cdot (n-1)^{0} - a_{0} \end{aligned} akak1a1=m(n1)k1ak1=m(n1)k2ak2=m(n1)0a0

我们分别带入之后即可得到 a k a_k ak的表达式如下:

a k = ( − 1 ) k a 0 + m ∑ i = 0 k − 1 ( − 1 ) k − 1 − i ⋅ ( n − 1 ) i = ( − 1 ) k a 0 + m ⋅ ( n − 1 ) k − ( − 1 ) k n \begin{aligned} a_{k} &= (-1)^{k} a_0 + m \sum\limits_{i=0}^{k-1} (-1)^{k-1-i} \cdot (n-1)^i \\ &= (-1)^{k} a_0 + m \cdot \frac{(n-1)^k - (-1)^k}{n} \end{aligned} ak=(1)ka0+mi=0k1(1)k1i(n1)i=(1)ka0+mn(n1)k(1)k

因此,事实上这道题我们可以通过 n , m , k n,m,k n,m,k的值直接算出我们的最终答案。

剩下的问题就是 n , m n,m n,m的求解了,其中 n n n是显然的,剩下的就是 m m m的求解了,本来其实就是将s再拼接一份然后看一下新组成的这个字符串当中t一共出现的次数就行了,用伪代码表示就是:

n = len(s)
ns = s + s[:-1]
m = len([i for i in range(n) if ns[i:i+n] == t])

结果没想到这里居然一直超时,最后这道题大部分的时候居然都集中在了解决这个问题上面,也是醉了……

下面,我们就来看一下我们具体对于这个问题的优化。

2. 字符串匹配优化

如前所述,这里事实上我们可以将问题抽象为如下问题:

已知两个字符串st,问s当中t一共出现过多少次。

因此这里其实就是一个字符串匹配的问题,不过我们可以对其进行一下优化:

  • 如果s当中的某一段已经和t匹配上了(假设起始坐标为i),此时我们就可以通过t本身的特性,找到t当中最接近头部的某个位置idx,满足t[idx:] == t[:n-idx],此时我们可以直接跳转到这个位置,然后比较子串t[n-idx:]s[i+n:i+n+idx]是否一致即可判断新的这个子串s[i+idx:i+idx+n]是否等于t,而无需判断中间的位置以及完整地判断这两个子串是否相同。

此时,问题就简化到了如何求得t当中最接近头部的某个位置idx,满足t[idx:] == t[:n-idx],而这个可以通过z-algorithm来进行快速实现,关于这部分的内容,我们之前已经写过了一个博客(经典算法:Z算法(z algorithm))对其进行过整理了,这里我们就不再展开赘述了。

2. 代码实现

综上,我们就可以给出我们最终的python代码实现如下:

def z_algorithm(s):
    n = len(s)
    z = [0 for _ in range(n)]
    l, r = -1, -1
    for i in range(1, n):
        if i > r:
            l, r = i, i
            while r < n and s[r-l] == s[r]:
                r += 1
            z[i] = r-l
            r -= 1
        else:
            k = i - l
            if z[k] < r - i + 1:
                z[i] = z[k]
            else:
                l = i
                while r < n and s[r-l] == s[r]:
                    r += 1
                z[i] = r-l
                r -= 1
    z[0] = n
    return z

def find_all(s, t):
    l, n = len(s), len(t)
    prefix = z_algorithm(t)
    nxt, m = n, 0
    for i in range(1, n):
        if i + prefix[i] == n:
            nxt = i
            m = prefix[i]
            break

    idx = 0
    cnt = 0
    while idx < l:
        idx = s.find(t, idx)
        if idx == -1:
            break
        cnt += 1
        if nxt < n:
            while idx+n < l and t[m:] == s[idx+n:idx+n+nxt]:
                idx = idx+nxt
                cnt += 1
        idx += 1
    return cnt
        

class Solution:
    def numberOfWays(self, s: str, t: str, k: int) -> int:
        MOD = 10**9+7
        
        n = len(s)
        m = find_all(s+s[:-1], t)
        
        f0 = 0 if s != t else 1
        fk = f0 * pow(-1, k) + m * pow(n, -1, MOD) * (pow(n-1, k, MOD) - pow(-1, k))
        return fk % MOD

提交代码评测得到:耗时801ms,占用内存41.1MB。

值得一提的是,截至23.9.10晚间,当前这个执行效率远远高于其他python提交的算法执行效率(其他实现当中最快的执行时间为3167ms),多少也是让我感觉挺有成就感的……

你可能感兴趣的:(leetcode笔记,leetcode,2581,leetcode,z算法,字符串查找,周赛362)