[LeetCode] 6.N字形变换

一、题目描述

将一个给定字符串 s 根据给定的行数 numRows ,以从上往下、从左到右进行 Z 字形排列。

比如输入字符串为 "PAYPALISHIRING" 行数为 3 时,排列如下:

P   A   H   N
A P L S I I G
Y   I   R

之后,你的输出需要从左往右逐行读取,产生出一个新的字符串,比如:"PAHNAPLSIIGYIR"

请你实现这个将字符串进行指定行数变换的函数:

string convert(string s, int numRows);

示例 1:

输入:s = "PAYPALISHIRING", numRows = 3
输出:"PAHNAPLSIIGYIR"

示例 2:

输入:s = "PAYPALISHIRING", numRows = 4
输出:"PINALSIGYAHRPI"
解释:
P     I    N
A   L S  I G
Y A   H R
P     I

示例 3:

输入:s = "A", numRows = 1
输出:"A"

提示:

  • 1 <= s.length <= 1000
  • s 由英文字母(小写和大写)、',''.' 组成
  • 1 <= numRows <= 1000

二、题解

2.1 方法一:利用二维矩阵模拟

设 n 为字符串 s 的长度, r = n u m R o w s r=numRows r=numRows。对于 r = 1 r=1 r=1(只有一行)或者 r ≥ n r≥n rn(只有一列)的情况,答案与 s 相同,我们可以直接返回 s。对于其余情况,考虑创建一个二维矩阵,然后在矩阵上按 Z 字形填写字符串 s,最后逐行扫描矩阵中的非空字符,组成答案。

根据题意,当我们在矩阵上填写字符时,会向下填写 r 个字符,然后向右上继续填写 r − 2 r−2 r2 个字符,最后回到第一行,因此 Z 字形变换的周期 t = r + r − 2 = 2 r − 2 t=r+r−2=2r−2 t=r+r2=2r2,每个周期会占用矩阵上的 1 + r − 2 = r − 1 1+r−2=r−1 1+r2=r1 列。

因此我们有 ⌈ n t ⌉ \lceil \frac nt \rceil tn 个周期(最后一个周期视作完整周期),乘上每个周期的列数,得到矩阵的列数 c = ⌈ n t ⌉ ⋅ ( r − 1 ) c= \lceil \frac nt \rceil·(r-1) c=tn(r1)

创建一个 r r r c c c 列的矩阵,然后遍历字符串 s s s 并按 Z 字形填写。具体来说,设当前填写的位置为 ( x , y ) (x,y) (x,y),即矩阵的 x x x y y y 列。初始 ( x , y ) = ( 0 , 0 ) (x,y)=(0,0) (x,y)=(0,0),即矩阵左上角。若当前字符下标 i i i 满足 i ⋅   m o d   t < r − 1 i· mod timodt<r1,则向下移动,否则向右上移动。

填写完成后,逐行扫描矩阵中的非空字符,组成答案。

Python
 def convert(self, s: str, numRows: int) -> str:
    n, r = len(s), numRows
    if r == 1 or r >= n:
        return s
    t = r * 2 - 2
    c = (n + t - 1) // t * (r - 1)
    mat = [[''] * c for _ in range(r)]
    x, y = 0, 0
    for i, ch in enumerate(s):
        mat[x][y] = ch
        if i % t < r - 1:
            x += 1  # 向下移动
        else:
            x -= 1
            y += 1  # 向右上移动
    return ''.join(ch for row in mat for ch in row if ch)
C++
string convert(string s, int numRows) 
{
    int n = s.length(), r = numRows;
    if (r == 1 || r >= n) 
    {
        return s;
    }
    int t = r * 2 - 2;
    int c = (n + t - 1) / t * (r - 1);
    vector<string> mat(r, string(c, 0));
    for (int i = 0, x = 0, y = 0; i < n; ++i) 
    {
        mat[x][y] = s[i];
        if (i % t < r - 1) 
        {
            ++x; // 向下移动
        } else {
            --x;
            ++y; // 向右上移动
        }
    }
    string ans;
    for (auto &row : mat) 
    {
        for (char ch : row) 
        {
            if (ch) 
            {
                ans += ch;
            }
        }
    }
    return ans;
}
复杂度分析
  • 时间复杂度: O ( r ⋅ n ) O(r⋅n) O(rn),其中 r = n u m R o w s r=numRows r=numRows,n 为字符串 s 的长度。时间主要消耗在矩阵的创建和遍历上,矩阵的行数为 r,列数可以视为 O ( n ) O(n) O(n)
  • 空间复杂度: O ( r ⋅ n ) O(r⋅n) O(rn)。矩阵需要 O ( r ⋅ n ) O(r⋅n) O(rn) 的空间。

2.2 方法二:压缩矩阵空间

方法一中的矩阵有大量的空间没有被使用,能否优化呢?

注意到每次往矩阵的某一行添加字符时,都会添加到该行上一个字符的右侧,且最后组成答案时只会用到每行的非空字符。因此我们可以将矩阵的每行初始化为一个空列表,每次向某一行添加字符时,添加到该行的列表末尾即可。

Python
 def convert(self, s: str, numRows: int) -> str:
    r = numRows
    if r == 1 or r >= len(s):
        return s
    mat = [[] for _ in range(r)]
    t, x = r * 2 - 2, 0
    for i, ch in enumerate(s):
        mat[x].append(ch)
        x += 1 if i % t < r - 1 else -1
    return ''.join(chain(*mat))
C++
string convert(string s, int numRows) 
{
    int n = s.length(), r = numRows;
    if (r == 1 || r >= n) 
    {
        return s;
    }
    vector<string> mat(r);
    for (int i = 0, x = 0, t = r * 2 - 2; i < n; ++i) 
    {
        mat[x] += s[i];
        i % t < r - 1 ? ++x : --x;
    }
    string ans;
    for (auto &row : mat) 
    {
        ans += row;
    }
    return ans;
}
复杂度分析
  • 时间复杂度: O ( n ) O(n) O(n)
  • 空间复杂度: O ( n ) O(n) O(n),压缩后的矩阵需要 O ( n ) O(n) O(n) 的空间。。

2.3 方法三: 直接构造

我们来研究方法一中矩阵的每个非空字符会对应到 s 的哪个下标(记作 i d x idx idx),从而直接构造出答案。

由于 Z 字形变换的周期为 t = 2 r − 2 t=2r−2 t=2r2,因此对于矩阵第一行的非空字符,其对应的 i d x idx idx 均为 t t t 的倍数,即 i d x ≡ 0 ( m o d t ) idx≡0(modt) idx0(modt);同理,对于矩阵最后一行的非空字符,应满足 i d x ≡ r − 1 ( m o d t ) idx≡r−1(modt) idxr1(modt)

对于矩阵的其余行(行号设为 i i i),每个周期内有两个字符,第一个字符满足 i d x ≡ i ( m o d t ) idx≡i(modt) idxi(modt),第二个字符满足 i d x ≡ t − i ( m o d t ) idx≡t−i(modt) idxti(modt)

Python
 def convert(self, s: str, numRows: int) -> str:
    n, r = len(s), numRows
    if r == 1 or r >= n:
        return s
    t = r * 2 - 2
    ans = []
    for i in range(r):  # 枚举矩阵的行
        for j in range(0, n - i, t):  # 枚举每个周期的起始下标
            ans.append(s[j + i])  # 当前周期的第一个字符
            if 0 < i < r - 1 and j + t - i < n:
                ans.append(s[j + t - i])  # 当前周期的第二个字符
    return ''.join(ans)
C++
string convert(string s, int numRows) 
{
    int n = s.length(), r = numRows;
    if (r == 1 || r >= n) 
    {
        return s;
    }
    string ans;
    int t = r * 2 - 2;
    for (int i = 0; i < r; ++i) 
    { // 枚举矩阵的行
        for (int j = 0; j + i < n; j += t) 
        { // 枚举每个周期的起始下标
            ans += s[j + i]; // 当前周期的第一个字符
            if (0 < i && i < r - 1 && j + t - i < n) 
            {
                ans += s[j + t - i]; // 当前周期的第二个字符
            }
        }
    }
    return ans;
}
复杂度分析
  • 时间复杂度: O ( n ) O(n) O(n),其中 n n n 为字符串 s s s 的长度。 s s s 中的每个字符仅会被访问一次,因此时间复杂度为 O ( n ) O(n) O(n)

  • 空间复杂度: O ( 1 ) O(1) O(1)。返回值不计入空间复杂度。

你可能感兴趣的:(LeetCode,leetcode,算法,数据结构,C++,Python)