22字符串-简单反转

目录

BM(Boyer-Moore)

坏字符

好后缀

什么情况用哪个规则?

LeetCode之路——151. 反转字符串中的单词

分析:


22字符串-简单反转_第1张图片

字符串匹配中除了简单的BF(Brute Force)、RK(Rabin-Karp)算法,还有更高效、较难理解的

BM(Boyer-Moore)和KMP(Knuth Morris Pratt)算法。先了解下BM算法。

BM(Boyer-Moore)

在主串和模式串匹配的过程中,我们知道BF和RK算法都是去逐个字符比较,像下面这样:

22字符串-简单反转_第2张图片

而现在,因为主串中的b不在模式串中,第二次我们就直接把模式串移到b后面,问题来了,下一次移动是往后移动2位和a对齐呢?还是继续移动一位?

22字符串-简单反转_第3张图片

下面就要重点介绍BM算法的两个重要规则了:坏字符和好后缀。

坏字符

不同于常规思维,BM算法是根据模式串从后往前比较的。

22字符串-简单反转_第4张图片

坏字符的定义:从模式串的末尾开始匹配,第一个没法匹配的字符(主串中的字符)叫做坏字符。

  • 坏字符在模式串中对应的位置记住Si。比如b对应c的位置,就是Si=2。

  • 坏字符在模式串中相同字符的位置记作Xi。不存在时记作-1。比如坏字符b对应的Xi=-1.

重点来了,模式串下次移动的长度就是Si-Xi。所以i=2的时候,模式串在i=1的基础上移动了2个字符的长度。(如果模式串中存在多个Xi的时候,选择最靠后的那个,因为这样不会让模式串滑动过多,导致本来可能匹配的情况被滑动略过。)

好后缀

和坏字符的思想有些类似。

22字符串-简单反转_第5张图片

在i=1的时候,这种情况下就符合好后缀的原则了。从后往前匹配的过程中,出现坏字符前的字符串就是好后缀。好后缀的工作原理:

  • 当模式串中坏字符前存在与好后缀相同的{u'},那我们就将模式串滑动到子串{u‘}与主串中{u}对齐的位置。

  • 当模式串中坏字符前不存在与好后缀相同的{u'},那么就直接将模式串滑动到主串中{u}的后面。

好后缀的场景下也会有特殊情况的:

22字符串-简单反转_第6张图片

在这种情况的基础上,好后缀的原则做了优化和改善:

22字符串-简单反转_第7张图片

  • 如果好后缀的后缀子串模式串的前缀子串匹配,找一个最长的并且能跟模式串的前缀子串匹配的,假设是{v},然后将模式串滑动到如图所示的位置。

什么情况用哪个规则?

我们可以分别计算好后缀和坏字符往后滑动的位数,然后取两个数中最大的,作为模式串往后滑动的位数。这种处理方法还可以避免我们前面提到的,根据坏字符规则,计算得到的往后滑动的位数,有可能是负数的情况。

LeetCode之路——151. 反转字符串中的单词

给你一个字符串 s ,请你反转字符串中 单词 的顺序。

单词 是由非空格字符组成的字符串。s 中使用至少一个空格将字符串中的 单词 分隔开。

返回 单词 顺序颠倒且 单词 之间用单个空格连接的结果字符串。

注意:输入字符串 s中可能会存在前导空格、尾随空格或者单词间的多个空格。返回的结果字符串中,单词间应当仅用单个空格分隔,且不包含任何额外的空格。

示例 1:

输入:s = "the sky is blue"
输出:"blue is sky the"

示例 2:

输入:s = "  hello world  "
输出:"world hello"
解释:反转后的字符串中不能存在前导空格和尾随空格。

示例 3:

输入:s = "a good   example"
输出:"example good a"
解释:如果两个单词间有多余的空格,反转后的字符串需要将单词间的空格减少到仅有一个。

提示:

  • 1 <= s.length <= 104

  • s 包含英文大小写字母、数字和空格 ' '

  • s至少存在一个 单词

分析:
  1. 把首尾空格移除了。——>trim()

  2. 留下单词。——>split()

  3. 数组反转。——>reverse()

  4. 拼接字符串。——>join()

class Solution {
    public String reverseWords(String s) {
        s = s.trim(); // 除去开头和末尾的空白字符
        // 正则匹配连续的空白字符作为分隔符分割
        List list = Arrays.asList(s.split("\\s+"));
        Collections.reverse(list);
        return String.join(" ", list);
    }
}
  • 时间复杂度:O(n),其中 nnn 为输入字符串的长度。

  • 空间复杂度:O(n),用来存储字符串分割之后的结果。

你可能感兴趣的:(LeetCode刷题之路,算法)