【面试高频题】难度 1/5,可用 Trie 进阶的模拟题

题目描述

这是 LeetCode 上的 720. 词典中最长的单词 ,难度为 简单

Tag : 「模拟」、「哈希表」、「字典树」

给出一个字符串数组 words 组成的一本英语词典。返回 words 中最长的一个单词,该单词是由 words 词典中其他单词逐步添加一个字母组成。

若其中有多个可行的答案,则返回答案中字典序最小的单词。若无答案,则返回空字符串。

示例 1:

输入:words = ["w","wo","wor","worl", "world"]

输出:"world"

解释: 单词"world"可由"w", "wo", "wor", 和 "worl"逐步添加一个字母组成。

示例 2:

输入:words = ["a", "banana", "app", "appl", "ap", "apply", "apple"]

输出:"apple"

解释:"apply" 和 "apple" 都能由词典中的单词组成。但是 "apple" 的字典序小于 "apply" 

提示:

  • $1 <= words.length <= 1000$
  • $1 <= words[i].length <= 30$
  • 所有输入的字符串 $words[i]$ 都只包含小写字母。

模拟

数据范围很小,我们可以直接模拟来做。

先将所有的 $words[i]$ 存入 Set 集合,方便后续可以近似 $O(1)$ 查询某个子串是否存在 $words$ 中。

遍历 $words$ 数组(题目没有说 $words$ 不重复,因此最好遍历刚刚预处理的 Set 集合),判断每个 $words[i]$ 是否为「合法单词」,同时利用当前的最长单词来做剪枝。

不算剪枝效果,该做法计算量不超过 $10^6$,可以过。

代码:

class Solution {
    public String longestWord(String[] words) {
        String ans = "";
        Set set = new HashSet<>();
        for (String s : words) set.add(s);
        for (String s : set) {
            int n = s.length(), m = ans.length();
            if (n < m) continue;
            if (n == m && s.compareTo(ans) > 0) continue;
            boolean ok = true;
            for (int i = 1; i <= n && ok; i++) {
                String sub = s.substring(0, i);
                if (!set.contains(sub)) ok = false;
            }
            if (ok) ans = s;
        }
        return ans;
    }
}
  • 时间复杂度:预处理 Set 集合复杂度近似 $O(n)$;判断某个 $words[i]$ 是否合法需要判断所有子串是否均在 $words$ 中,复杂度为 $O(m^2)$,其中 $m$ 为字符串长度,处理 $words[i]$ 的过程还使用到 compareTo 操作,其复杂度为 $O(\min(N, M))$,其中 $N$ 和 $M$ 为参与比较的两字符串长度,该操作相比于生成子串可忽略,而对于一个长度为 $m$ 的字符串而言,生成其所有的子串的计算量为首项为 $1$,末项为 $m$,公差为 $1$ 的等差数列求和结果。整体复杂度为 $O(\sum_{i = 0}^{n - 1}words[i].length^2)$
  • 空间复杂度:$O(\sum_{i = 0}^{n - 1}words[i].length)$

Trie

上述解法中「枚举某个 $words[i]$ 的所有子串,并判断子串是否在 $words$ 数组中出现」的操作可使用「字典树」来实现。

不了解「Trie / 字典树」的同学可以看前置 :字典树入门。里面通过图例展示了字典树基本形态,以及提供了「数组实现」和「TrieNode 实现」两种方式,还有「数组大小估算方式」和「Trie 应用面」介绍。

回到本题,起始先将所有的 $words[i]$ 存入字典树,并记录每个字符的结尾编号。

对于某个 $words[i]$ 而言,其能成为「合法单词」的充要条件为:$words[i]$ 的每个前缀编号都有「以结尾编号」所被记录。

一些细节:为了防止每个样例都 new 大数组,我们使用 static 进行优化,并在跑样例前进行相应的清理工作。

代码:

class Solution {
    static int N = 30010, M = 26;
    static int[][] tr = new int[N][M];
    static boolean[] isEnd = new boolean[N];
    static int idx = 0;
    void add(String s) {
        int p = 0, n = s.length();
        for (int i = 0; i < n; i++) {
            int u = s.charAt(i) - 'a';
            if (tr[p][u] == 0) tr[p][u] = ++idx;
            p = tr[p][u];
        }
        isEnd[p] = true;
    }
    boolean query(String s) {
        int p = 0, n = s.length();
        for (int i = 0; i < n; i++) {
            int u = s.charAt(i) - 'a';
            p = tr[p][u];
            if (!isEnd[p]) return false;
        }
        return true;
    }
    public String longestWord(String[] words) {
        Arrays.fill(isEnd, false);
        for (int i = 0; i <= idx; i++) Arrays.fill(tr[i], 0);
        idx = 0;

        String ans = "";
        for (String s : words) add(s);
        for (String s : words) {
            int n = s.length(), m = ans.length();
            if (n < m) continue;
            if (n == m && s.compareTo(ans) > 0) continue;
            if (query(s)) ans = s;
        }
        return ans;
    }
}
  • 时间复杂度:将所有 $words[i]$ 存入字典树的复杂度为 $O(\sum_{i = 0}^{n - 1}words[i].length)$;查询每个 $words[i]$ 是否合法的复杂度为 $O(m)$,其中 $m$ 为当前 $words[i]$ 长度。整体复杂度为 $O(\sum_{i = 0}^{n - 1}words[i].length)$
  • 空间复杂度:$O(C)$

最后

这是我们「刷穿 LeetCode」系列文章的第 No.720 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:https://github.com/SharingSou...

在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

更多更全更热门的「笔试/面试」相关资料可访问排版精美的 合集新基地

本文由mdnice多平台发布

你可能感兴趣的:(后端)