820. 单词的压缩编码(Python)

难度:★★★☆☆
类型:字符串
方法:前缀树

力扣链接请移步本题传送门
更多力扣中等题的解决方案请移步力扣中等题目录

题目

给定一个单词列表,我们将这个列表编码成一个索引字符串 S 与一个索引列表 A。

例如,如果这个列表是 ["time", "me", "bell"],我们就可以将其表示为 S = "time#bell#" 和 indexes = [0, 2, 5]。

对于每一个索引,我们可以通过从字符串 S 中索引的位置开始读取字符串,直到 "#" 结束,来恢复我们之前的单词列表。

那么成功对给定单词列表进行编码的最小字符串长度是多少呢?

示例:

输入: words = ["time", "me", "bell"]
输出: 10
说明: S = "time#bell#" , indexes = [0, 2, 5] 。

提示:

1 <= words.length <= 2000
1 <= words[i].length <= 7
每个单词都是小写字母 。
通过次数46,661提交次数93,435

解答

个人认为,这是官网讲解最优质的解答之一。这里引一下。

先给一个按照题目的编码规则的定理:如果一个单词A是另一个单词B的后缀,那么这两个单词可以共用一个编码字段,该字段就是单词B。

根据这一定理,我们就可以寻找出所有可供合并编码的情况。对于列表中的任意单词,我们寻找在列表中是否存在该单词的后缀,如果存在,可以把这个后缀从列表中剔除。这样,在列表中留下的单词,是可以代表所有单词参与到编码过程中的。

最后我们把这些单词的长度进行统计即可, 这里要注意每个单词加入终止符“#”。

class Solution:
    def minimumLengthEncoding(self, words):
        good = set(words)
        for word in words:
            for k in range(1, len(word)):
                good.discard(word[k:])
        return sum(len(word) + 1 for word in good)

如有疑问或建议,欢迎评论区留言~

有关更多力扣中等题的python解决方案,请移步力扣中等题解析

你可能感兴趣的:(820. 单词的压缩编码(Python))