给定一个不含重复单词的列表,编写一个程序,返回给定单词列表中所有的连接词。
连接词的定义为:一个字符串完全是由至少两个给定数组中的单词组成的。
示例:
输入: ["cat","cats","catsdogcats","dog","dogcatsdog","hippopotamuses","rat","ratcatdogcat"] 输出: ["catsdogcats","dogcatsdog","ratcatdogcat"] 解释: "catsdogcats"由"cats", "dog" 和 "cats"组成; "dogcatsdog"由"dog", "cats"和"dog"组成; "ratcatdogcat"由"rat", "cat", "dog"和"cat"组成。
说明:
10000
。600000
。这道题目可以使用字典树/前缀树来快速解答 代码比较长 但是需要注意的逻辑部分只在checkIsConcatenatedWord()这个函数里 我加了详细的注释 其他代码扫一眼就可以 另外需要注意的是 使用Map来定义字典树的节点 更好的应对f,ff,fff,ffff...这种字典树退化成链表的极端情况
class Solution {
public List findAllConcatenatedWordsInADict(String[] words) {
Trie trie = new Trie();
List res = new ArrayList<>();
for (String s : words) {
trie.add(s);
}
for (String s : words) {
if (trie.checkIsConcatenatedWord(s, 0, 0)) {
res.add(s);
}
}
return res;
}
class Trie {
class Node {
private boolean isWord; //表示这个节点是否一个单词的结尾
private Map next;
public Node() {
this(false);
}
public Node(boolean isWord) {
this.isWord = isWord;
next = new TreeMap<>();
}
}
private Node root;
public Trie() {
root = new Node();
}
public void add(String word) {
Node cur = root;
for (int i = 0; i < word.length(); i++) {
char c = word.charAt(i);
if (cur.next.get(c) == null) {
cur.next.put(c, new Node());
}
cur = cur.next.get(c);
}
if (!cur.isWord) {
cur.isWord = true;
}
}
//index为开始检查的起始索引 count为isWord为true的次数 即在这条路径中有几个单词
public boolean checkIsConcatenatedWord(String word, int index, int count) {
Node cur = root;
for (int i = index; i < word.length(); i++) {
char c = word.charAt(i);
if(cur.next.get(c) == null) { //如果字典树中没有c这条路径 直接返回false
return false;
}
if (cur.next.get(c).isWord) {
if (i == word.length() - 1) {//如果已经到达word的尾部并且word这里是单词的结果 则看计数count是否大于1
return count >= 1;
}
if (checkIsConcatenatedWord(word, i + 1, count + 1)) { //如果没有到达尾部 则从index+1的位置继续检查 count计数器加1
return true;
}
}
cur = cur.next.get(c);
}
return false;
}
}
}