题目描述:
给定字符串 S
和单词字典 words
, 求 words[i]
中是 S
的子序列的单词个数。
示例:
输入:
S = "abcde"
words = ["a", "bb", "acd", "ace"]
输出: 3
解释: 有三个是 S 的子序列的单词: "a", "acd", "ace"。
注意:
words
和 S
里的单词都只由小写字母组成。S
的长度在 [1, 50000]
。words
的长度在 [1, 5000]
。words[i]
的长度在[1, 50]
。思路:1
暴力破解:
主循环为words,子循环为S,用S中的每个字母和words中每个word的字母匹配,如果在某个位值相等,则各自跳到一下个位置。如果不相等,则只有S中的字母跳到下一个位置继续匹配。直到遍历完words中单个word,则计数器+1
class Solution:
def numMatchingSubseq(self,words,S):
i,j = 0,0
count = 0
for w in words:
while(i < len(w) and j < len (S)):
if S[j] == w[i]:
i+=1
j+=1
else:
j+=1
if i == len(w):
count+=1
return count
思路:2
我们在观察words时,可以定义一个等待list,比如,words中“a”,“acd”,“ace”都是a开头,“bb”是b开头。当遍历S时,以a开头的word会匹配S中的字母a,然后S往后移动,在第二个字母b时,以b开头的“bb”会匹配它的首字母b。然后在每个word中去掉这些匹配的字母,并储存起来。当word完全去掉时(比如“a”在第一次匹配时就完全匹配),则将每个word放入到一个list里存储起来,最后计算这个list的长度即可。
详细步骤:
初始时:
S = "abcde"
words = ["a", "bb", "acd", "ace"]
words中每个word第一个首字母:“a”,“acd”,“ace”都为a,“bb”为b,需要S中有a和b来匹配
'a': ["(a)", "(a)cd", "(a)ce"]
'b': ["(b)b"]
继续遍历S,S中首字母为a,可以匹配“a”,“acd”,“ace”中的首字母,并将a储存起来等待下一个需要匹配的字母,同样b
'b': ["(b)b"]
'c': ["a(c)d", "a(c)e"]
None: ["a"]
因为“a”已经匹配完成,而“acd”和“ace”则是需要一个c,“bb”需要一个b
'b': ["b(b)"]
'c': ["a(c)d", "a(c)e"]
None: ["a"]
然后在S中同样能匹配到c字母
'b': ["b(b)"]
'd': ["ac(d)"]
'e': ["ac(e)"]
None: ["a"]
同理,d字母:
'b': ["b(b)"]
'e': ["ac(e)"]
None: ["a", "acd"]
同理,e字母:
'b': ["b(b)"]
None: ["a", "acd", "ace"]
最后只需返回None这个list的长度即可
代码:
class Solution:
def numMatchingSubseq(self, S, words):
"""
:type S: str
:type words: List[str]
:rtype: int
例子:
S = "abcde"
words = ["a", "bb", "acd", "ace"]
"""
waiting = collections.defaultdict(list)
for w in words:
waiting[w[0]].append(iter(w[1:]))
for c in S:
for it in waiting.pop(c, ()):
waiting[next(it, None)].append(it)
return len(waiting[None])