Leetcode中遇到的一些问题(1)

题号:500, 键盘行

给定一个单词列表,只返回可以使用在键盘同一行的字母打印出来的单词。键盘如下图所示。键盘分布图如下:


image.png

这是一个比较容易但稍微有点麻烦的问题。

class Solution:
    def findWords(self, words: List[str]) -> List[str]:
        keyboardtab = ["qwertyuiop", "asdfghjkl", "zxcvbnm"]
        kbdict = {}
        res = words
        for k, v in enumerate(keyboardtab):
            for i in v:
                kbdict[i] = k
        for word in words:
            for s in word[1:]:
                if kbdict[s.lower()] != kbdict[word[0].lower()]:
                    res.remove(word)
                    break
        return res

测试用例中,运行得还可以,但提交后遇到一个案例输出有误。

>>> findWords(["abdfs", "ccdd","a", "qwwewm"])
['ccdd', 'a']

很显然,正确答案不应该包括"ccdd"上。代码的整体逻辑问题不大,可能是循环过程中出现的一些问题。添加print的语句,查看words和word的变化。

    def findWords(self, words: List[str]) -> List[str]:
        keyboardtab = ["qwertyuiop", "asdfghjkl", "zxcvbnm"]
        kbdict = {}
        res = words
        for k, v in enumerate(keyboardtab):
            for i in v:
                kbdict[i] = k
        for word in words:
            print(words, word)
            for s in word[1:]:
                if kbdict[s.lower()] != kbdict[word[0].lower()]:
                    res.remove(word)
                    break
        return res

运行样例后结果如下:

>>> findWords(["abdfs", "ccdd","a", "qwwewm"])
['abdfs', 'ccdd', 'a', 'qwwewm'] abdfs
['ccdd', 'a', 'qwwewm'] a
['ccdd', 'a', 'qwwewm'] qwwewm
['ccdd', 'a']

问题很明显了,我们的res、words引用了同一个列表,当调用res.remove(word)时,words也被修改掉了。因此造成外层循环的错误,最终导致结果出错。解决问题的方法也很简单,res=words修改成res=words.copy()即可,把for语句中的words改成words[:]更Pythonic一些。在循环过程中不要对正在循环的对象做修改,在很多入门教程中都提到过很多次,但不经意间总还是会犯这种错误,引以为鉴吧!


那么,当在for循环中修改正在迭代的对象,实际上又发生了些什么呢?
从上面的错误案例中,看到的似乎循环中记住了某个固定的索引,然后根据这个索引返回变化中的列表中对应的元素。但实际上是这样么?借助Python官方文档,尝试寻找一下答案。

for语句做了些什么?

引用自官方文档
for 语句用于对序列(例如字符串、元组或列表)或其他可迭代对象中的元素进行迭代:

for-stmt :: = for 目标列表 in 表达式列表: 执行子句 else:执行子句

  1. 表达式列表调用__iter__()函数,生成一个迭代器对象(iterator);
  2. 为迭代器的每一项执行一次子句,具体次序与迭代器的次序相同(迭代器通过调用__next__()来获取下一项),每一项按照标准赋值语句给目标列表。
  3. 当所有项耗尽时(表达式列表为空或者迭代器引发 StopIteration),执行else 的子句,并退出循环。
    因此当在循环中修改表达式列表时,每次循环都会根据新列表生成新的迭代器对象,即便不看官方文档,这和我们的印象也是符合的。但不断变化的迭代器是如何保留一个类似索引的变量来从新列表中进行赋值操作的又是一个问题。
    好在文档中连这个问题也考虑到了

序列在循环过程中会有一个内部计数器来追踪下一个要使用的项,每一次迭代都会使这个项增递增,当计数器的值达到列表的长度时循环即停止。这意味着如果在子句中删除了序列当前或之前的一项,其后一项再下次循环中将会被跳过。

这将会带来相当多的困扰,文档也贴心的介绍了使用索引 [:] 创建副本作为表达式列表的方法。
之前关注的只是循环中序列取值时受到的影像,实际上在循环中修改序列对迭代次数的影像也挺值得关注,以下就是一个例子。

>>> l = list(range(10))
>>> for i in l:
        print(l, i)
        l.pop(i)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 0
[1, 2, 3, 4, 5, 6, 7, 8, 9] 2
[2, 3, 4, 5, 6, 7, 8, 9] 4
[3, 4, 5, 6, 7, 8, 9] 6
[4, 5, 6, 7, 8, 9] 8

每次循环len(l) - 1,内部计数器 + 1,因此当进行到第5次的时候,len(l) == 内部计数器,循环结束。刚好输出了所有偶数项。

你可能感兴趣的:(Leetcode中遇到的一些问题(1))