python用字典统计单词出现次数_如何使用字典理解来计算文档中每个单词的出现次数...

就像其他答案中解释的一样,问题是字典理解会创建一个新字典,所以在新字典创建之前,您不会获得对它的引用。你不能对你正在做的事进行字典理解。在

鉴于此,您所做的就是重新实现^{}已经完成的工作。您只需使用Counter。示例-from collections import Counter

term_appearance = Counter()

for x in texts_list:

term_appearance.update(x)

演示-

^{pr2}$

如果你真的想在某种程度上理解这一点,你可以:from collections import Counter

term_appearance = Counter()

[term_appearance.update(x) for x in texts_list]

演示->>> l = [[1,2,3],[2,3,1],[5,4,2],[1,1,3]]

>>> from collections import Counter

>>> term_appearance = Counter()

>>> [term_appearance.update(x) for x in l]

[None, None, None, None]

>>> term_appearance

Counter({1: 4, 2: 3, 3: 3, 4: 1, 5: 1})

输出[None, None, None, None]来自生成该列表的列表理解(因为这是以交互方式运行的),如果在脚本中以python

您还可以使用^{}从文本列表创建一个扁平化列表,然后将其用于计数器。示例:from collections import Counter

from itertools import chain

term_appearance = Counter(chain.from_iterable(texts_list))

演示->>> from collections import Counter

>>> from itertools import chain

>>> term_appearance = Counter(chain.from_iterable(l))

>>> term_appearance

Counter({1: 4, 2: 3, 3: 3, 4: 1, 5: 1})

另外,你的原始代码中的另一个问题-{{term_appearance[l] : term_appearance[l] + 1 if l else term_appearance[l] : 1 for l in x} for x in texts_list}

这实际上是一个集合理解,其中嵌套了一个字典理解。在

这就是您得到错误-TypeError: unhashable type: 'dict'的原因。因为在第一次运行字典理解并创建一个dict之后,它正试图将其添加到set中。但是字典是不可散列的,因此出现了错误。在

你可能感兴趣的:(python用字典统计单词出现次数_如何使用字典理解来计算文档中每个单词的出现次数...)