统计csv词频_基于给定词语列表统计词频

基于给定词语列表并统计词频,统计结果输出到csv中。有两种实现方法

方法一:常规的统计给定关键词的词频

思路:

第一步,整理好待查询query_words

第二步,新建一个csv文件,并且将query_words以列名写入csv中

第三步,对文本分词,得到词语列表wordlist

第四步,对每一个query_words中的词语计算其在wordlist中的个数

第五步,写入csv中。

import jieba

import csv

#待统计词频的文本数据

texts = ['北京上海广州深圳都是一线城市,而成都是西部中心城市。青岛位于山东,是山东的经济中心。',

'在上海,出租车司机都会问你,你是干哪行的,什么工作,多挣钱?',

'两个城市都是人口超大城市,但去年北京人口下降了2.2万人,有人分析可能和疏散低端产业有关。',

'分析产业结构,就能发现两个城市之间的差异。但一个地方的财政收入不仅包括一般公共预算收入,']

#统计这些词在texts中每条文本中的词频

query_words = ['工作', '发展', '经济', '工作', '消费', '收入', '存款', '人口']

#新建csv文件

csvf = open('词频统计.csv', 'w&

你可能感兴趣的:(统计csv词频)