《三国演义》是中国古典四大名著之一, 曹操是其中主要人物, 考生文件夹下文件data .txt 给出《三国演义》简介。
请编写程序, 用python 语言中文分词第三方库jieba 对文件data. txt 进行分词, 并将结果写入文件out. txt ,每行一个词, 例如:
内容简介
编辑
整个
故事
在
在考生文件夹下给出了程序框架文件PY301-1. py , 补充代码完成程序( 10 分)
import jieba
f = open('data.txt','r')
lines = f.readlines()
f.close()
f = open('out.txt','w')
for line in lines:
line = line.strip(' ') #删除每行首尾可能出现的空格
wordList = jieba.lcut(line) #用结巴分词,对每行内容进行分词
f.writelines('\n'.join(wordList)) #将分词结果存到文件out.txt中
f.close()
对文件out. txt 进行分析, 打印输出曹操出现次数。
在考生文件夹下给出了程序框架文件PY301 一2 .py, 补充代码完成程序( 10 分)
import jieba
f = open('out.txt','r') #以读的方式打开文件
words = f.readlines()
f.close()
D={}
for w in words: #词频统计
D[w[:-1]]=D.get(w[:-1],0) + 1
print("曹操出现次数为:{} ".format(D["曹操"]))