python输出汉字_Python入门编程题库26--统计汉字和标点符号

python输出汉字_Python入门编程题库26--统计汉字和标点符号_第1张图片

一、题目

python输出汉字_Python入门编程题库26--统计汉字和标点符号_第2张图片

《天龙八部》是著名作家金庸的代表作之一,历时4年创作完成。该作品气势磅礴,人物众多,非常经典。这里给出一个《天龙八部》的网络版本,文件名为“天龙八部-网络版.txt”。

问题1:请编写程序,对这个《天龙八部》文本中出现的汉字和标点符号进行统计,字符与出现次数之间用冒号:分隔,输出保存到“天龙八部-汉字统计.txt”文件中,该文件要求采用 CSV 格式存储,参考格式如下(注意,不统计空格和回车字符):

天:100, 龙:110, 八:109, 部:10 (略)

问题2:请编写程序,对《天龙八部》文本中出现的中文词语进行统计,采用 jieba 库分词,词语与出现次数之间用冒号:分隔,输出保存到“天龙八部-词语统计.txt”文件中。参考格式如下(注意,不统计任何标点符号):

天龙:100, 八部:10(略)

二、分析

  • 统计词语使用python中字典的特性,用key值统计词语名称,用value统计词语出现次数
  • 输出保存到文件中使用f = open(file,'w',encoding='utf-8'),f.write(s)
  • 中文分词一般用jieba库中的lcut(txt)

三、方案

【1】问题1

  • 代码:

python输出汉字_Python入门编程题库26--统计汉字和标点符号_第3张图片

【2】问题2

  • 代码:

python输出汉字_Python入门编程题库26--统计汉字和标点符号_第4张图片

四、上一题

《Python入门编程题库25--文本进度条样式》


五、调查问卷

你可能感兴趣的:(python输出汉字)