词频统计

1) 自己的基本信息:

学号:2017*****1022;
姓名:石翟夫
码云仓库地址:
2) 程序分析,对程序中的四个函数做简要说明。要求附上每一段代码及对应的说明。

第一段:打开并读取文件到缓冲区

词频统计_第1张图片

第二段处理缓存区代码统计词频放在字典
词频统计_第2张图片

第三段:设置输出前十个

词频统计_第3张图片

第四段:运行函数

词频统计_第4张图片

3) 性能分析结果及改进。

程序运行命令、运行结果截图

用命令python -m cProfile 111.py Gone_with_the_wind.txt运行:

词频统计_第5张图片

分析:Gone_with_the_wind.txt文件大小是2.25 M

总共有443447次函数调用,程序总共耗时0.266秒

指出执行次数最多的代码

词频统计_第6张图片

执行时间最长的代码

词频统计_第7张图片

给出改进优化的方法以及你的改进代码

词频统计_第8张图片

4)改进后的程序运行命令及结果截图 。

运行命令python 111.py Gone_with_the_wind.txt

改进后:
词频统计_第9张图片

运行速度提升明显。

5) 给出你对此次任务的总结与反思。

我觉得我要更加多多努力,这次任务代码量很大,可惜我不怎么会python,所以我认为难度挺大的。查找了许多资料,最后才做了出来,虽然不怎么完美,但是我已经尽力了!争取往后的作业越做越好!加油!

你可能感兴趣的:(词频统计)