《科学背单词法》02 -- CET4数据分析

《科学背单词法》02

[上一篇]:英语四六级历年真题数据爬取2_1

[本文主要涉及知识点]:数据合并、数据清洗、分词、词频统计、读写txt、读写excel

一、今日主题:英语四六级历年真题数据分析2_2

(1)合并所有真题数据,如下:

1. 原始数据目录目录
2.代码实现
3.执行结果-->OK!

(2)对合并数据-->数据清洗

1.源数据
2.正则匹配数据清洗方案
3.数据清洗结果数据

(3)对数据清洗结果数据-->分词、词频统计-->词频表

1.代码实现
2.结果文件展示
3.词频结果展示
4.excel词频表

五、闲聊

[1].代码截止2019-03-09调试无误。

[2].下一篇将对照词频表-->查询单词释义。

让知识或技术实现其最大的价值,欢迎收藏自用、转载分享,转载请注明原文出处,谢谢!

你可能感兴趣的:(《科学背单词法》02 -- CET4数据分析)