上海市政府工作报告词云图

话说手里有个锤子,看什么都像钉子。上午一边听着政府工作报告,一边看着手里好像有好几把小锤子,就在想,除了一堆给力的数据,怎么用数据分析的方式从不同角度看报告。

晚上回家,开工:

先找到官方全文:https://baijiahao.baidu.com/s?id=1623778868224158198&wfr=spider&for=pc

第一把锤子:emeditor,全文复制粘贴:

Ctrl+H 调出替换窗口,用\n替换[^\x{4e00}-\x{9fa5}],分句,这里用到一把万能螺丝刀-正则表达式:

再用\n替换掉\n\n,多点几遍替换全部,去掉空行:

保存到桌面,命名“gzbg.txt”

第二把锤子,python:

屏幕一闪,结果出来了:


第三把锤子,Excel,copy过去,排序整理,取前50高频词

最后上第四把锤子,echarts的词云工具wordcloud.js:

高频词串成不重词一句话,就是:加快推进发展综合服务建设,全面加强实施城市管理改革

闲着的锤子,还可以试试中央政府和各省市区的政府工作报告,高频词关联分析下,看看哪家与总报告的关联度最高。

你可能感兴趣的:(上海市政府工作报告词云图)