Python系列爬虫之实现特朗普的推特可视化分析

前言

今天为大家带来的是可视化分析一波特朗普的推特,让我们愉快地开始吧~

开发工具

Python版本:3.6.4
相关模块:

nltk模块;

pandas模块;

wordcloud模块;

cutecharts模块;

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

可视化分析

首先,我们要借助panda库读取我们下载到的特朗普推特数据,并做一些必要的数据预处理工作。具体而言,代码实现如下:

'''读取csv文件'''

接着,我们就可以借助cutecharts进行一些可爱的可视化分析啦。首先,让我们来看看特朗普每年都发了多少推特呗:

Python系列爬虫之实现特朗普的推特可视化分析_第1张图片

看来从17年特朗普上任以来,他越来越享受"推特治国"了。而且这货19年的时候怕是一天到晚都在发推特的节奏啊(感觉朋友圈的微商都做不到一年如一日地坚持每天发20多条朋友圈T_T)。

对了,上图的源代码如下,还是蛮简单的:

'''折线图'''

再来看看特朗普同志都是用哪些豪华的设备来发推特的呗(只显示用的最多的5个设备):

Python系列爬虫之实现特朗普的推特可视化分析_第2张图片

再贴一下他用过的所有发推特的设备吧:

Twitter for iPhone          15468

嚯,这货的设备还挺齐全。对了,上面的柱状图实现和折线图类似,只需要把折线图改成柱状图就行了:

chart = Bar(title)

接下来,我们再来看看特朗普同志比较喜欢在哪个时间段发推特吧:

Python系列爬虫之实现特朗普的推特可视化分析_第3张图片

真是个精力旺盛的总统。T_T

再来看看特朗普同志上任后每年在推特里提到上任总统奥巴马的次数呗:

Python系列爬虫之实现特朗普的推特可视化分析_第4张图片

竟然每年都差不多,我好像可以想象到特朗普发关于奥巴马的推特时的语气了。cutecharts画饼状图的代码实现如下:

def drawPie(title, data, savedir='results'):

再来简单证实一下我的猜测:

Python系列爬虫之实现特朗普的推特可视化分析_第5张图片

哦豁,看来是我误会特朗普同志了。T_T

再来看看特朗普同志在推特上提到最多的美国媒体呗:

Python系列爬虫之实现特朗普的推特可视化分析_第6张图片

让我们来看看荣登榜一的FOX是啥吧:

Python系列爬虫之实现特朗普的推特可视化分析_第7张图片

不多废话,我还想看看特朗普发推特时对媒体的评价态度。为了画的图比较好看,我们这里假设只要负面评价得分大于0.1的都算负面推特,然后正面评价得分大于0.2的都算正面推特:

Python系列爬虫之实现特朗普的推特可视化分析_第8张图片

这里评分是利用python的nltk库做的,不一定准。对了,画雷达图的代码实现如下:

'''雷达图'''

最后,给特朗普同志的所有推特画个词云吧:

Python系列爬虫之实现特朗普的推特可视化分析_第9张图片

看完篇文章喜欢的朋友点个赞支持一下,关注我每天分享Python数据爬虫案例,下篇文章将开始进入模拟登录系列之QQ空间模拟登录

All done~完整源代码详见个人简介或者私信获取相关文件。。

你可能感兴趣的:(Python系列爬虫之实现特朗普的推特可视化分析)