爬取B站弹幕可视化分析

这里以前段时间很火的一部动漫鬼灭之刃为例,剧场版截至目前已超350亿票房。

数据怎么来

要想做数据分析,首先要有数据来源,通过Python实现弹幕爬虫就能简单得到动漫视频数据。

动漫视频分为好多集,对每一集弹幕信息做爬取,需要我们知道每一集的ID信息。

如下图所示,这是第一集的视频ID。


image.png

没开会员的同学就只能看到一集的数据了。没关系,我已经爬取下来了。数据往下看。

由于篇幅原因,这里放部分爬虫代码。


image.png

运行完爬虫代码,即可得到一系列.csv文件。

不运行上面爬虫代码获取没关系,我已经替大家爬取下来了,大家可以直接用来做数据可视化。

这里主要用到csv(用来解析.csv文件),pyecharts(可视化输出),pandas(数据处理)模块包。

这里直接展示效果图。

柱图


image.png

饼图


image.png

折线图
image.png

云图


image.png

更多信息,请参考原文

你可能感兴趣的:(爬取B站弹幕可视化分析)