爬取 bilibili 弹幕数据

介绍一下

这是我的第一个练手爬虫项目,不用Python,Excel就可以搞定奥!

1、打开想要抓取弹幕的视频网址

在这里我用到的网站是Firefox,本来用的是goole,但是在goole上一直找不到XML格式的文件。爬取 bilibili 弹幕数据_第1张图片

2、解析网站

F12或者右击选择“检查/查看元素”,召唤控制台
点击“网络/network” ⇨⇨⇨ 在“类型”那一列下找到xml双击 ⇨⇨⇨ 复制网址打开就是弹幕消息啦爬取 bilibili 弹幕数据_第2张图片

3、分析得到数据

哈哈哈哈哈哈哈

99.61200 弹幕出现的时间以秒为单位
1 弹幕类型(1-跑马灯,4-底部)
25 字体
16777215 颜色
1543892663 Unix时间戳,基准时间为 1970.01.01,日期=(Unix时间戳+83600)/86400+70365+闰天
0 弹幕池(0-普通池 1-字幕池 2-特殊池)
eb5d683e 用户ID
8782080176029696 唯一标识

4、数据导入Excel

下一步我是利用Excel 进行的数据导入
复制网址放入新建的Word中,文件格式选择.txt,命名为xxx.iqy
爬取 bilibili 弹幕数据_第3张图片
然后打开Excel–数据–获取外部数据–进行Web查询–选择刚才保存的文件,导入就可以了
爬取 bilibili 弹幕数据_第4张图片在这里插入图片描述
没用的数据可以删掉,红框的数据便是我们上边分析的数据,对其进行整理
之后自己按照上述数据代表分析数据,个性化取舍就好

你可能感兴趣的:(爬虫)