主要思路
根据斗鱼后台协议发送数据。
主要步骤有:
(1)发送登录请求,用于完成登录授权;
(2)获取弹幕数据;
(3)保持登录状态;
(4)转码并将数据保存至Excel表中。
爬取的数据有:
用户ID、昵称、等级和弹幕内容。
更多:
将弹幕内容制作成词云。
开发工具
Python版本:3.5.4
相关模块:
requests模块、BeautifulSoup4模块、openpyxl模块、jieba模块、wordcloud模块以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
使用演示
在cmd窗口运行Get_DY_Barrage.py文件,根据提示输入房间号和所需的弹幕数量即可。
随便找个人多的直播间演示下咯~~~
如下图所示:
结果:
更多
关注转发文章后关注微信公众号:python工程狮,回复关键词“斗鱼”