记录一下抖音直播弹幕的获取过程
抖音弹幕现在采用 websocket 进行实时传输,一次建立握手连接,可持续实时通信,特别适合直播场景的数据传输
打开浏览器开发者模式,发现除了视频流媒体一直在进行数据传输外,还有早就建立连接的 websocket 在一直传输二进制数据,浏览器和服务器一来一回,但是你除了刷新的时候能发现建立的 wss 连接,之后是捕捉不到的。
我只关心服务器发送过来的数据,这里面应该就是弹幕的内容,点击其中一条打开看看,里面包含 gzip 格式的压缩包,估计我要的东西就在压缩包里面。
gzip 的Magic Number 是 1f 8b xx xx,从这里开始截取后面的所有内容
这个开头是一个 WebcastMemberMessage, 应该是表示谁谁来了
果然啊,“随缘" 大哥来了,通过分析更多的数据包,我发现:
WebcastMemberMessage 表示 有人来了
WebcastChatMessage 表示留言消息
WebcastSocialMessage 表示有人关注了主播
…
这样接下来的工作就简单多了,如果需要更多信息请私信我