Python爬虫入门教程 71-100 续上篇,python爬虫爬取B站视频

写在前面

上篇博客我们用比较大的篇幅分析了B站视频传输方式,这篇博客填一下之前留下的坑,我们把代码部分写出来。

文章来源:梦想橡皮擦,其实这个ID是一个组合

分析的步骤与逻辑这里不再重复给大家演示了,可以翻看 https://blog.csdn.net/hihell/article/details/106546531 这篇文章,里面有清晰的说明。

先记住

30280.m4s,对应音频文件
30064.m4s,对应视频文件

编码时间

B站视频虽然已经分析完毕,但是实际编码还是有难度的,所以坚持住,我们一起搞定它。

全篇文章使用的链接为:https://www.bilibili.com/video/BV1Pv41167FE ,BV链接,B站升级之后从AV连接提升到BV,反爬技术成倍的叠加。

通过Fiddler抓取,分析之后,我们得到了这样的一些结论,重点如下图所示,页面返回状态码为206,这个需要关注下

Python爬虫入门教程 71-100 续上篇,python爬虫爬取B站视频_第1张图片
上面的图片,可能你看的比较晕,还是不要急,点击一个链接,我们需要看一下它是如何请求与返回数据的。分析之后,你会发现一个奇怪的现象,在链接相同的情况下,请求返回一个状态码是200,另一个是206。

你可能感兴趣的:(爬虫100例教程)