抖音作者首页批量视频-2020-6-18

前言

紧接上一期为大家介绍获取抖音某个作者首页的视频,并下载,更多精彩:先别忙订阅,先来群里看看,有惊喜哦。

join(“q_qun”,1071834648) or visit(“url”,“www.ltchao.top”)

本次解析是通过js算法+html源码截取最终进行解密的

提前演示

抖音作者首页批量视频-2020-6-18_第1张图片

原理

通过浏览器中访问首页地址,进行抓包,以抖音比较火的祝晓晗为例
她的首页地址是 祝晓晗
访问之后
抖音作者首页批量视频-2020-6-18_第2张图片
有一个接口里面返回了json数据,猜想就是前端页面上展示的列表,但是好像只有6个,很显然用了懒加载的技术,先来看看它获取这些数据需要哪些参数。
抖音作者首页批量视频-2020-6-18_第3张图片
sec_id 我们可以从首页短链接,302跳转那里获取到,aid目前还不知道什么意思,先掠过,这个签名肯定是前端js算法计算出来,dytk这个值,很眼熟,之前做的文章里面有这个参数的获取,就是在html中使用正则匹配到它。那现在我们就最先解决下这个签名计算的问题。

sec_id 获取

抖音作者首页批量视频-2020-6-18_第4张图片

dytk 获取

抖音作者首页批量视频-2020-6-18_第5张图片

aid

抖音作者首页批量视频-2020-6-18_第6张图片
目前看了几个是固定值,这里就不用通过js获取了。

签名计算

关于签名的计算这里要多花点时间了,首先我们要定位签名的位置。
首先我们搜索签名找到js文件抖音作者首页批量视频-2020-6-18_第7张图片
继续追踪
抖音作者首页批量视频-2020-6-18_第8张图片
继续追踪
抖音作者首页批量视频-2020-6-18_第9张图片
最终找到了
抖音作者首页批量视频-2020-6-18_第10张图片
以上截图是挨个 文件查找到最终的位置,
_bytedAcrawler = __M.require(“douyin_falcon:node_modules/byted-acrawler/dist/runtime”)
运行之后,我们把uid带入进去就可以获取签名了,但是这里只是我们眼睛看到了,但是具体怎么拿到这个呢.我们就在网页上打印下这个东西,
抖音作者首页批量视频-2020-6-18_第11张图片
这里就是加密算法了:
抖音作者首页批量视频-2020-6-18_第12张图片
有这算法还不够,还需要一个tac,这是最近新加的一个参数,之前是没有的,那么这个值我们从哪里获取呢?
答案是:源码里面
抖音作者首页批量视频-2020-6-18_第13张图片
这里的获取还是和之前一样,用截取字符串的方式,这里的tac的作用是如果tac固定,每次获取到的签名就是一样的,如果tac变化了就去重新计算一次签名。通过最终的整理,核心代码如下:
抖音作者首页批量视频-2020-6-18_第14张图片
这里其实就是上面拷贝出来的代码,还需要的是
抖音作者首页批量视频-2020-6-18_第15张图片
至于为什么都是一点点摸索出来的,没有什么理由。

max_cursor说明

抖音作者首页批量视频-2020-6-18_第16张图片
这个显然是时间戳,他是根据时间倒序来查询的,每重新加载一次,就会时间往前一周,一般官方推荐的是每天最多3个,再多了,容易被平台认为是垃圾视频或者恶意视频,因为3*7刚好等于21,我觉得这个21就是这么计算的来的,你每天超过三个的,可能显示出来的也就是3个吧,如果不想限定时间的话,就直接设置为0,把count值设置大,一样可以批量搜索。

最终演示

抖音作者首页批量视频-2020-6-18_第17张图片
格式化一下:
抖音作者首页批量视频-2020-6-18_第18张图片
我们随便找一个,输入浏览器,注意哦,调成收集模式打开哦
抖音作者首页批量视频-2020-6-18_第19张图片

你可能感兴趣的:(爬虫之视频解析)