爬虫(五)(XHR)动态内容

动态内容的爬取

方法一、分析请求头

页面加载完成后,滑动滚动条,会发送新的HttPRequest,页面内容扩展(用ajax写的)。调试面板 》网络 》XHR (类似于gua.js 的底层 API)查看

爬虫(五)(XHR)动态内容_第1张图片
图片.png

点击 XHR 后,点击里面的文件,边滚动边点击,就能够看到发送的请求和对应的响应,可以看到第二次滚动更新了 7 条消息。
通过对比两次请求头,分析页面和服务器的交互,就能够找到规律。然后写一个函数封装该规律发送请求就行。

你可能感兴趣的:(爬虫(五)(XHR)动态内容)