爬虫从实战入门(第一天),小白入门js逆向教程

知识梳理

  • 第一天
  • 分析
  • 扣代码部分
  • 运行效果图:

练习具体网址请私信博主,或者博客中有什么不明白的也可以私信博主

第一天

作者学习初衷:在面对ai时代,数据是基础,然而那么多的数据去哪找呢,这个时候就需要用到我们的爬虫,本博客的任何代码都是合法合规,不给源代码,会回答一些问题,读者怎么做,怎么用和本人没有任何关系,宗旨是传播知识

先从简单的网站开始:良好的开始是成功的一半,由于各种原因,没有办法写完整的东西,因此有需要请私信

分析

我们先来看看书上的描述打开网站的开发者工具后,发现网站的数据是通过ajax动态加载的,因此只用勾选这一块的xhr就行:如何确定是xhr断点呢?请自行查找或者后台私信博主
在这里插入图片描述

我们先来看看书上的描述然后我们来看接口数据(很明显该接口的返回数据是密文,那为什么在浏览器中用户看到的都是明文呢,那么解密的方法肯定在浏览器里面,那应该在哪呢,这会在js里面,到这里后我们现在要做的就是去跟踪js):
爬虫从实战入门(第一天),小白入门js逆向教程_第1张图片
我们现在就启动器里面看看(很明显是异步的,他的加载顺序是混乱的),这就不得不说我们常用的定位方法了,(hook,启动器,dom调试,xhr调试),因为他这个是在返回数据中加密,因此我们直接用hook会快很多。

到这我们分析部分就做完了

扣代码部分

我们可以看到密文是在这加载的:
在这里插入图片描述

执行完这个函数后它就变成了明文,因此解密的函数就是这个:_0x1683d3[‘a’][‘decipher’],我们只要解决他就行了 ,我们只要进入它,看他里面的函数是怎么写的就行
在这里插入图片描述

运行效果图:

图片中的1是密文,2是解密的位置,3是解密后的明文
爬虫从实战入门(第一天),小白入门js逆向教程_第2张图片

创作不易,给作者点个赞吧,球球了

你可能感兴趣的:(爬虫知识库,爬虫,javascript,开发语言,python)