JS逆向爬虫----响应结果加密①

示例----响应结果加密分析

在浏览器内打开主页链接https://jzsc.mohurd.gov.cn/data/company我们可以访问到以下页面
JS逆向爬虫----响应结果加密①_第1张图片
我们需要获取到图片中标红的数据。

定位需求数据

通常的思路是通过浏览器抓包和关键词搜索方式定位数据接口,我们来尝试一下:
JS逆向爬虫----响应结果加密①_第2张图片
通过f12刷新页面并搜索关键词 91610800064834709T,结果没找到包含关键词的数据。更换一下关键词为 榆林永邦建设工程有限公司JS逆向爬虫----响应结果加密①_第3张图片
依然没有定位到数据接口!
以上的情况,可能发生的原因:页面内的数据是通过js处理响应结果生成的 即接口的响应结果并不是简单的数据包含在json内而是通过反爬手段将响应结果加密了,并通过前端js处理后展现在网页内。
为了验证这个猜想,我们可以点击其他页,抓包xhr的请求的数据:
JS逆向爬虫----响应结果加密①_第4张图片
我们通过xhr抓包测试,发现点击不同页面,浏览器异步请求接口:https://jzsc.mohurd.gov.cn/APi/webApi/dataservice/query/comp/list?pg=3&pgsz=15&total=450,不同页面仅仅只是查询参数不一致而已。
查看响应
JS逆向爬虫----响应结果加密①_第5张图片
响应为很长的字符串:95780ba0943730051dccb5fe3918f9fe1b6f2130681f99d5620c5497aa480f13…
点击不同页面唯一的xhr请求只有这个,大概可以确定我们需要的数据是通过解密这个响应的字符串获得。

js定位响应结果处理

再次f12刷新页面抓包,搜索关键词:json.parse
JS逆向爬虫----响应结果加密①_第6张图片
定位到3个js文件,我们依次进入js文件,再次搜索关键词json.parse,在包含关键词的位置打上断点,点击下一页,查看是否在断点处停顿,同时伴有关键信息展示出来。

app.248文件断点调试

JS逆向爬虫----响应结果加密①_第7张图片
我们进入来源面板,搜索关键字json.parse,并在有关键字的位置打断点。



断点位置如下:
JS逆向爬虫----响应结果加密①_第8张图片
点击下一页,查看是否有关键信息:
JS逆向爬虫----响应结果加密①_第9张图片
查看到t.data就是接口响应的数据,h(t.data)好像就是解析之后的json,包含需要的数据。

h函数应该就是将加密数据解析为可用json的方法,只要把h函数还原,我们就能获取到信息。

h函数还原

点击h函数,进入h函数定义位置:
JS逆向爬虫----响应结果加密①_第10张图片
h函数的内容如下:


 f = d.a.enc.Utf8.parse("jo8j9wGw%6HbxfFn")
          , m = d.a.enc.Utf8.parse("0123456789ABCDEF");
function h(t) {
            var e = d.a.enc.Hex.parse(t)
              , n = d.a.enc.Base64.stringify(e)
              , a = d.a.AES.decrypt(n, f, {
                iv: m,
                mode: d.a.mode.CBC,
                padding: d.a.pad.Pkcs7
            })
              , r = a.toString(d.a.enc.Utf8);
            return r.toString()
        }

这里有关键词AES,mode: d.a.mode.CBC,padding: d.a.pad.Pkcs7
根据AES加密算法的加密过程,我们知道aes需要密钥key,初始向量,以及加密模式和填充模式。通过观察代码,我们猜测加密的密钥为jo8j9wGw%6HbxfFn,初始向量为0123456789ABCDEF,加密模式为cbc,填充方式为pkcs7。我们可以通过在线aes解密网站验证猜想:

通过测试字符串,同时加入指定的密钥jo8j9wGw%6HbxfFn填充0123456789ABCDEF ,解密后发现为我们需要的包含数据的json
这个h函数,我们可用使用nodejs还原。

nodejs实现解密函数

js代码测试

// 解密方法 nodejs版
const crypto = require('crypto');

const key = Buffer.from("jo8j9wGw%6HbxfFn", 'utf-8');
const iv = Buffer.from("0123456789ABCDEF", 'utf-8');

function decrypt(t) {
    const hex = Buffer.from(t, 'hex');
    const base64 = hex.toString('base64');

    const decipher = crypto.createDecipheriv('aes-128-cbc', key, iv);
    decipher.setAutoPadding(true);

    let decryptedData = decipher.update(base64, 'base64', 'utf-8');
    decryptedData += decipher.final('utf-8');

    return decryptedData;
}

// 使用示例
const encryptedText = "";
const decryptedText = decrypt(encryptedText);
console.log("解密后的文本:", decryptedText);

js测试结果


JS逆向爬虫----响应结果加密①_第11张图片
以上代码我们只需要将响应结果赋值给decryptedText,即可解密成功。

你可能感兴趣的:(python爬虫综合,javascript,爬虫,开发语言)