2021-09-22

                                JS逆向第一课————获取百度翻译的接口

话不多说,直入主题

本次所用到的浏览器为谷歌,用到的模块为execjsrequests

进入百度翻译打开开发者工具(或者按F12)并且切换成Ajax请求,准备开始抓包

2021-09-22_第1张图片

 不难发现返回的数据在这个请求里

现在开始分析

1.是个POST请求,那么一定会携带Form Data

2.查看From Data里的参数

2021-09-22_第2张图片

可以发现被加密的数据只有sign

分析完了之后,开始找对sign加密的js代码

2021-09-22_第3张图片

点开右上角的三个点选择Search

 2021-09-22_第4张图片

 发现找到很多js,点第一条进去一条查看

2021-09-22_第5张图片

JS代码格式化一下 

 在按ctrl+F搜索sign

发现找到13个sign 

一个一个排查(可以选择将可疑的sign都打上断点)

2021-09-22_第6张图片 

这里发现From Data所含的参数大部分都在这一块所以我们在这边下个断点 再点一下翻译

2021-09-22_第7张图片

发现停在了这里我们这时进入到 对sign加密的L(e)函数里,不难理解,这个函数return的参数就是

sign的参数,我们将这段JS代码复制下来,打开pycharm写进一个创建好的trans.js文件里

2021-09-22_第8张图片

 我们在另一个python文件中执行这段JS代码试试

2021-09-22_第9张图片

 这里报了一个错误说是i没有定义我们重新到L(e)这个函数里下个断点看看i是什么东西

2021-09-22_第10张图片

 可以发现i就是这串字符,我们将i加进去

2021-09-22_第11张图片

 再来运行一次试试

2021-09-22_第12张图片

还是不行,报了一个错误说是n这个函数没有定义,我们再去找找函数n在哪

2021-09-22_第13张图片

这不就巧了,正好在上面,我们复制进去试试 

2021-09-22_第14张图片

代码加载成功,sign参数就出来了,大功告成,结束

 附上源码:

import requests
import execjs


def get_headers():
    headers = {
        'Cookie': 'BIDUPSID=14796F7A7105E8F8C29035A8AA8E73F2;BAIDUID=98036CD4FD48105765D67894EFBC2BD7:FG=1',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0',
    }
    return headers


def get_sign(words):
    node = execjs.get()
    ctx = node.compile(open('trans.js', encoding='utf-8').read())
    funcname = "e('{}')".format(words)
    sign = ctx.eval(funcname)
    return sign


def Form_data(words):
    sign = get_sign(words)
    data = {
        "from": "en",
        "to": "zh",
        "query": words,
        "transtype": "realtime",
        "simple_means_flag": "3",
        "sign": sign,
        "token": "a46e051837506f7ec10f821b72fa4a77",
        "domain": "common"
    }
    return data


def main(words):
    url = 'https://fanyi.baidu.com/v2transapi?from=en&to=zh'
    proxies = {
        'http': 'http://5.16.0.174:8080'
    }
    headers = get_headers()
    data = Form_data(words)
    response = requests.post(url=url, data=data, proxies=proxies, headers=headers).json()
    print(response['trans_result']['data'][0]['dst'])


if __name__ == '__main__':
    main('cat')

 

你可能感兴趣的:(javascript,python)